লিনাক্সে পাঠ্য ফাইলগুলি সংকুচিত করার জন্য কোন সংরক্ষণাগার পদ্ধতিটি ভাল?


17

আমার অ্যাপ্লিকেশনটিতে আমার লগগুলি টেক্সট ফাইলগুলির সংকোচনের প্রয়োজন।

দেখে মনে হচ্ছে bzip2এবং gzipএকই সংকোচনের অনুপাত আছে।

এটা কি ঠিক?


এক্সজেড (এক্স জেড-টুলস থেকে বা পি 7 জিপ থেকে 7 জেড, এটি লজমার মতোই) সেরা। gzip এর চেয়ে bzip2 ভাল।
osgx

উত্তর:


5

সাধারণত, bz2 এর উন্নততর পুনরুদ্ধারযোগ্য বৈশিষ্ট্যগুলির সাথে একত্রে আরও ভাল সংকোচনের অনুপাত রয়েছে।

OTOH, gz দ্রুততর faster

xz কে bz2 এর চেয়েও ভাল বলে মনে করা হয়, তবে আমি সময়কালীন আচরণটি জানি না।


xz bzip2 এর চেয়ে ধীর।
osgx

এক্সজেড কেবল ধীর নয়, তবে অনেক ধীর গতিতে, 300 এমবি ফাইলটি bzip2 কে সংকোচন করতে 30 সেকেন্ড সময় নিয়েছিল। 5 মিনিটেরও বেশি সময় ধরে কমপ্রেস করার পরে আমি এক্সজেডকে মেরেছিলাম
টেবে

@ Копать_Шо_я_нашел আমি মনে করি এটি আপনার চয়ন করা সংক্ষেপণের স্তরের উপর নির্ভর করে depends সহ -1, এটি খুব ধীর নয়, তবে ডিফল্ট সেটিংসের সাথে এটি বেশ ধীর হয়ে যায়।
glglgl

7

সর্বাধিক সংক্ষেপণ.কমের সর্বশেষ আপডেটটি জুন -2011 (উত্তর-অক্টোবর -2015আপডেট হয়েছে)
অতএব এই ওয়েবসাইটটি বিশ্বব্যাপী
বর্তমান চ্যাম্পিয়ন পাঠ্য সংক্ষেপকটির উল্লেখ করে না :

      cmix

কম্পিটিসনস / benchmarks:

বিশদ:
বায়রন নোল ম্যাট মাহুনি দ্বারা ব্যাখ্যা করা ডেটা কম্প্রেশনcmix বইয়ের উপর ভিত্তি করে 2013 সাল থেকে সক্রিয়ভাবে লিব্রে সফ্টওয়্যার (জিপিএল) হিসাবে বিকাশ করছে । ম্যাট মাহুনি উপরের কয়েকটি মানদণ্ডও বজায় রাখেন এবং কমান্ড লাইন ইনক্রিমেন্টাল আর্কিভার জেডপিএকিউ ( ডাব্লুপি ) প্রস্তাব করেন ।


আপনি যদি আরও মানক সরঞ্জাম পছন্দ করেন (কম র‌্যামের প্রয়োজন হয়) তবে আমি প্রস্তাব দিই:

      lrzip

lrzipএকজন বিবর্তন rzipদ্বারা কন Kolivas
lrzipদুটি নামের জন্য দাঁড়িয়েছে: লং রেঞ্জের জিপ এবং লজমা আরজেডআইপি । (আরও একটি জনপ্রিয় সংক্ষেপণ সরঞ্জাম) এর
lrzipচেয়ে প্রায়শই ভাল xz
আলেকজান্ডার রিসিও সুপারিশ করেন lrzip


আমার প্রিয়:

      zpaq

"আর্কাইভার বিশেষজ্ঞ" , ম্যাট Mahoney , নিবিড়ভাবে কাজ করেছে PAQ দশ বছর ধরে আলগোরিদিম ও CPU- র / মেমরি সম্পদ ও কম্প্রেশন স্তর মধ্যে সেরা আপস প্রদান।

তবে সর্বশেষ zpaqসংস্করণটি প্রায়শই সাম্প্রতিক ডিস্ট্রোতে প্যাকেজড / উপলভ্য নয় :-(
আমার কাছে নতুন মেশিন থাকাকালীন আমি সর্বদা এটি উত্স থেকে সংকলন করি এবং আমার খুব ভাল সংক্ষেপক প্রয়োজন: https://github.com/zpaq/zpaq

clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq


1

নিম্নলিখিতগুলি সঙ্কুচিত করার জন্য আমি একটি মানদণ্ড তৈরি করেছি:
204 এমবি ফোল্ডার (1,600 এইচটিএমএল ফাইল সহ)
ফলাফল

7zip =>     2.38 MB
winrar =>   49.5 MB
zip =>      50.8 MB
gzip =>     51.9 MB

সুতরাং 7 জীপ তাদের মধ্যে সেরা এটি আপনি এখান থেকে পেতে পারেন
http://www.7-zip.org/


0

bz2 এর আরও শক্ত সংক্ষেপ রয়েছে, অ্যালগরিদমকে সঙ্কুচিত করার জন্য রিডানডেন্সি দেখার জন্য আরও বিকল্প রয়েছে।

জিজিপ অনেক বেশি সরঞ্জামে রয়েছে এবং এটি ক্রস প্ল্যাটফর্ম। আরও উইন্ডোজ সরঞ্জামগুলি .gz ফাইলগুলির সাথে ডিল করতে পারে। এটি HTTP- র অংশ, সুতরাং এমনকি ওয়েব ব্রাউজারগুলিও এটি বুঝতে পারে।

লিনাক্সে, এমন সরঞ্জাম রয়েছে যা আপনাকে সংকুচিত ফাইলগুলিতে সরাসরি কাজ করতে দেয়। zgrep এবং bzgrep সংক্ষিপ্ত ফাইলগুলিতে অনুসন্ধান করতে পারে।

যদি কেবল লিনাক্সে থাকে তবে আমি সামান্য উন্নত সংক্ষেপণের অনুপাতের জন্য bzip2 ব্যবহার করব।


0

xz bz2 এর চেয়ে অনেক ভাল সংকোচন করে তবে বেশি সময় নেয়। সুতরাং, যদি সর্বাধিক সংকোচনতা আপনার লক্ষ্য এবং আপনার হার্ড ড্রাইভের স্থানটি একটি প্রিমিয়ামে থাকে (যা আমার ড্রাইভের সাথে 98% পূর্ণ - আমার ফাইল সিস্টেমগুলি পুনর্গঠিত করার সময়), এবং আপনি কাজটি করার জন্য কোনও স্ক্রিপ্ট বন্ধ করতে পারেন you - বিরতি নিন এবং 5 মিনিটে ফিরে আসুন।

আনএক্সজেড আমার অভিজ্ঞতাকে সঙ্কুচিত করতে খুব দ্রুত - যা আমার জন্য প্রতিদিনের জন্য ভাল জিনিস।

বিজে 2 এক্সজেডের চেয়ে কমপ্রেস করার জন্য দ্রুত, তবে xz এর সংকোচনের ফলাফল অর্জন করতে উপস্থিত হয় না।

এই মূল্যায়নগুলি করার একমাত্র উপায় হ'ল সাধারণ ফাইলগুলির সংমিশ্রণের বিরুদ্ধে বেঞ্চমার্ক চালানো যা আপনি সাধারণত সংকুচিত / সংক্ষেপণ করতে পারেন এবং কোনটি শীর্ষে আসে তা দেখার জন্য পরামিতিগুলি পৃথক করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.