জিলিবিতে ব্যবহৃত সংক্ষেপণ অ্যালগরিদম মূলত জিজিপ এবং জিপ হিসাবে একই । কি কি gzip, এবং জিপ ? তারা কীভাবে আলাদা এবং কীভাবে তারা একই রকম?
জিলিবিতে ব্যবহৃত সংক্ষেপণ অ্যালগরিদম মূলত জিজিপ এবং জিপ হিসাবে একই । কি কি gzip, এবং জিপ ? তারা কীভাবে আলাদা এবং কীভাবে তারা একই রকম?
উত্তর:
সংক্ষিপ্ত রূপ:
.zip
সাধারণত একটি ডিফল্ট সংক্ষেপণ পদ্ধতি ব্যবহার করে একটি সংরক্ষণাগার বিন্যাস । .gz
Gzip, বিন্যাস এছাড়াও চুপসে কম্প্রেশন পদ্ধতি ব্যবহার করে, একক ফাইলের জন্য হয়। প্রায়শই gzip, সঙ্গে একযোগে ব্যবহার করা হয় একটি সংকুচিত সংরক্ষণের ফর্ম্যাট করতে আলকাতরা , .tar.gz
। Zlib গ্রন্থাগার ZIP, GZIP, দ্বারা ব্যবহারের জন্য চুপসে কম্প্রেশন এবং decompression কোড প্রদান করে PNG (যা ব্যবহার zlib মোড়কের চুপসে ডেটার উপর), এবং অনেক অন্যান্য অ্যাপ্লিকেশন।
দীর্ঘ ফর্ম:
জিপ ফরম্যাটে একটি খোলা স্পেসিফিকেশন, যেখানে তার প্রয়োগ, PKZIP, শেয়ারওয়্যার ছিল একটি উম্মুক্ত বিন্যাসে যেমন ফিল কাট্স দ্বারা উন্নত ছিল। এটি একটি সংরক্ষণাগার বিন্যাস যা ফাইল এবং তাদের ডিরেক্টরি কাঠামো সংরক্ষণ করে, যেখানে প্রতিটি ফাইল পৃথকভাবে সংকুচিত থাকে। ফাইল টাইপ হয় .zip
। ফাইলগুলি, পাশাপাশি ডিরেক্টরি কাঠামোটিও optionচ্ছিকভাবে এনক্রিপ্ট করা যায়।
জিপ ফর্ম্যাটটি কয়েকটি সংক্ষেপণ পদ্ধতি সমর্থন করে:
0 - The file is stored (no compression)
1 - The file is Shrunk
2 - The file is Reduced with compression factor 1
3 - The file is Reduced with compression factor 2
4 - The file is Reduced with compression factor 3
5 - The file is Reduced with compression factor 4
6 - The file is Imploded
7 - Reserved for Tokenizing compression algorithm
8 - The file is Deflated
9 - Enhanced Deflating using Deflate64(tm)
10 - PKWARE Data Compression Library Imploding (old IBM TERSE)
11 - Reserved by PKWARE
12 - File is compressed using BZIP2 algorithm
13 - Reserved by PKWARE
14 - LZMA (EFS)
15 - Reserved by PKWARE
16 - Reserved by PKWARE
17 - Reserved by PKWARE
18 - File is compressed using IBM TERSE (new)
19 - IBM LZ77 z Architecture (PFS)
97 - WavPack compressed data
98 - PPMd version I, Rev 1
1 থেকে 7 টি পদ্ধতি historicalতিহাসিক এবং এটি ব্যবহারে নেই। পদ্ধতি 9 থেকে 98 পর্যন্ত অপেক্ষাকৃত সাম্প্রতিক সংযোজন এবং স্বল্প পরিমাণে ব্যবহারের ক্ষেত্রে এটি বিভিন্ন। জিপ ফর্ম্যাটে সত্যিকারের বিস্তৃত ব্যবহারের একমাত্র পদ্ধতি হ'ল পদ্ধতি 8, ডিফ্লেট এবং কিছুটা ছোট পরিমানের পদ্ধতি 0, যা মোটেই কোনও সংকোচনের নয়। কার্যত প্রতিটি .zip
ফাইল যা আপনি বন্যের মধ্যে পাবেন কেবলমাত্র 8 এবং 0 পদ্ধতি ব্যবহার করবেন সম্ভবত সম্ভাব্য মাত্র 8 পদ্ধতি (পদ্ধতি 8 এর কোনও কার্যকরভাবে কোনও সংক্ষেপণ এবং তুলনামূলকভাবে সামান্য বিস্তৃতি ছাড়াই ডেটা সংরক্ষণ করার উপায় রয়েছে এবং পদ্ধতি 0 স্ট্রিম করা যায় না যদিও পদ্ধতি 8 হতে পারে)
আইএসও / আইইসি 21320-1: ফাইল পাত্রে জন্য 2015 মান একটি সীমাবদ্ধ জিপ ফরম্যাট, যেমন জাভা ব্যবহৃত আর্কাইভ ফাইল (জার) হিসাবে, অফিস ওপেন এক্সএমএল ফাইল (Microsoft Office- এর .docx, .xlsx, .pptx), অফিস ডকুমেন্ট ফর্ম্যাট ফাইল (.odt, .ods, .odp), এবং EPUB ফাইল (.epub)। এই স্ট্যান্ডার্ডটি সংকোচনের পদ্ধতিগুলি 0 এবং 8 এর মধ্যে সীমাবদ্ধ করে সেইসাথে অন্যান্য সীমাবদ্ধতা যেমন কোনও এনক্রিপশন বা স্বাক্ষর নেই।
১৯৯০ সালের দিকে, তথ্য-জিপ গোষ্ঠীটি পোর্টেবল, ফ্রি, ওপেন সোর্স বাস্তবায়ন zip
এবং unzip
ইউটিলিটিগুলি লিখেছিল , ডিফল্ট ফর্ম্যাটটির সাথে সংকোচনকে সমর্থন করে এবং এটি এবং পূর্ববর্তী ফর্ম্যাটগুলির সংক্ষেপণ। এটি .zip
ফর্ম্যাটটির ব্যবহারকে প্রসারিত করে ।
নব্বইয়ের দশকের গোড়ার দিকে, জিজিপ ফর্ম্যাটটি ইউনিক্স compress
ইউটিলিটির প্রতিস্থাপন হিসাবে তৈরি করা হয়েছিল, তথ্য-জিপ ইউটিলিটির ডিফল্ট কোড থেকে প্রাপ্ত। ইউনিক্স compress
কোনও একক ফাইল বা স্ট্রিমকে সংকুচিত করার জন্য ডিজাইন করা হয়েছিল, .Z
ফাইলটির নামের সাথে সংযোজন করে । এলজেডব্লিউ সংক্ষেপণ অ্যালগরিদমcompress
ব্যবহার করে , যা সেই সময় পেটেন্টের অধীনে ছিল এবং পেটেন্ট ধারকগণের দ্বারা এটির বিনামূল্যে ব্যবহার বিতর্কিত ছিল। ফিল কাট্জের দ্বারা Deflate- র কিছু নির্দিষ্ট প্রয়োগগুলি পেটেন্ট করা হলেও ফর্ম্যাটটি ছিল না এবং তাই কোনও পেটেন্টের লঙ্ঘন না করে একটি Deflate বাস্তবায়ন রচনা করা সম্ভব হয়েছিল। গত 20+ বছরে সেই বাস্তবায়ন এত চ্যালেঞ্জ হয়নি। ইউনিক্স ইউটিলিটিটির জন্য ড্রপ-ইন প্রতিস্থাপন হিসাবে লক্ষ্য করা হয়েছিলgzip
compress
, এবং প্রকৃতপক্ষে compress
সংক্ষেপিত ডেটা সংক্ষেপিত করতে সক্ষম (ধরে নিলেন যে আপনি সেই বাক্যটি বিশ্লেষণ করতে পেরেছিলেন)। gzip
একটি appends .gz
ফাইলের নাম রয়েছে। gzip
ডিফলেট সংকুচিত ডেটা ফর্ম্যাট ব্যবহার করে, যা ইউনিক্সের চেয়ে বেশ খানিকটা ভালভাবে সংকোচিত হয় compress
, এতে খুব দ্রুত ডিকম্প্রেশন থাকে এবং ডেটার জন্য অখণ্ডতা পরীক্ষা হিসাবে একটি সিআরসি -32 যুক্ত করে। শিরোনাম ফর্ম্যাটটি compress
অনুমোদিত ফর্ম্যাটের চেয়ে বেশি তথ্যের সঞ্চয় যেমন মুল ফাইলের নাম এবং ফাইল পরিবর্তনের সময়কে অনুমতি দেয়।
যদিও compress
কেবল একটি একক ফাইলকে সংকুচিত করা হয়, তবে tar
ফাইলগুলির আর্কাইভ তৈরি করতে, তাদের বৈশিষ্ট্যগুলি এবং তাদের ডিরেক্টরি কাঠামোটিকে একটি একক .tar
ফাইলে compress
তৈরি করার জন্য এবং তারপর একটি .tar.Z
ফাইল তৈরির সাথে সংকোচনের জন্য ইউটিলিটিটি ব্যবহার করা সাধারণ । বস্তুত tar
ইউটিলিটি ছিল এবং এখনও পরিবর্তে পাইপ থেকে আউটপুট থাকার একই সময়ে কম্প্রেশন করতে হবে, একটি বিকল্প আছে tar
করার compress
। এগুলি সবই জিজিপ ফর্ম্যাটে এগিয়ে যায় এবং tar
সরাসরি .tar.gz
ফর্ম্যাটে সংকোচনের বিকল্প রয়েছে । tar.gz
বিন্যাস চেয়ে ভাল সংকোচন .zip
পদ্ধতির একটি কম্প্রেশন যেহেতু .tar
বিশেষত অনেক ছোট ফাইল ফাইল জুড়ে অতিরেক সদ্ব্যবহার করতে পারেন। .tar.gz
ইউনিক্সের খুব বেশি বহনযোগ্যতার কারণে এটি সর্বাধিক সাধারণ সংরক্ষণাগার বিন্যাস, তবে ব্যবহারে আরও কার্যকর সংকোচনের পদ্ধতি রয়েছে, তাই আপনি প্রায়শই দেখতে পাবেন .tar.bz2
এবং .tar.xz
সংরক্ষণাগারগুলি দেখুন।
বিপরীতে .tar
, .zip
শেষে একটি কেন্দ্রীয় ডিরেক্টরি রয়েছে, যা সামগ্রীর তালিকা সরবরাহ করে। এটি এবং পৃথক সংক্ষেপণ একটি .zip
ফাইলের পৃথক এন্ট্রিগুলিতে এলোমেলো অ্যাক্সেস সরবরাহ করে । একটি .tar
ফাইল-কম্প্রেস শৃঙ্খলা একটি ডিরেক্টরি, কীভাবে একটি হল নির্মাণ করার জন্য শেষ শুরু থেকে স্ক্যান করা হবে .tar
ফাইল তালিকাভুক্ত করা হয়।
জিজিপ প্রবর্তনের অল্প সময়ের মধ্যেই, ১৯৯০ এর দশকের মাঝামাঝি সময়ে, একই পেটেন্ট বিরোধটি .gif
বুলেটিন বোর্ড এবং ওয়ার্ল্ড ওয়াইড ওয়েবে (সেই সময়ের একটি নতুন জিনিস) খুব বিস্তৃতভাবে চিত্র বিন্যাসের অবাধ ব্যবহারকে প্রশ্নবিদ্ধ করেছিল । সুতরাং একটি ছোট গোষ্ঠী .png
প্রতিস্থাপনের জন্য ফাইলের প্রকারের সাথে লোনহীনভাবে সংকুচিত চিত্র বিন্যাস তৈরি করেছে .gif
। এই ফর্ম্যাটটি সংক্ষেপণের জন্য ডিফল্ট ফর্ম্যাটটিও ব্যবহার করে, যা চিত্রের ডেটাগুলিতে ফিল্টার করার পরে প্রয়োগ করা হয় যা আরও বেশি অপ্রয়োজনীয়তা প্রকাশ করে। পিএনজি ফর্ম্যাটটির ব্যাপক ব্যবহার প্রচারের জন্য দুটি ফ্রি কোড লাইব্রেরি তৈরি করা হয়েছিল। libpng এবং zlib। libpng পিএনজি ফর্ম্যাটের সমস্ত বৈশিষ্ট্য পরিচালনা করে এবং zlib libpng দ্বারা ব্যবহারের জন্য, এবং অন্যান্য অ্যাপ্লিকেশনগুলির জন্য সংকোচনতা এবং ডিকম্প্রেশন কোড সরবরাহ করে। zlib gzip
কোড থেকে অভিযোজিত হয়েছিল ।
উল্লিখিত সমস্ত পেটেন্টের মেয়াদ শেষ হয়ে গেছে।
জালিব লাইব্রেরি ডিফল্ট সংক্ষেপণ এবং ডিকম্প্রেশন এবং ডিফল্ট স্ট্রিমগুলির চারপাশে তিন ধরণের মোড়কে সমর্থন করে। সেগুলি হ'ল : কোনও মোড়কে মোটেও নয় ("কাঁচা" ডিফল্ট), জ্লিব মোড়ক , যা পিএনজি ফর্ম্যাট ডেটা ব্লকগুলিতে ব্যবহৃত হয়, এবং জিজিপ মোড়ানো, প্রোগ্রামারকে জিজেপ রুটিন সরবরাহ করতে। জেলিব এবং জিজিপ মোড়কের মধ্যে প্রধান পার্থক্যটি হ'ল জিলিব মোড়ানোর বিষয়টি আরও কমপ্যাক্ট, ছয় বাইট বনাম গিজিপের জন্য সর্বনিম্ন 18 বাইট এবং অখণ্ডতা চেক, অ্যাডলার -32, সিজিসি -32-এর চেয়ে দ্রুত চলে যা জিজিপ ব্যবহার করে। কাঁচা ডিফল্ট এমন প্রোগ্রামগুলি দ্বারা ব্যবহৃত হয় .zip
যা ফর্ম্যাটটি পড়তে এবং লিখতে পারে , এটি অপর একটি ফর্ম্যাট যা ডিফলেট সংক্ষেপিত ডেটা ঘিরে রাখে।
zlib এখন ডেটা ট্রান্সমিশন এবং স্টোরেজ জন্য ব্যাপক ব্যবহার। উদাহরণস্বরূপ, সার্ভার এবং ব্রাউজারগুলির মাধ্যমে বেশিরভাগ HTTP লেনদেনগুলি zlib ব্যবহার করে ডেটা সংকুচিত করে এবং ডিকম্প্রেস করে, বিশেষত এইচটিটিপি শিরোনামের Content-Encoding: deflate
অর্থ ডিফল্ট সংক্ষেপণ পদ্ধতিটি জেলিব ডেটা ফর্ম্যাটের অভ্যন্তরে আবৃত থাকে ।
ডিফল্টের বিভিন্ন বাস্তবায়নের ফলে একই ইনপুট ডেটার জন্য বিভিন্ন সংকোচিত আউটপুট আসতে পারে, যেমন সিপিইউ সময়ের জন্য সংকোচনের কার্যকারিতা বন্ধ করে দেওয়ার জন্য নির্বাচিতযোগ্য সংকোচনের মাত্রার অস্তিত্ব দ্বারা প্রমাণিত। zlib এবং PKZIP কেবলমাত্র ডিফল্ট সংক্ষেপণ এবং সংক্ষেপনের বাস্তবায়ন নয়। উভয় 7-Zip সংরক্ষণ ইউটিলিটি এবং Google এর zopfli গ্রন্থাগার যখন চুপসে বিন্যাস ব্যবহার অর্ডার সম্ভব গত কয়েক বিট আলিঙ্গন করার জন্য zlib চেয়ে অনেক বেশী CPU- র সময় ব্যবহার করার ক্ষমতা আছে, zlib সর্বোচ্চ তুলনায় কয়েক শতাংশ সংকুচিত আকারের হ্রাস সংকোচনের স্তর pigz ইউটিলিটিgzip এর সমান্তরাল বাস্তবায়নে zlib (সংক্ষেপণের স্তর 1-9) বা zopfli (সংক্ষেপণ স্তর 11) ব্যবহার করার বিকল্প অন্তর্ভুক্ত রয়েছে এবং একাধিক প্রসেসরের এবং কোরগুলির চেয়ে বড় ফাইলগুলির সংক্ষেপণকে বিভক্ত করে zopfli ব্যবহারের সময় প্রভাবকে কিছুটা কমিয়ে দেয়।
.tar.gz
ফাইলগুলি দেখেন , সেগুলি সেগুলিই। জিপ কেবল পৃথকভাবে ফাইলগুলি সংকুচিত করতে পারে। দ্বিতীয়ত, টার ইউনিক্স ডিরেক্টরি তথ্য সমস্ত সংরক্ষণ করে, যেখানে জিপটি এটি করার জন্য ডিজাইন করা হয়নি। (পরে ইউনিক্স-নির্দিষ্ট অতিরিক্ত ব্লকগুলির সাথে জিপ বিন্যাসে বর্ধিতকরণগুলি এই সমস্যার প্রতিকারের চেষ্টা করে))
জিপ হ'ল একটি ফাইল ফর্ম্যাট যা একটি ক্ষতিকারক সংকোচনের সাথে একত্রে সংখ্যক ফাইল এবং ফোল্ডার সঞ্চয় করার জন্য ব্যবহৃত হয়। এটি ব্যবহৃত সংক্ষেপণ পদ্ধতিগুলি সম্পর্কে কোনও কঠোর অনুমান করে না, তবে প্রায়শই প্রায়শই ডিফল্ট ব্যবহার করা হয় ।
জিজিপ উভয়ই ডিফ্লেটের ভিত্তিতে একটি সংক্ষেপণ অ্যালগরিদম তবে সম্ভাব্য পেটেন্টস এট আল এর সাথে কম সংযুক্ত, এবং একটি একক সংকোচিত ফাইল সঞ্চয় করার জন্য একটি ফাইল ফর্ম্যাট। এটি যখন টার সাথে একত্রিত হয় তখন একটি স্বেচ্ছাসেবী ফাইল এবং ফোল্ডার সংকোচনের সমর্থন করে । ফলস্বরূপ ফাইলটির একটি এক্সটেনশন থাকে .tgz
বা .tar.gz
সাধারণত এটি টারবাল নামে পরিচিত ।
zlib এটি সবচেয়ে সাধারণ LZ77 অবতারে ডিফল্টকে আবদ্ধ করে ফাংশনগুলির একটি গ্রন্থাগার ।
সর্বাধিক গুরুত্বপূর্ণ পার্থক্যটি হ'ল জিপ জিপ কেবল একটি একক ফাইলকে সংকুচিত করতে সক্ষম তবে জিপ একাধিক ফাইলকে একের পর এক সংকুচিত করে এবং সেগুলি পরে একটি একক ফাইলে সংরক্ষণাগারভুক্ত করে। সুতরাং, জিজিপ বেশিরভাগ সময় টার সাথে আসে (যদিও অন্যান্য সম্ভাবনা রয়েছে)। এটি কিছু (ডিস্ক) সুবিধার সাথে আসে।
আপনার যদি একটি বড় সংরক্ষণাগার থাকে এবং আপনার কেবলমাত্র একটি একক ফাইলের প্রয়োজন হয়, সেই ফাইলটি পেতে আপনাকে পুরো জিপিপ ফাইলটি সঙ্কুচিত করতে হবে। আপনার জিপ ফাইল থাকলে এটি প্রয়োজন হয় না।
অন্যদিকে, আপনি যদি 10 টি একইরকম বা এমনকি অভিন্ন ফাইলগুলি সংকুচিত করেন তবে জিপ সংরক্ষণাগারটি অনেক বড় হবে কারণ প্রতিটি ফাইল পৃথকভাবে সংকুচিত হয়, অন্যদিকে জিয়ার জিপ-ইন একটির সাথে একটি ফাইল সংকুচিত করা হয় যা ফাইলগুলি থাকলে আরও কার্যকর simimar (সমান)