উইন্ডোজের জন্য কোনও সংকোচনের বা আর্কিভার প্রোগ্রাম রয়েছে যা প্রতিলিপিও দেয়? [বন্ধ]


12

আমি একটি আর্কিভার প্রোগ্রাম সন্ধান করছি যা সংরক্ষণাগারভুক্ত ফাইলগুলিতে প্রতিলিপি (ছাড়) সম্পাদন করতে পারে। সংরক্ষণাগারটি আনপ্যাক করার পরে, সফ্টওয়্যারটি সংক্ষেপণ প্রক্রিয়া চলাকালীন যে কোনও ফাইল মুছে ফেলা হবে তা ফিরিয়ে আনবে।

এখন পর্যন্ত আমি খুঁজে পেয়েছি:

অন্য কারও সম্পর্কে সচেতন কেউ?

এটি সম্ভবত 7-জিপটিতে দুর্দান্ত একটি সংযোজন হবে।

উত্তর:


12

প্রায় সমস্ত আধুনিক সংরক্ষণাগার ঠিক এটি করেন, কেবল পার্থক্য হ'ল তারা এটিকে একটি "শক্ত" সংরক্ষণাগার হিসাবে উল্লেখ করেন, যেমন সমস্ত ফাইলগুলিতে সংক্ষেপণ অ্যালগরিদমকে খাওয়ানোর আগে একক প্রবাহে সংযুক্ত করা হয়। এটি স্ট্যান্ডার্ড জিপ কম্প্রেশন থেকে পৃথক যা প্রতিটি ফাইলকে একে একে সংকুচিত করে এবং প্রতিটি সংকুচিত ফাইল সংরক্ষণাগারে যুক্ত করে।

7-জিপ এর প্রকৃতির দ্বারা কার্যকরভাবে ডি-সদৃশ অর্জন করে 7-জিপ উদাহরণস্বরূপ ফাইলগুলি অনুসন্ধান করবে, তাদের অনুরূপ ফাইলের ধরণ এবং ফাইলের নাম অনুসারে বাছাই করবে এবং সুতরাং একই ধরণের দুটি ফাইল এবং ডেটা সংবাহক অ্যালগরিদমগুলিতে প্রবাহে পাশাপাশি পাশাপাশি স্থাপন করা হবে। সংক্ষিপ্তকারীটি তখন খুব সম্প্রতি দেখেছে এটি প্রচুর ডেটা দেখতে পাবে এবং সেই দুটি ফাইলই একের পর এক ফাইলকে সংকুচিত করার তুলনায় সংক্ষিপ্তকরণের দক্ষতায় বড় বৃদ্ধি দেখতে পাবে।

লার্নস দীর্ঘকাল ধরে তাদের ".tgz" ফর্ম্যাটটির প্রচলনের মাধ্যমে (বা এটির সম্পূর্ণ ফর্মটি ব্যবহার করার জন্য ".tar.gz") একইরকম আচরণ দেখেছিল যেহেতু টর কেবল সমস্ত ফাইলকে একক স্ট্রিমে মার্জ করে চলেছে (যদিও তা ছাড়াই ফাইলগুলি বাছাই এবং গোষ্ঠীকরণ) এবং তারপরে gzip দিয়ে সংকোচন করা। Mis-জিপটি করছে তা বাছাই করা যা কার্যক্ষমতা কিছুটা হ্রাস করতে পারে তবে জিপের মতো করে স্বতন্ত্রভাবে সংকুচিত ফাইলগুলি একসাথে ব্লব্বিংয়ের চেয়ে আরও অনেক ভাল ।


প্রতিদিন নতুন কিছু শিখুন. আমি বুঝতে পারি নি যে জিপ প্রতিটি ফাইল পৃথকভাবে সংকুচিত করেছে তবে আমার কম্পিউটারে কয়েকটি পরীক্ষা চালানোর পরে আমি বুঝতে পেরেছি যে আপনি সত্যই সঠিক। খুব আকর্ষণীয়, আপনাকে ধন্যবাদ!
সেন্টারঅরবিট

7 আইপি সদৃশকরণের ন্যায্য কাজ করে তবে এটি নন-সদৃশ ডেটা কার্যকরভাবে সংকুচিত করার জন্যও ডিজাইন করা হয়েছে এবং এটি অর্জনে প্রচুর সিপিইউ এবং মেমরি ব্যবহার করে, যা ডেটা নকল করার পক্ষে এটি একটি অত্যন্ত অযোগ্য পদ্ধতি করে। আপনি যদি দুটি অভিন্ন 100MB ফাইল সংকুচিত করেন তবে প্রথম ফাইলটিকে দক্ষতার সাথে সংকুচিত করতে চেষ্টা করতে খুব সমস্যা হবে এবং কেবল তখনই (অভিধানের আকারটি যথেষ্ট বড় হলে) প্রথম ফাইলটির নকল হিসাবে দ্বিতীয় ফাইলটি সংকোচিত করে।
mwfearnley

সঙ্গে gzip না .tar.gzএকে অপরের থেকে পুরোপুরি স্বাধীনভাবে এক সময় কেবলমাত্র কম্প্রেস অপেক্ষাকৃত ছোট অবরোধের (900KB মত) এবং এইভাবে দুই বৃহৎ কিন্তু অভিন্ন ফাইল (যেমন, একটি দম্পতি 4 মেগাবাইট চিত্র) deduplicate করার ক্ষমতা আছে না?
বিনকি

উদাহরণস্বরূপ, 7z বড় ফাইলগুলির মধ্যে ছাড় দিতে সক্ষম হয়েছিল তবে জিপিপটি ছিল না: gist.github.com/binki/4cf98fb4f1f4aa98ee4a00edaf6048fa
বিনকি

একটি আকর্ষণীয় পন্থা ফাইলগুলি 'গিট অ্যাড' করা, তারপরে .git ফোল্ডারটি সংকুচিত করা
বিটোটং করা হয়েছে

4

একটি সংক্ষেপণ প্রক্রিয়া সহ অনুচ্ছেদে ব্যবহার করার কোনও মানে নেই no বেশিরভাগ সংক্ষেপণ অ্যালগরিদম এমন একটি শব্দ তৈরি করেন যা একটি 'অভিধান' বলা হয় যা সর্বাধিক সাধারণ, বা ডেটা পুনরায় ব্যবহৃত বিটগুলির সন্ধান করবে। সেখান থেকে এটি পুরো "শব্দ" আবার লেখার পরিবর্তে কেবল অভিধান এন্ট্রিটি উল্লেখ করবে। এইভাবে বেশিরভাগ সংক্ষেপণ প্রক্রিয়াগুলি ইতিমধ্যে সমস্ত ফাইল থেকে অপ্রয়োজনীয় বা ডুপ্লিকেট ডেটা কেটে দেয়।

উদাহরণস্বরূপ, যদি আপনি একটি 1 এমবি ফাইল নিয়ে থাকেন এবং প্রতিবার এটি একটি আলাদা নামের সাথে 100 বার অনুলিপি করেন (মোট ১০০ মেগাবাইট ডিস্ক স্পেস), তবে আপনি এটি একটি 7 জীপ বা জিপ ফাইলে সংকুচিত করেন, আপনার কাছে 1 এমবি মোট জিপ ফাইল থাকবে। এটি কারণ আপনার সমস্ত ডেটা একটি অভিধান এন্ট্রিতে রাখা হয়েছিল এবং 100 বার রেফারেন্স করা হয়েছিল, যা খুব অল্প স্থান নেয়।

এটি কী ঘটে যায় তার একটি খুব সাধারণ ব্যাখ্যা, তবে বিষয়টি এখনও ভালভাবে জানানো হয়েছে।


1
যেহেতু বেশিরভাগ সংক্ষেপণ সংরক্ষণাগারগুলির জন্য অভিধানের আকারটি খুব সীমিত, এটি প্রতিদিনের ব্যবহারে বৈধ নয়। 50MB ফাইল দিয়ে এটি ব্যবহার করে দেখুন এবং আপনার সংকীর্ণ আকারটি দুটি অভিন্ন ইনপুট ফাইলের সাথে দ্বিগুণ হবে।
বিশৃঙ্খলা_99

1
জিপ ফাইলগুলি, 7 জিপ ফাইলের বিপরীতে, ফাইলগুলিতে প্রতিলিপি সমর্থন করে না। জিপ ফাইলগুলি প্রতিটি ফাইল পৃথকভাবে সংকুচিত করে সংরক্ষণ করে, তাই ডুপ্লিকেট ফাইলগুলি সংরক্ষণাগারে কেবল একাধিকবার সংরক্ষণ করা হবে।
mwfearnley

1
যদিও 7zip ফাইল জুড়ে প্রতিলিপি সমর্থন করে, এটি আরও সংক্ষিপ্ত মিল খুঁজে পেতে এবং সংক্ষেপে ডিজাইন করা হয়েছে। এর অ্যালগরিদমগুলি বৃহত্তর ডেটা ডুপ্লিকেশন সন্ধানের জন্য ডিজাইন করা কোনও কিছুর জন্য সম্ভাব্য যা সম্ভব তার চেয়ে অনেক ধীর এবং আরও মেমরি নিবিড়।
mwfearnley

4

7-জিপ, জিপ, জিজিপ এবং অন্যান্য সমস্ত সংরক্ষণাগারগুলি একই ফাইলের ভিতরে বা কেবল কয়েকটি মেগাবাইট বা তার চেয়ে অনেক বেশি দূরে যেমন অভিন্ন অঞ্চলগুলি সনাক্ত করতে পারে না বা বিভিন্ন ফাইলের অভ্যন্তরে বিভিন্ন অবস্থানে রাখা হয়েছে।

সুতরাং না, সাধারণ সংরক্ষণাগারগুলি কিছু পরিস্থিতিতে যেমন এক্সডুপ এবং অন্যান্যগুলি সম্পাদন করে না। আপনি যদি কিছু ভার্চুয়াল মেশিন বা অন্যান্য জিনিস সংকুচিত করেন তবে আপনি এটি দেখতে পারেন।


1
এটা সঠিক। যত তাড়াতাড়ি অনন্য ডেটা ভলিউম সংকোচকারী অভিধানের আকার ছাড়িয়ে গেছে, কমপ্রেসন ড্রেনের নিচে নেমে যায়। এক্সডাপে বড় ডেটা ভলিউমের জন্য উন্নত পারফরম্যান্স সরবরাহ করা হয়।
usr ডিরেক্টরির
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.