কীভাবে একজন জিপ বোমা তৈরি করতে পারে?


131

জিপ বোমা সম্পর্কিত এই প্রশ্নটি স্বাভাবিকভাবেই আমাকে এই বিষয়ের উইকিপিডিয়া পৃষ্ঠায় নিয়ে গেছে। নিবন্ধটিতে ৪৫.১ কেবি জিপ ফাইলের একটি উদাহরণ উল্লেখ করা হয়েছে যা ১.৩ এক্সাবাইটকে সঙ্কুচিত করে।

এমন নীতি / কৌশলগুলি কী কী যেগুলি প্রথমে এই জাতীয় ফাইল তৈরি করতে ব্যবহৃত হবে? আমি আসলে এটি করতে চাই না, জড়িত ধারণাগুলির সরলিকৃত "কিভাবে-স্টাফ-কাজগুলি" ব্যাখ্যা করতে আরও আগ্রহী।

পুনশ্চ

নিবন্ধে জিপ ফাইলগুলির 9 স্তর উল্লেখ করা হয়েছে, সুতরাং এটি একগুচ্ছ শূন্যকে জিপ করা কোনও সাধারণ ঘটনা নয়। কেন 9, প্রতিটি কেন 10 টি ফাইল?


5
@ মিশেল আপনার অভিযোগটি বৈধ নয়। ওপি এটি কীভাবে কাজ করে তা কেবল জিজ্ঞাসা করেনি, পোস্ট করা নিবন্ধের কিছুই বলেছে যে এটি অ্যান্টি-ভাইরাস নিষ্ক্রিয় করার স্পষ্ট উদ্দেশ্যে। একেবারে বিপরীতে, মনে হচ্ছে নিবন্ধটির জোর একটি ডস স্টাইলের আক্রমণ যা কেবলমাত্র অ্যান্টি-ভাইরাস নিষ্ক্রিয় করার উল্লেখ রয়েছে।
সান জ্যাকিন্টো

2
মুল বক্তব্যটি হ'ল ওপি একটি নির্দিষ্ট ফাইলকে বোঝাচ্ছিল, যা একটি বৃহত সংকুচিত ফাইল নয়, নেস্টেড আর্কাইভগুলি নিয়ে গঠিত।
মাইকেল বর্গওয়ার্ট

1
আমি মাইকেলকে সঠিক বলে মনে করি, তিনি "PS" এ বর্ণিত ফাইলটি কীভাবে তৈরি করবেন তা ব্যাখ্যা করেছেন, এবং অন্য সবাই তা করেন না। যাইহোক, "পিএস" সম্পাদনা হিসাবে যুক্ত করা হয়েছিল, সুতরাং সেই উত্তরগুলি প্রদত্ত সময় সম্ভবত এটি স্পষ্টত ভুল হত না। তারা কেবল ভেবেছিল "এই জাতীয় ফাইল" এর অর্থ "যে কোনও ফাইল যা" ১.৩ এক্সাবাইটে ছড়িয়ে পড়ে ", যখন দেখা যাচ্ছে যে" আমার লিঙ্কের নিবন্ধে বর্ণিত ফাইলের মতো কাঠামোগত একটি ফাইল "বোঝানো হয়েছে।
স্টিভ জেসোপ

1
@ একমাত্র আমি পুরোপুরি একমত আমি কেবল মনে করি না যে এ জাতীয় পরিস্থিতিতে একটি ডাউনভোট উপযুক্ত।
সান জ্যাকিন্তো

4
আমার ধারণা এটি নির্ভর করে যে আপনি কোনও ডাউনটোটকে "এটি প্রশ্নের উত্তরের সেরা উত্তর নয়" বা "আপনি বোকা এবং বেঁচে থাকার যোগ্য নন", বা এর মধ্যে অবস্থানের অর্থ বিবেচনা করছেন কিনা তা নির্ভর করে depends ব্যক্তিগতভাবে, আমি আমার উত্তরটি পুনরায় পড়তে হবে এবং এটির মধ্যে স্পষ্টত কোনও ভুল আছে যা আমার ঠিক করা উচিত কিনা তা বোঝার জন্য আমি একটি ডাউনভোট গ্রহণ করি। তবে তারপরে, আমি এখন আমার সাথে মতানৈক্য হতে এবং আমার উত্তর পরিবর্তন না করার জন্য মোটামুটি খুশি, যদি আমার মনে হয় আমার উত্তরটি কিছুটা অবদান রাখছে। এবং আমি যাইহোক, পুরো ভোটগ্রহণ প্রক্রিয়া সম্পর্কে মোটামুটি উদাসীন হয়ে পড়েছি, এখন এটি স্পষ্ট যে আমি জোন স্কিটকে কখনই ধরব না ;-)
স্টিভ জেসোপ

উত্তর:


92

উইকিপিডিয়া পৃষ্ঠা থেকে উদ্ধৃত:

জিপ বোমার একটি উদাহরণ ফাইল 45.1.zip যা ছিল 45.1 কিলোবাইট সংক্ষিপ্ত তথ্য, 10 টি সেটে 9 টি নেস্টেড জিপ ফাইলের স্তরযুক্ত প্রতিটি নীচের স্তর আর্কাইভটিতে মোট 1.30 গিগাবাইট ফাইল রয়েছে যেখানে মোট 1.30 এক্সপাইট বিহীন তথ্য রয়েছে ।

সুতরাং আপনার যা দরকার তা হ'ল জিরো পূর্ণ একটি একক 1.3 জিবি ফাইল, একটি জিপ ফাইলের মধ্যে সংকুচিত করুন, 10 টি অনুলিপি করুন, সেগুলিকে একটি জিপ ফাইলে প্যাক করুন এবং 9 বার এই প্রক্রিয়াটি পুনরাবৃত্তি করুন।

এইভাবে, আপনি একটি ফাইল পাবেন যা পুরোপুরি সঙ্কুচিত হলে, আপনাকে এই পরিমাণটি শুরু করার প্রয়োজন ছাড়াই একটি অযৌক্তিক পরিমাণ ডেটা তৈরি করে।

অতিরিক্তভাবে, নেস্টেড আর্কাইভগুলি ভাইরাস স্ক্যানারগুলির মতো প্রোগ্রামগুলির জন্য (এই "বোমাগুলির মূল লক্ষ্য)" স্মার্ট হওয়া এবং "খুব বড়" আর্কাইভগুলি আনপ্যাক করতে অস্বীকার করা শক্ত করে তোলে, কারণ শেষ স্তর পর্যন্ত ডেটা মোট পরিমাণের হয় এতটা নয়, আপনি যে স্তরটি না পৌঁছাচ্ছেন ততক্ষণ সর্বনিম্ন স্তরের ফাইলগুলি "দেখতে" পাবেন না এবং প্রতিটি স্বতন্ত্র ফাইল "খুব বড়" নয় - কেবল বিশাল সংখ্যকই সমস্যাযুক্ত।


2
হতে পারে না ... একবার আপনি নীচে জিরোসের ফাইলটি জিপ করলে, ফলাফলযুক্ত জিপ করা ফাইলটি পরবর্তী স্তরের জন্য প্রায় কমপ্রেসিবল হতে পারে না।
pufferfish

16
আহ, তবে প্রতিটি স্তরে আপনার দশটি অভিন্ন ফাইল রয়েছে - যা আবার দুর্দান্তভাবে সংকোচিত হয়। যদিও জিপ ক্রস-ফাইল রিডানডেন্সি ব্যবহার করে না, দশটি স্বতন্ত্রভাবে সংকুচিত অভিন্ন ফাইলযুক্ত সংরক্ষণাগারটিতে সম্ভবত পরবর্তী স্তরটি শোষণের জন্য প্রচুর পরিমাণে রিডানডেন্সি রয়েছে।
মাইকেল বর্গওয়ার্ট

10
বিন্দুটি নয় যে কীভাবে সম্ভব ক্ষুদ্রতম ফাইল থেকে সর্বোচ্চ পরিমাণের ডেটা তৈরি করা যায় - পয়েন্টটি ভাইরাস স্ক্যানারদের খুব বড় সংরক্ষণাগার থেকে রক্ষা করার প্রয়াসকে পরাস্ত করে।
মাইকেল বার্গওয়ার্ড

2
এটি উইকিপিডিয়ায় নিবন্ধটির জোর নয়। এটি কোনও ডস-স্টাইলের আক্রমণকে চাপ দিচ্ছে বলে মনে হচ্ছে।
সান জ্যাকিন্টো

2
তবে ফাইলগুলি পুনরাবৃত্তির সাথে আহরণ করা যায় না ... ভুক্তভোগীর সাব-জিপ ফাইলগুলি এটির কাজ করার জন্য বের করা উচিত ... এটির জন্য কোনও কাজ।
মনোজ

46

জিরোগুলির একটি 1.3 এক্সবাইট ফাইল তৈরি করুন।

সংক্ষিপ্ত (জিপ করা) ফোল্ডারে ডান ক্লিক করুন Send


22
আপনি কটাক্ষ ভুলে গেছেন "হাসি"।
tvanfosson

1
ফাইল আকারের সীমাবদ্ধতার কারণে বেশিরভাগ ফাইল সিস্টেম এবং সংক্ষেপণ অ্যালগরিদমগুলির সাথে এটি সম্ভবত অসম্ভব। তবে, সংকুচিত সংরক্ষণাগারে ফাইল নেস্টিং (এবং আর্কাইভে আরও নেস্টেড সংরক্ষণাগার স্থাপন, যদি সংক্ষেপণ অ্যালগরিদমের মোট আকারের সীমাবদ্ধতা থাকে) আপনাকে এই সীমাগুলি বাইপাস করতে দেয়।
Blixt

133
1 এর 1.3 এক্সাবাইট ফাইল তৈরি করা উচিত। তারা অনেক পাতলা চেয়ে 0 এর :)
কুইন উইলসন

33
@ কুইন - এজন্য (ইনটালি ফ্যাটার) জিরো সংকোচন করা আরও কার্যকর
ওয়েফডব্লিউউইউ

1
আমি ভুল না হলে এটি আপনাকে একটি> 1 জিবি জিপ ফাইল দেয়
ক্রিস এস

36

লিনাক্সের নীচে নিম্নলিখিত কমান্ডটি ব্যবহার করে এটি সহজেই করা যায়:

dd if=/dev/zero bs=1024 count=10000 | zip zipbomb.zip -

আপনি সংক্ষিপ্ত করতে চান এমন কেবি সংখ্যার সাথে গণনা প্রতিস্থাপন করুন। উপরের উদাহরণটি একটি 10MiB জিপ বোমা তৈরি করে (বোমার পরিমাণে তেমন কিছু নয়, তবে এটি প্রক্রিয়াটি দেখায়)।

সমস্ত সঙ্কুচিত তথ্য সঞ্চয় করার জন্য আপনার হার্ড ডিস্কের স্থানের দরকার নেই।


8
কিন্তু আপনি প্রয়োজন ডিকম্প্রেস করা ডেটা সংকুচিত করার কম্পিউটিং শক্তি, এটা এখনও আকার মধ্যে O (ঢ) এর ডিকম্প্রেস করা ডেটা।
টনফা

2
হ্যাঁ, এখানে অন্যান্য উত্তরগুলিও রয়েছে।
থোমি

6
মাইকেল বর্গওয়ার্টের উত্তর হ'ল অসম্পূর্ণ তথ্যের আকারে ল (লগ এন)।
স্টিভ জেসোপ

1
প্রায়, যাইহোক। প্রক্রিয়াটির প্রতিটি পুনরাবৃত্তি "আর্কাইভ শিরোলেখগুলি সরিয়ে ফেলা, 10 বার সংকুচিত ফাইল এন্ট্রিটি নকল করুন, সংরক্ষণাগার শিরোনামগুলি প্রতিস্থাপন করুন, সংকোচিত করুন" জিপ নেস্টিংয়ের স্তরটি 1 দ্বারা বৃদ্ধি করে, পূর্ববর্তী পদক্ষেপ থেকে সংকুচিত তথ্যের আকারের সাথে আনুপাতিক সময় নেয় , সঙ্কুচিত তথ্যের আকার 10 দ্বারা গুণিত করে এবং যদি এটি সংক্ষেপিত ডেটার আকারটি একেবারে বাড়িয়ে দেয় তবে অবশ্যই লিনিয়ার ফ্যাক্টরের মতো কোনও কিছু না করে।
স্টিভ জেসোপ

3
সুতরাং ঠিক একটি পরীক্ষা হিসাবে, আমি জিপ -9 1.3 গিগাবাইট জিরো। ফলাফলটি একটি 1.3M ফাইল। আমি এটি 10 ​​বার নকল করেছি (জিপ শিরোনামগুলির সাথে জগাখিচাগুলি নিয়ে বিরক্ত করা যায় না, ফলে ফলাফলটি জিপ বোমা হিসাবে কাজ করবে না, তবে নীতিটি চিত্রিত করে) একটি 13 এম ফাইল দেওয়ার জন্য, যা জিপ -9 থেকে 34381 বাইটের সাথে সংকুচিত হয়। সুতরাং সদৃশ পদক্ষেপটি ফাইলটি আসলে ছোট করে তোলে কারণ ডিফল্ট কেবলমাত্র একটি নির্দিষ্ট সর্বোচ্চ আকারের টোকেনকে সমর্থন করে। পরবর্তী পদক্ষেপের ফলাফল 18453, তারপরে 19012, 19312, 19743, 20120, 20531, 20870.
স্টিভ

10

নীচে উইন্ডোজ জন্য:

থেকে ধারণার সিকিউরিটি ফোকাস প্রমাণ (! মধ্যে NSFW), এটি একটি জিপ যার উপর তাই মত (42 জিপ ফাইল নাম) যায় 16 ফোল্ডারের মাধ্যমে 16 ফোল্ডার, সাথে ফাইল, আছে:

\ 42 \ lib 0 \ book 0 \ অধ্যায় 0 \ ডক 0 \ 0.dll
...
\ 42 \ lib F \ বই এফ \ অধ্যায় F \ ডক্টর এফ \ 0.dll

আমি সম্ভবত এই চিত্রের সাথে ভুল, কিন্তু এটি 4 ^ 16 (4,294,967,296) ডিরেক্টরি উত্পাদন করে। যেহেতু প্রতিটি ডিরেক্টরিতে এন বাইটের বরাদ্দ স্থান প্রয়োজন, এটি শেষ পর্যন্ত বিশাল। শেষে dll ফাইল 0 বাইট হয়।

আনজিপড প্রথম ডিরেক্টরি একা \42\lib 0\book 0\chapter 0\doc 0\0.dllবরাদ্দ স্থান 4gb ফলাফল।


27
আমি সবেমাত্র ধরে নিয়েছিলাম যে তাদের নগ্ন মহিলারা সুরক্ষা গবেষণা করছেন।
জেমস ম্যাকমাহন

3
জিপটি এনএসএফডাব্লু ছিল। একটি বড় আতঙ্কের লাল অ্যালার্ম বন্ধ হয়ে যাবে এবং একটি খাঁচা আপনার ডেস্কের চারপাশের সিলিং থেকে নেমে আসবে
ক্রিস এস

4
যদি ভাইরাস ফাইলের প্রতিটি আঘাতের ফলাফল এইচআর এর সাথে একটি সাক্ষাত্কারে আসে, তবে হয় আপনার ভাইরাস স্ক্যানার লাগবে না, না হলে আপনার এইচআর বিভাগের দরকার নেই। তাদের মধ্যে একটি ব্যবসায় অবদান রাখছে না ;-)
স্টিভ জেসপ

2
এনএসএফডাব্লুও হতে পারে কারণ একটি নেটওয়ার্ক ভাইরাস স্ক্যানার এটি চেক করতে চাইতে পারে - এবং এটি করতে এটি নিষ্ক্রিয় করতে পারে।
মাইকেল স্টাম

5
ভাইরাস স্ক্যানারটি কেবল এটি সন্দেহজনক হিসাবে চিহ্নিত করা উচিত (যার ফলে এটি নিরাপদে অবরুদ্ধ হতে পারে বা ভাইরাস ইনস্টল করার চেষ্টা করার জন্য আপনাকে অনিরাপদভাবে রিপোর্ট করা হতে পারে)। বোমাটি যদি আসলে বিস্ফোরিত হয়, তবে আপনার আইটি বিভাগটি মূল্যবান কিছু শিখেছে - তাদের আরও ভাল ভাইরাস স্ক্যানার প্রয়োজন।
স্টিভ জেসোপ

8

গুরুতর উত্তর:

(খুব মূলত) সংক্ষেপণ পুনরাবৃত্তি প্যাটার্ন স্পট উপর নির্ভর করে, তাই জিপ ফাইলের মধ্যে এমন কিছু উপস্থাপন করা ডেটা থাকবে

0x100000000000000000000000000000000000  
(Repeat this '0' ten trillion times)

খুব সংক্ষিপ্ত জিপ ফাইল, তবে আপনি যখন এটি প্রসারিত করবেন তখন বিশাল।


1
এটি আরও সংকুচিত হতে পারে, সত্যিই: 0x1 (0x35) (এটি দ্বিতীয়টি 0 বার 35 বার পুনরাবৃত্তি করা হয়েছে যাতে এটি আপনার মন্তব্যে প্রসারিত হয়)
মাইকেল

5

ব্যবহারিক সেটিংসে একটি তৈরি করতে (অর্থাত্ আপনার উপর প্রচুর হার্ডড্রাইভের উপর 1.3 এক্সাবাইট ফাইল তৈরি না করে) আপনাকে সম্ভবত বাইনারি স্তরে ফাইল ফর্ম্যাটটি শিখতে হবে এবং এমন কিছু লিখতে হবে যা আপনার পছন্দসই ফাইলটির মতো দেখতে অনুবাদ করবে, পোস্ট- সঙ্কোচন.


5

নিবন্ধে জিপ ফাইলগুলির 9 স্তর উল্লেখ করা হয়েছে, সুতরাং এটি একগুচ্ছ শূন্যকে জিপ করা কোনও সাধারণ ঘটনা নয়। কেন 9, প্রতিটি কেন 10 টি ফাইল?

প্রথমত, উইকিপিডিয়া নিবন্ধটি বর্তমানে 16 টি ফাইলের সাথে 5 স্তর রয়েছে। বৈষম্য কোথা থেকে এসেছে তা নিশ্চিত নয়, তবে এটি এতটা প্রাসঙ্গিক নয়। আসল প্রশ্নটি হল কেন প্রথম স্থানে বাসা বাঁধে।

ডিফল্ট, জিপ ফাইলগুলির জন্য একমাত্র সাধারণ সমর্থিত সংক্ষেপণ পদ্ধতি * এর সর্বাধিক সংকোচনের অনুপাত হয় 1032 This আপনি জিপ ফাইলটিতে যা করেন তা যতক্ষণ না, যতক্ষণ না এটি কেবল ডিফল্ট ব্যবহার করা হয়, আনপ্যাক করা মাপটি মূল জিপ ফাইলের আকারের 1032 গুণ বেশি হবে।

অতএব, প্রকৃতপক্ষে আপত্তিজনক সংকোচনের অনুপাত অর্জনের জন্য নেস্টেড জিপ ফাইলগুলি ব্যবহার করা প্রয়োজন। আপনার যদি সংকোচনের 2 স্তর থাকে তবে সর্বাধিক অনুপাত 1032 ^ 2 = 1065024 হয় 3 এর জন্য এটি 1099104768, এবং আরও on 42.zip এ ব্যবহৃত 5 টি স্তরের জন্য, তাত্ত্বিক সর্বাধিক সংকোচন অনুপাত 1170572956434432। আপনি দেখতে পাচ্ছেন, আসল 42.zip সেই স্তরটি থেকে অনেক দূরে। এর একটি অংশ জিপ বিন্যাসের ওভারহেড এবং এর একটি অংশ হ'ল তারা কেবল যত্ন করে নি।

যদি আমার অনুমান করতে হয় তবে আমি বলতে পারি যে 42.zip কেবল একটি বড় ফাঁকা ফাইল তৈরি করে এবং বারবার জিপ করে এবং অনুলিপি করে তৈরি হয়েছিল। বিন্যাসের সীমাবদ্ধতা বা সংকোচনের পরিমাণ বা যেকোন কিছু সর্বাধিক করার চেষ্টা নেই - তারা কেবল স্তরে প্রতি 16 টি অনুলিপি বেছে নিয়েছে। মুল বক্তব্যটি ছিল বেশি চেষ্টা ছাড়াই একটি বৃহত পে-লোড তৈরি করা।

দ্রষ্টব্য: অন্যান্য কম্প্রেশন ফর্ম্যাটগুলি, যেমন bzip2, অনেক বেশি, অনেক বড় সর্বাধিক সংক্ষেপণের অনুপাত সরবরাহ করে। তবে বেশিরভাগ জিপ পার্সার সেগুলি গ্রহণ করে না।

পিএস এটি একটি জিপ ফাইল তৈরি করা সম্ভব যা নিজেই একটি অনুলিপি করে (একটি কুইন)। আপনি নিজেই এর একাধিক অনুলিপিগুলিতে আনজিপ করে এমন একটি তৈরি করতে পারেন। অতএব, আপনি যদি পুনরাবৃত্তভাবে কোনও ফাইল চিরকালের জন্য আনজিপ করেন তবে সর্বাধিক সম্ভাব্য আকারটি অসীম। একমাত্র সীমাবদ্ধতা হ'ল এটি প্রতিটি পুনরাবৃত্তিতে সর্বোচ্চ 1032 দ্বারা বৃদ্ধি করতে পারে।

পিপিএস 1032 চিত্রটি ধরে নিয়েছে যে জিপটিতে থাকা ফাইল ডেটা বিচ্ছিন্ন। জিপ ফাইল ফর্ম্যাটটির এক গির্জা হ'ল এটির একটি কেন্দ্রীয় ডিরেক্টরি রয়েছে যা সংরক্ষণাগারে থাকা ফাইলগুলি তালিকাভুক্ত করে এবং ফাইলের ডেটাতে অফসেট করে। আপনি যদি একই ডেটার দিকে ইঙ্গিত করে একাধিক ফাইল এন্ট্রি তৈরি করেন তবে আপনি বাসা ছাড়াই আরও অনেক বেশি সংক্ষেপণ অনুপাত অর্জন করতে পারেন, তবে এই জাতীয় একটি জিপ ফাইল পার্সারদের দ্বারা প্রত্যাখ্যান হওয়ার সম্ভাবনা রয়েছে।


4

একটি জিপবম্ব (বা জিজেবম্ব) তৈরি করার একটি দুর্দান্ত উপায় হ'ল আপনি যে বাইনারি ফর্ম্যাটটিকে লক্ষ্য করছেন তা জানা। অন্যথায়, আপনি যদি স্ট্রিমিং ফাইল ব্যবহার করেন (উদাহরণস্বরূপ ব্যবহার করে /dev/zero) আপনি এখনও স্ট্রিমটি সংকুচিত করার জন্য প্রয়োজনীয় কম্পিউটিং পাওয়ার দ্বারা সীমাবদ্ধ থাকবেন।

জিজিপ বোমার একটি দুর্দান্ত উদাহরণ: http://selenic.com/googolplex.gz57 (বিশাল আকারের ফাইলের ফলে কয়েকটি স্তরের সংক্ষেপণের পরে ফাইলটিতে এম্বেড করা একটি বার্তা রয়েছে)

বার্তাটি খুঁজে মজা করুন :)


2

সম্ভবত, ইউনিক্সে, আপনি সরাসরি একটি জিপ প্রোগ্রামে বা কোনও কিছুর জন্য নির্দিষ্ট পরিমাণ জিরো পাইপ করতে পারেন? আপনি কীভাবে এটি করবেন তা ব্যাখ্যা করার জন্য ইউনিক্স সম্পর্কে যথেষ্ট জানেন না। এগুলি ছাড়াও আপনার জিরো উত্সের প্রয়োজন হবে এবং এগুলিকে স্টিডিন বা অন্য কিছু থেকে পড়া জিপারে পাইপ করুন ...


প্রকৃত প্রশ্নটিকে উপেক্ষা করার জন্য বঞ্চিত, যা একটি নির্দিষ্ট ফাইলের উল্লেখ করে যা স্পষ্টভাবে জিরোগুলির একটি বৃহত ধারাটি জিপ করার ফলাফল নয়।
মাইকেল বর্গওয়ার্ট

না, আপনি এখনও কম্পিউটিং শক্তি দ্বারা সীমাবদ্ধ থাকবেন। আদর্শভাবে আপনি gzip / zip চালাতে চান না কারণ এটি প্রচুর সিপিইউ (বা কমপক্ষে ও (এন) এন
সংক্রামিত

@ টোনফা: আচ্ছা, অবশ্যই আপনি কম্পিউটিং পাওয়ার দ্বারা সীমাবদ্ধ থাকবেন। আমার যুক্তিটি ছিল যে আপনি নিজের ডিস্কে একটি এক্সাবাইট বড় ফাইল তৈরি করতে এবং তারপরে জিপ করতে চান না ...
Svish

2

সমস্ত ফাইল সংক্ষেপণ অ্যালগরিদমগুলি সংকুচিত হওয়ার জন্য তথ্যের এনট্রপির উপর নির্ভর করে । তাত্ত্বিকভাবে আপনি 0 বা 1 এর স্ট্রিমটি সংকোচন করতে পারেন এবং যদি এটি যথেষ্ট দীর্ঘ হয় তবে এটি খুব ভালভাবে সংকোচিত হবে।

এটি তত্ত্বের অংশ। ব্যবহারিক অংশটি ইতিমধ্যে অন্যরাও নির্দেশ করেছে।


2

সাম্প্রতিক (1995-পরবর্তী) সংক্ষেপণ অ্যালগরিদম যেমন bz2, lzma (7-zip) এবং রাআর একঘেয়ে ফাইলে দর্শনীয় সংকোচন দেয় এবং সংকোচনের একক স্তর একটি ম্যানেজযোগ্য আকারে ওভারসাইজ সামগ্রীকে আবৃত করতে যথেষ্ট।

আরেকটি পদ্ধতি হ'ল চূড়ান্ত আকারের একটি বিচ্ছিন্ন ফাইল তৈরি করতে পারে (এক্সাবাইট) এবং তারপরে এটিকে কিছু বিশ্লেষণকারী ফাইল (উদাহরণস্বরূপ টার) বোঝার সাথে সংকুচিত করতে পারে, এখন যদি পরীক্ষক ফাইলটি প্রবাহিত করেন তবে পরীক্ষককে উপস্থিত সমস্ত শূন্যগুলি পড়তে হবে কেবলমাত্র ফাইলের আসল বিষয়বস্তুগুলির মধ্যে প্যাড করার জন্য, যদি পরীক্ষক এটি ডিস্কে লিখেন তবে খুব অল্প জায়গা ব্যবহার করা হবে (একটি ভাল আচরণযুক্ত আনারকিভার এবং একটি আধুনিক ফাইল সিস্টেম ধরে নিলে)।


2

এটা চেষ্টা করেছি. আউটপুট জিপ ফাইলের আকারটি একটি ছোট 84-KB ফাইল ছিল।

আমি এ পর্যন্ত তৈরি পদক্ষেপগুলি:

  1. '0' দিয়ে পূর্ণ একটি 1.4-GB .txt ফাইল তৈরি করুন
  2. এটি সংকুচিত।
  3. .txt এ .zip এর নাম পরিবর্তন করুন তারপরে 16 টি অনুলিপি করুন
  4. এর সবগুলি একটি .zip ফাইলে তুলনা করুন,
  5. .zip ফাইলের ভিতরে পুনরায় নামকরণ .txt ফাইলগুলি .zip এ পুনরায় নামকরণ করুন
  6. আট থেকে 3 বার পদক্ষেপ পুনরাবৃত্তি করুন।
  7. উপভোগ করুন :)

যদিও আমি জানি না যে অংশটি কীভাবে পুনর্নবীকরণ করা জিপ ফাইলের সংক্ষেপণটি এটি একটি ছোট আকারে সংকুচিত করে, তবে এটি কার্যকর হয়। হয়তো আমার কেবল প্রযুক্তিগত শর্তাদি নেই।


যাইহোক, ভয় পাবেন না যে এটি অবিচ্ছিন্নভাবে এর ভিতরে থাকা সমস্ত জিপ ফাইলগুলি বের করে দেবে। এটি কেবলমাত্র জিপ ফাইলটি বের করে যা নীচে বাসা বাঁধে এবং নীচে সমস্ত পথ না।
জয়ক্রল

2

সিলিকন ভ্যালি সিজন 3 পর্ব 7 ​​আমাকে এখানে এনেছে। জিপ বোমা তৈরির পদক্ষেপগুলি হবে।

  1. আকারের জিরো (বা যদি আপনি তাদের চর্মসার মনে করেন) এর সাথে একটি ডামি ফাইল তৈরি করুন (বলুন 1 জিবি)।
  2. জিপ-ফাইল বলতে এই ফাইলটি সংকুচিত করুন 1.zip
  3. করুন n(বলুন 10) এই ফাইলটি কপি এবং সংকুচিত সংরক্ষণাগার (বলুন এইসব 10 ফাইল যোগ 2.zip)।
  4. ধাপ 3 kবার বার করুন।
  5. আপনি একটি জিপ বোমা পাবেন।

একটি পাইথন বাস্তবায়নের, চেক এই


1

জিপ রান লেন্থ এনকোডিং ব্যবহার করে কিনা তা আমি জানি না তবে এটি যদি হয় তবে এই ধরনের সংকোচিত ফাইলটিতে একটি ছোট্ট ডেটা এবং খুব বড় রান-দৈর্ঘ্যের মান থাকতে পারে। রান-দৈর্ঘ্যের মানটি নির্দিষ্ট করে দেয় যে ডেটার ক্ষুদ্র অংশটি কতবার পুনরাবৃত্তি হয়। যখন আপনার খুব বড় মান থাকে, ফলস্বরূপ ডেটা আনুপাতিকভাবে বড়।


2
জিপ লেম্পেল-জিভ-ওয়েলচ (বা একটি পরিবর্তিত সংস্করণ) সংক্ষেপণ ব্যবহার করে যা কার্যকরভাবে ডেটা টোকেনাইজ করে। বাইটের 'সেট' এর দীর্ঘ রানগুলি ভাল সংকোচনের ফলাফল করবে, সুতরাং জিআইএফ (যা এলজেডাব্লুও ব্যবহার করে) গ্রাফিক্সের জন্য ভাল এবং জেপিইজি (যা একটি জটিল সাইন ওয়েভ সংকোচনের ব্যবহার করে) ফটোগুলির জন্য আরও ভাল যেখানে ডেটা অনেক বেশি 'এলোমেলো is '।
লাজার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.