চেকসাম কতটা অনন্য?


11

আমার অনেকগুলি ফাইল রয়েছে যা বাছাই করা দরকার; এবং দু: খজনকভাবে একই নামযুক্ত বিভিন্ন ফাইল রয়েছে তবে বিভিন্ন সামগ্রী রয়েছে এবং বিভিন্ন ফাইলের নাম সহ একই সামগ্রী রয়েছে।

আমি md5sumফাইলগুলির জন্য চেকসাম তৈরি করতে ব্যবহার করার কথা ভাবছি , তবে আমার জানা দরকার - এটি কি সম্ভব যে দুটি পৃথক ফাইল (অর্থাত্ পৃথক সামগ্রী) একই চেকসাম তৈরি করবে?

যদি তা হয়, তবে এটি হওয়ার সম্ভাবনা কতটা?

দুটি চেকসাম তৈরির জন্য দুটি পৃথক অপ্রাসঙ্গিক (যেমন একই "পরিবার" নয়) চেকসাম-প্রোগ্রাম ব্যবহার করা সম্ভব হবে - এই ধারণার অধীনে যে দুটি পৃথক ফাইল চেকসাম-প্রোগ্রামগুলির মধ্যে একটির জন্য একই চেকসাম তৈরি করতে পারে, এটা একবারে দুজনের সাথে কখনই ঘটবে না?


2
মনে রাখবেন এমডি 5 / শ 2 / ইত্যাদি হ'ল ডেটা হ্যাশ যা এইভাবে একটি ছোট বিট স্পেসে প্রচুর পরিমাণে বিট ম্যাপিং করে, সুতরাং এটি সংঘর্ষের সম্ভাবনা রয়েছে। একটি হ্যাশ কোনও অনন্য কী নয় এবং যদি এটি আপনার লক্ষ্য হয় ... তবে আমি দৃ strongly়ভাবে অন্য কিছু করার পরামর্শ দিই।
এমডিপিসি

ফাইল বাছাইয়ের জন্য, MD5 ঠিক আছে। Crypto.stackexchange.com/a/18337/49945 থেকে , দুটি ভিন্ন সামগ্রীর চেকসাম সংঘর্ষের সম্ভাবনা 2 ^ 128 এ 1 যা 10 ^ 43 এর মধ্যে প্রায় 1। এটা সত্যিই, সত্যিই বিরল। আপনি যদি মাইক্রোসেকেন্ডে একটি তুলনা করেন, গড়ে আপনি 10 ^ 20 বছরে একবার সংঘাত পেয়ে যাবেন। বিগ ব্যাংয়ের পরে এটি কেবল 10 ডলার 9 বছর হয়েছে, সুতরাং বিগ ব্যাং থেকে মাইক্রোসেকেন্ডে একটি তুলনায় এখন পর্যন্ত ইভিএন এ সিঙ্গল টাইম সংঘর্ষের প্রতিক্রিয়া এখনও 10 ^ 11-এ মাত্র 1। একশত বিলিয়ন যুগপত কম্পিউটার দেওয়া, কেবলমাত্র ~ এক এখনও সংঘর্ষের মুখোমুখি হতে পারে।
টুলমেকারস্টেভ

... যদিও এটি পরিষ্কার নয় যে আপনি ফাইলগুলি বাছাই করার সময় কেন কোনও হ্যাশ অ্যালগরিদম ব্যবহার করবেন। যদি একই নামের ফাইল থাকে তবে সেগুলি অবশ্যই অন্য কোনও মানদণ্ডের দ্বারা সনাক্তযোগ্য হতে হবে; উদাহরণস্বরূপ ফাইলটির কোনও অনন্য পথ থাকতে হবে, বা কিছু সঞ্চয়স্থান ডিভাইসে বাইট অফসেট থাকতে হবে ? এগুলির মধ্যে একটিতে অনন্যভাবে ফাইলটি উল্লেখ করার আরও কার্যকর উপায় হবে way
টুলমেকারস্টেভ

উত্তর:


11

: একই বিষয়বস্তু কিন্তু বিভিন্ন ফাইলের নামের সঙ্গে দুই ফাইল ( file1 এবং file2 ):

cat file1
this is a simple file

cat file2
this is a simple file

md5sum file1
7de45bf879db49de7e2eacea23e6c165  file1
md5sum file2
7de45bf879db49de7e2eacea23e6c165  file2

দুটি ভিন্ন ভিন্ন সামগ্রী সহ একই ফাইলের নাম: ( ফাইল 1 এবং ফাইল 1 )

cat file1
this is a simple file
cat file1
this is a simple file with extra contents
md5sum file1 #first file1
7de45bf879db49de7e2eacea23e6c165  file1
md5sum file1 #second file1
c7c8f3fd9ddd7a926c31416a69063e4e  file1

থেকে উইকি এন্ট্রি,

তবে, সত্যিকারের পৃথিবীতে যে কোনও দুটি অ-অভিন্ন ফাইলের এমডি 5 হ্যাশ থাকবে এটি খুব কমই সম্ভাব্য, যদি না তাদের নির্দিষ্টভাবে একই হ্যাশ তৈরির জন্য তৈরি করা হয়।

তবে, এমডি 5 অ্যালগরিদমের নিজস্ব ত্রুটি রয়েছে।

যাইহোক, এখন এমডি 5 এর সংঘর্ষ উত্পন্ন করা সহজ, ফাইলটি তৈরি করা ব্যক্তির পক্ষে একই চেকসামের সাহায্যে দ্বিতীয় ফাইল তৈরি করা সম্ভব, সুতরাং এই কৌশলটি কিছু ধরণের দূষিত টেম্পারিংয়ের বিরুদ্ধে রক্ষা করতে পারে না। এছাড়াও, কিছু ক্ষেত্রে, চেকসামকে বিশ্বাস করা যায় না (উদাহরণস্বরূপ, এটি যদি ডাউনলোড করা ফাইলের মতো একই চ্যানেলের মাধ্যমে পাওয়া যায়), এমডি 5 কেবল ত্রুটি-পরীক্ষার কার্যকারিতা সরবরাহ করতে পারে: এটি কোনও দূষিত বা অসম্পূর্ণ ডাউনলোডকে স্বীকৃতি দেবে, যা বড় ফাইলগুলি ডাউনলোড করার সময় আরও বেশি হয়ে ওঠে।

আমি চেকসাম গণনা করার জন্য sha1 ব্যবহার করার পরামর্শ দেব কারণ শ 1 অ্যালগরিদম ব্যবহার করার সময় সংঘর্ষগুলি উত্পাদন করা এত সহজ নয় । আপনি এখানে দেখতে পারেন sha1 চেকসাম উত্পাদন করা খুব সহজ ।


দ্রষ্টব্য: প্রশ্ন ফাইল বাছাই সম্পর্কে ; ব্যবহারের সুপারিশটি sha1সেই কাজের সাথে প্রাসঙ্গিক নয়; যখন নিয়ে উদ্বিগ্ন এটি শুধুমাত্র গুরুত্বপূর্ণ নিরাপত্তা
টুলমেকারস্টেভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.