কোনও ফাইল ডাউনলোড করার সময় চেকসামগুলির তুলনা করা কেন ভাল অনুশীলন?


16

ডাউনলোডের জন্য আইএসও ফাইল সরবরাহকারী ওয়েবসাইটগুলি প্রায়শই সেই ফাইলগুলির এমডি 5 চেকসাম দেয়, যা আমরা নিশ্চিত করতে ব্যবহার করতে পারি যে ফাইলটি সঠিকভাবে ডাউনলোড হয়েছে এবং ক্ষতিগ্রস্থ হয়নি।

কেন এটি প্রয়োজনীয়? অবশ্যই টিসিপির বৈশিষ্ট্য সংশোধন করার ত্রুটি যথেষ্ট। যদি কোনও প্যাকেট সঠিকভাবে না পাওয়া যায় তবে তা পুনঃপ্রেরণ করা হবে। টিসিপি / আইপি সংযোগের খুব প্রকৃতি কি ডেটা অখণ্ডতার গ্যারান্টি দেয় না?


10
সফটওয়্যার এবং হার্ডওয়ারের সম্ভাব্য বাগগুলিও অন্তর্ভুক্তের শেষ প্রান্তে, ডেটা স্থানান্তর করার বিষয়ে ভুলে যাবেন না।
sebix

ডাউনলোডটি কিছুটা বাইটের প্রথম দিকে বন্ধ হতে পারে। আপনি মনোযোগ না দিলে আপনি অবশ্যই ফাইল আকারের দ্বারা এটি লক্ষ্য করবেন না, এবং টিসিপি ত্রুটি সংশোধন কেবলমাত্র উপস্থিত ডেটার অংশটি যাচাই করেছে।
কেভিন কেইন

চেকসামগুলি কার্যকর হতে পারে তবে 20 বছরের মধ্যে কম্পিউটারের সাথে কাজ করা, আমি একবার এটি ব্যবহারের কথা মনে করি না।
পেড্রো লবিটো

2
MD5 হ্যাশস, চেকসাম নয়। ত্রুটিগুলি পরীক্ষা করার জন্য একটি চেকসাম ব্যবহার করা হয়, সংক্রমণকালে বিশেষত বিট ত্রুটি। একটি ক্রিপ্টোগ্রাফিক হ্যাশ মানে ডেটা ঠিক একইরকম হয় তা নিশ্চিত করা। এই অর্থে একটি হ্যাশ চেকসামের সুপারস্টেট হবে তবে সেগুলি একই নয়। পাশাপাশি MD5 এখন 10 বছর ধরে ভেঙে গেছে (দেখুন উইকিপিডিয়া নিবন্ধ, বিভাগের সুরক্ষা )।
0xC0000022L

উত্তর:


20

যেমনটি অন্যের দ্বারা উল্লেখ করা হয়েছে, ডেটা দুর্নীতির অনেক সম্ভাবনা রয়েছে যেখানে ট্রান্সপোর্ট লেয়ারের কোনও চেকসাম সহায়তা করতে পারে না যেমন চেকসাম প্রেরণকারী অংশে গণনা করার আগেই দুর্নীতি ঘটছে, এমআইটিএম প্রবাহকে বাধা দেয় এবং সংশোধন করে (ডাটা পাশাপাশি) চেকসাম হিসাবে), চেকসামটি গ্রহণের শেষে বৈধকরণের পরে ঘটবে ইত্যাদি corruption

যদি আমরা এই সমস্ত সম্ভাবনা উপেক্ষা করি এবং নিজেই টিসিপি চেকসামের সুনির্দিষ্ট বিবরণগুলিতে এবং ডেটা অখণ্ডতার সত্যতা যাচাইয়ের ক্ষেত্রে এটি আসলে কী করে তার দিকে মনোনিবেশ করি, তবে দেখা যাচ্ছে যে ত্রুটিগুলি সনাক্ত করার ক্ষেত্রে এই চেকসামের বৈশিষ্ট্যগুলি মোটেই বিস্তৃত নয়। এই চেকসাম অ্যালগরিদমটি যেভাবে বেছে নেওয়া হয়েছে তা সময়ের সময়ের (1970 এর দশকের শেষের) সাথে গতির জন্য প্রয়োজনীয়তার প্রতিফলন করে।

টিসিপি চেকসামটি এভাবেই গণনা করা হয়:

চেকসাম: 16 বিট

চেকসাম ক্ষেত্রটি শিরোনাম এবং পাঠ্যের সমস্ত বিট শব্দের সংখ্যার সমপরিমাণের 16 বিট এর পরিপূরক। যদি একটি বিভাগে চেকসামিড করার জন্য একটি বিজোড় সংখ্যক শিরোলেখ এবং পাঠ্য অক্টেট থাকে তবে চেকসামের উদ্দেশ্যে 16 অক্টোবরের শব্দের জন্য সর্বশেষ অক্টোটটি জিরো দিয়ে ডানদিকে প্যাড করা হবে। প্যাডটি সেগমেন্টের অংশ হিসাবে প্রেরণ করা হয় না। চেকসামটি গণনা করার সময়, চেকসাম ক্ষেত্রটি নিজেই জিরোগুলির সাথে প্রতিস্থাপিত হয়।

এর অর্থ হ'ল এইভাবে ডেটার সংমিশ্রণের সময় যে কোনও দুর্নীতি ভারসাম্যহীন হয় তা অননাক্ত করা যায়। ডেটাতে দুর্নীতির বেশ কয়েকটি বিভাগ রয়েছে যা এটি অনুমতি দেবে তবে কেবল তুচ্ছ উদাহরণ হিসাবে: ১ bit বিট শব্দের ক্রম পরিবর্তন করা সর্বদা সনাক্ত করা যাবে না।


অনুশীলনে, এটি অনেকগুলি সাধারণ ত্রুটি ধরা দেয় তবে একেবারে গ্যারান্টি দেয় না । এটি কেবলমাত্র স্থানীয় লিঙ্কে সংক্রমণ করার জন্য, যদিও এল 2 স্তরটি কীভাবে অখণ্ডতা যাচাই করে (যেমন ইথারনেট ফ্রেমের সিআরসি 32 )ও এটির সাহায্যে সহায়তা করে এবং দূষিত তথ্যগুলির অনেকগুলি ক্ষেত্রেও টিসিপি স্ট্যাকের কাছে পাস হয় না।

একটি দৃ strong় হ্যাশ বা তাত্ক্ষণিকভাবে একটি ক্রিপ্টোগ্রাফিক স্বাক্ষর ব্যবহার করে ডেটা বৈধকরণ, ডেটা অখণ্ডতা নিশ্চিত করার ক্ষেত্রে সম্পূর্ণ ভিন্ন স্তরে রয়েছে। দুটি সবেমাত্র তুলনা করা যেতে পারে।


সর্বোত্তম উত্তর! অন্যান্য উত্তরগুলি কীভাবে ক্রিপ্টোগ্রাফিক হ্যাশ এবং চেকসামের ধারণাগুলি মিশ্রিত করে তা আমি ঘৃণা করি।
0xC0000022L

20

এমডি 5সামটি পরীক্ষা করা উচিত কেন এমন এক জিলিয়ন কারণ সম্ভবত রয়েছে তবে কয়েকটি আমার মনে আসে:

  • ক্ষতিকারক ক্রিয়াকলাপ - সার্ভার থেকে পথে আপনার আইএসওতে হস্তক্ষেপ করা যেতে পারে
  • পৃষ্ঠাটি নিজেই বানানো হয়েছে (এমডি 5সামগুলিতেও স্বাক্ষর করা সেরা) :)
  • ভাঙা ডাউনলোড (টিসিপি ত্রুটি সংশোধন সত্ত্বেও) ( এটি দেখুন )
  • আইএসও ভুলভাবে পোড়া হয়েছে

এবং যাইহোক এটি কেবল কয়েক সেকেন্ড সময় নেয়।


21
এর অর্থ হ'ল কোনও র্যান্ডম মিরর সাইট থেকে কোনও আইএসও ডাউনলোড করা যুক্তিসঙ্গতভাবে নিরাপদ, আপনি যদি কোথাও বিশ্বাসযোগ্য থেকে চেকসামগুলি পান; উদাহরণস্বরূপ একটি পিজিপি foo- ঘোষণা মেলিং তালিকায় পোস্ট স্বাক্ষরিত।
রিচার্ডব

2
এটি দূষিত ক্রিয়াকলাপ থেকে রক্ষা করার জন্য আসলে কিছুই করার ছিল না। আইএসও যদি কোনও দূষিত জায়গায় প্রতিস্থাপন করা যেত, এমডি 5 চেকসাম মানটিও হতে পারে। সেগুলিতে স্বাক্ষর করা একটি ভিন্ন বিষয় তবে ওপি যা জিজ্ঞাসা করছে তা নয়। সুতরাং "দূষিত ক্রিয়াকলাপের" আপনার তালিকা (এটা নিশ্চিত শব্দসমূহ ভালো) প্রথম হওয়ার পরিবর্তে, এটা আসলে এমনকি করা উচিত নয় হতে আপনার তালিকার। আপনি মানুষকে সুরক্ষার একটি মিথ্যা অনুভূতি দিচ্ছেন, যা বিপজ্জনক। superuser.com/questions/849845/…
অস্টিন '' বিপদ '' শক্তিগুলি

1
@ অস্টিন'ড্যাঞ্জার'পাওয়ার্স উম্ম, না, কনরাডের ডানদিকে। এক জন্য, ডাউনলোড মিরর সাধারণত হয় চেকসাম দেখাচ্ছে সাইট থেকে বিভিন্ন, এবং দ্বিতীয়, সেখানে বেশ বিশ্বের আইএসপিরা ট্রাফিককে নিপূণভাবে অনেক - বিভিন্ন TCP চেকসাম ঠিক থাকবে, কিন্তু আপনি একটি ভিন্ন ফাইল ডাউনলোড করছেন। এবং অবশ্যই, তিনি অন্য একটি পয়েন্টও হারিয়েছেন - চেকসাম তৈরি হওয়ার পরে ফাইলটি সার্ভারে দূষিত হয়ে থাকতে পারে। এটি সর্বদা ঘটে থাকে, বিশেষত আরও "শখের" সার্ভারের জন্য (যথাযথ RAID সেটআপগুলি ব্যতীত)।
লুয়ান 18'15

2
2015 এর উত্তরের MD5 হ্যাশগুলির বিরুদ্ধে পরামর্শ দেওয়া উচিত । সেই অ্যালগরিদমটি গত দশ বছর ধরে ভেঙে গেছে (কোনও অতিরঞ্জিত নয়!)। এছাড়াও, আপনি চেকসাম এবং হ্যাশ মিশ্রিত করছেন। তারা পিছনে বিভিন্ন অভিপ্রায় সহ দুটি ভিন্ন জিনিস।
0xC0000022L

1
@ 0xC0000022L এসএএএ 1 এর মন্তব্যে যোগ করার জন্য সুরক্ষা যদি ইতিমধ্যে খুব বড় উদ্বেগ হয় তবে এড়ানো ভাল, যদিও এটি এবং এমডি 5 উভয়ই দুর্ঘটনাকবলিত দুর্নীতির বিরুদ্ধে রক্ষার জন্য যথেষ্ট পর্যাপ্ত।
ডেভিড স্পিলিট

6

টিসিপি / আইপি গ্যারান্টিযুক্ত ডেটা অখণ্ডতা *। তবে এটি গ্যারান্টি দেয় না যে কোনও ফাইলের 100% ডাউনলোড করা হয়েছে। এটি ঘটতে পারে এমন অনেকগুলি কারণ থাকতে পারে। উদাহরণস্বরূপ: এটি সম্ভব যে আপনি এমন কোনও আইএসও মাউন্ট করতে পারেন যা মাঝখানে কোথাও এক বা দুটি বাইট মিস করে। আপনার দু'টি নির্দিষ্ট ফাইল দুর্নীতিগ্রস্থ না হওয়া পর্যন্ত আপনার এতে সমস্যা হবে না। চেকসামের তুলনা করা নিশ্চিত করে যে আপনি সত্যিই পুরো ফাইলটি ডাউনলোড করেছেন।

* মন্তব্য দেখুন


8
আমি মনে করি "ডেটার অখণ্ডতার গ্যারান্টি দেয়" এটি আসলে যা করে তা সত্যিই বেশি বিক্রি হয়। এটি খুব চর্বিযুক্ত পদ্ধতির সাথে ডেটা অখণ্ডতা যাচাই করার চেষ্টা করে যা বিশেষত শক্তিশালী নয়।
হাকান লিন্ডকভিস্ট

6

টিসিপি চেকসামটি কেবলমাত্র 16 বিট। এর অর্থ হ'ল, অন্যান্য চেকসামের অভাবে, প্রতি 65536 টির মধ্যে প্যাকেটগুলির মধ্যে একটি দুর্নীতিবিহীন হিসাবে গৃহীত হবে। উদাহরণস্বরূপ, যদি আপনি 1% দুর্নীতির হারের সাথে একটি শোরগোলের লিঙ্ক জুড়ে একটি 8 গিগাবাইট ডিভিডি চিত্র ডাউনলোড করেন তবে আপনি 81 সন্দেহাতীত দুর্নীতিযুক্ত প্যাকেটগুলি আশা করতে পারেন।

এমডি 5 128 বিট এ অনেক বড় চেকসাম। আসল হিসাবে একই চেকসাম সহ কিছু উত্পাদনকারী 81১ টি প্যাকেটের প্রতিক্রিয়াগুলি 1,000,000,000,000,000,000,000,000,000,000,000 এ প্রায় 1।


6

এইচটিটিপি এর মাধ্যমে ডাউনলোড করা কোনও ফাইলের চেকসাম যাচাই করার বিভিন্ন কারণ রয়েছে:

  • আপনি পুরো ফাইলটি পেয়েছেন তা নিশ্চিত করে
    • কিছু ক্লায়েন্ট, যেমন ফায়ারফক্স , একটি বিঘ্নিত সংযোগটিকে একটি সফল ডাউনলোড হিসাবে বিবেচনা করতে পারে, আপনাকে একটি কাটা ফাইল দিয়ে রেখে দেয় তবে দাবি করে যে এটি ঠিক আছে
  • আপনি সঠিক ফাইলটি পেয়েছেন তা নিশ্চিত করে
    • যেমন একটি বগি, আপোসযুক্ত বা দূষিত সার্ভার আপনাকে অন্য কিছু পাঠাতে পারে
    • কেউ ট্রান্সফার (ম্যান-ইন-দ্য মিডল অ্যাটাক) এর সাথে হস্তক্ষেপ করতে পারে - এমনকি যদি আপনার সিস্টেমটি যেমন সুপারফিশ দ্বারা আপস করা হয় বা এনক্রিপশন পদ্ধতিটি ব্যবহার করা দূর্বল হয় তবে এইচটিটিপিএসও এ থেকে নিরাপদ নয়
    • তারা আপনাকে কেবল একটি মিথ্যা ডাউনলোড পৃষ্ঠার সাথে উপস্থাপন করতে পারে, তাই আপনি এমনকি প্রকৃত সার্ভারের সাথে সংযুক্ত নন (তবে এই ক্ষেত্রে যদি চেকসামগুলি একই নকল সার্ভার থেকে পান তবে খুব বেশি সাহায্য করবে না)
    • বেশ কয়েকটি আইএসপি বিভিন্ন কারণে সংক্রমণের পাতায় জাভাস্ক্রিপ্ট ইনজেকশন দেওয়ার জন্য ধরা পড়েছে 1 ; এটি কতটা কার্যকর হয় তার উপর নির্ভর করে এটি কিছু ফাইল ডাউনলোডও ম্যাঙ্গেল করতে পারে
    • একটি আয়না ফাইলটির পুরানো সংস্করণটিকে হোস্ট করছে, বা প্রশাসক ভুল ফাইলটি আপলোড করতে পারে
  • টিসিপি সনাক্ত করতে পারে না এমন কোনও ফাইল দ্বারা ফাইলটি নিশ্চিত করা দূষিত হয়নি
    • উদাহরণস্বরূপ সার্ভারে ফাইলটি দূষিত হতে পারে, তাই টিসিপি কেবল এটি নিশ্চিত করবে যে ইতিমধ্যে দূষিত ফাইলটি সংক্রমণে আরও জড়িত না হয়েছে didn't
    • অথবা এটি আপনার শেষে এসে ত্রুটিযুক্ত মেমরি / ডিস্ক, বগি ফাইল সিস্টেম ড্রাইভার ইত্যাদির মাধ্যমে দূষিত হতে পারে
    • টিসিপি চেকসামগুলি কেবলমাত্র 16-বিট, সুতরাং সম্ভাবনাগুলি জ্যোতির্বিজ্ঞানযুক্ত নয় (65536 এ 1) যে কোনও দূষিত প্যাকেট সনাক্ত করা যায় না that
  • একটি আইএসও দিয়ে, ডিস্কটি সঠিকভাবে জ্বলেছে তা নিশ্চিত করে

মন্তব্য 1 টি উত্স কারণ LOL প্রতিনিধি


2
সূত্র: * security.stackexchange.com/questions/70970/... * adblockplus.org/forum/viewtopic.php?t=8156 "আক্রমনাত্মক আইএসপি ইনজেকশনের / এমবেডেড স্ক্রিপ্ট / বিজ্ঞাপন blockable" * iamsrijit.wordpress.com/2012/09/ 14 /… * আরও গুগলে সহজেই পাওয়া যায়, তবে এটি এখানে সত্যিকারের বিষয় নয়
রেনা

2

ড্যানিয়েল, আপনি প্রতি আইএসও ডাউনলোডের জন্য যে সরঞ্জামটি ব্যবহার করছেন তার উপর নির্ভর করে। যদি এটি ফায়ারফক্স বলুন .. এটি ফাইল ডাউনলোড দেখায়। তবে আপনার কাছে সম্পূর্ণ আইএসও অক্ষত থাকতে পারে না। আপনি যদি এটি জ্বলন করেন তবে এটি ব্যবহার করার চেষ্টা করুন, তথ্য অনুপস্থিত হতে পারে। বিভিন্ন ওয়েব সার্ভারগুলিতে হোস্টিং ফাইলগুলিতে সময়ে সময়ে এটি ঘটে।

কমপক্ষে ফাইলের আকার তুলনা করা ভাল অভ্যাস (মোট বাইটস বা বিট) মিলছে কিনা তা নিশ্চিত করে নিন। উইন্ডোজ ফাইল বাইট গণনা আলাদা দেখায় তারপরে লিনাক্স বলবে। MD5 যোগ চেক একই মান দেখায় যে কোনও ওএস ব্যবহৃত হয় না ter আশা করি এটা কিছুটা সাহায্য করবে। চিয়ার্স ...


2
উইন্ডোজ বাইট গণনাটি কীভাবে লিনাক্স দেখায় তার থেকে আলাদা দেখায়? সত্যি? আমি ভেবেছিলাম যে সিপি / এম এর ফাইল-আকার-হিসাবে-ব্লক-গণনা ফাইল সিস্টেমের সাথে ঘৃণা বেরিয়ে গেছে। (এখন, আপনি যদি বাইট গণনা ব্যতীত অন্য কোনও কিছু খুঁজছেন - বলুন, এক্সপ্লোরারগুলিতে ফাইলের আকার প্রদর্শন - এটির চেয়ে আলাদা হতে পারে But তবে কোনও বুদ্ধিমান সিসাদমিনকে সেভাবে ডাউনলোড করা ফাইলের অখণ্ডতা পরীক্ষা করা উচিত নয়, তাই এটি একটি অ- ইস্যু।) বাইটস বাইট হয়। বিটের ক্ষেত্রে এটি দেখার কোনও অর্থ হয় না, যদিও; আপনি শেষবার অর্ধেক বাইট ডাউনলোড এবং সঞ্চয় করেছিলেন কখন?
একটি সিভিএন

2

আমি প্রচুর আকর্ষণীয় উত্তর লক্ষ্য করেছি তবে বিবেচনা করার জন্য একটি শেষ জিনিস রয়েছে: দুটি জেনারেলের সমস্যা

দুটি জেনারেল সমস্যা এবং বাইজেন্টাইন জেনারেলদের সমস্যাটি অবিশ্বাস্য চ্যানেলগুলির মাধ্যমে নির্ভরযোগ্যভাবে তথ্য স্থানান্তরিত করার প্রভাবগুলি বিবেচনা করে।

চেকসামগুলি "ক্রমবর্ধমান নির্ভরযোগ্যতা" এর অন্য একটি স্তর এবং ব্যর্থতার খুব পাতলা সম্ভাবনাযুক্ত একটি। এ কারণেই এটি এত জনপ্রিয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.