ডাউনলোড করা ফাইলগুলির গণনা চেকসাম কেন?


19

আমি প্রায়শই ডাউনলোডের জন্য উপলব্ধ ফাইলের পাশে প্রদত্ত একটি চেকসাম দেখতে পাই। এই অনুশীলনের উদ্দেশ্য আমাকে সরিয়ে দেয়। স্পষ্টতই দুর্নীতিগ্রস্ত ফাইলগুলি সনাক্ত করা, তবে এই দুর্নীতির কারণ কী হতে পারে এবং এটি কি সম্ভবত সম্ভব?

অবশ্যই ফাইলটি সংক্রমণ ত্রুটির দ্বারা ক্ষতিগ্রস্থ হবে না কারণ সেগুলি নেটওয়ার্ক প্রোটোকল দ্বারা সনাক্ত করা হয়েছে। এবং অবশ্যই যে কোনও আক্রমণকারী দূষিত উদ্দেশ্যে ফাইলটি পরিবর্তন করতে পারে সেইভাবে প্রদত্ত চেকসামটিও পরিবর্তন করতে পারে। আমরা কি হার্ড ড্রাইভের ত্রুটিগুলি পরীক্ষা করছি? লেখার সময় পড়ার সময় কি এগুলি হওয়ার সম্ভাবনা বেশি? আমি কি গুরুত্বপূর্ণ কিছু মিস করছি?


2
এবং অবশ্যই যে কোনও আক্রমণকারী দূষিত উদ্দেশ্যে ফাইলটি পরিবর্তন করতে পারে সেইভাবে প্রদত্ত চেকসামটিও পরিবর্তন করতে পারে। - সম্মত, একটি চেকসাম যদি এইচটিটিপিএসের উপরে না দেওয়া হয় তবে সত্যতার গ্যারান্টি দেয় না বা আপনি নিশ্চিত নন যে এসএসএল শংসাপত্রটি সফ্টওয়্যারটির নির্মাতার অন্তর্ভুক্ত।
মিহাই

1
টিসিপি চেকসাম আসলে বেশ লম্পট: এটি কেবল 16 বিট। আপনি যদি হাজার হাজার লোকের কাছে বড় ফাইলগুলি পরিবেশন করেন (মনে করুন: ইনস্টলেশন ডিভিডি চিত্রগুলি), এটি কার্যত নিশ্চিত যে those ডাউনলোডগুলির মধ্যে কয়েকটি নিঃসন্দেহে দূষিত হবে।
চিহ্নিত করুন

@ মিহাই অবশ্যই, যদিও এটি সম্ভবত ঝুঁকিটি কিছুটা কমিয়েছে। উদাহরণস্বরূপ, যদি আপনার সার্ভারটি কোনও ভাইরাস দ্বারা সংক্রামিত হয় যা সমস্ত বাইনারি প্রতিক্রিয়াগুলিকে স্বয়ংক্রিয়ভাবে সংশোধন করে (বা কেবল আপনি ডাউনলোড করা সমস্ত এক্সিকিউটেবলের পরিবর্তে)। এটি নিখুঁত নয়, তবে এটি কিছু ক্ষেত্রে সহায়তা করতে পারে।
লুয়ান

উত্তর:


9

দুর্নীতি সনাক্ত করা পুরোপুরি সঠিক নয়। সফ্টওয়্যারটির অখণ্ডতা নিশ্চিত করা আরও সঠিক ব্যবহার হতে পারে। সাধারণত একটি সার্ভার থেকে কোনও সফ্টওয়্যার বিতরণ করা হয় না। অনেকগুলি সার্ভার থেকে একই সফ্টওয়্যার বিতরণ করা যেতে পারে। সুতরাং আপনি যখন কোনও নির্দিষ্ট সফ্টওয়্যার ডাউনলোড করেন, ডাউনলোডের গতি বাড়ানোর জন্য আপনার গন্তব্যের নিকটতম সার্ভারটি ডাউনলোড উত্স হিসাবে বেছে নেওয়া হয়। তবে এই 'বেসরকারী' (তৃতীয় পক্ষের) সার্ভারগুলিকে সর্বদা বিশ্বাস করা যায় না। তারা / ট্রোজান / ভাইরাস / অ্যাডওয়্যারের / পিছনের দিকের প্রোগ্রামগুলিতে অন্তর্ভুক্ত থাকতে পারে যা ভাল নয়

সুতরাং ডাউনলোড করা সফ্টওয়্যারটি সংশ্লিষ্ট সংস্থা কর্তৃক প্রকাশিত 'অফিসিয়াল' সফ্টওয়্যারটির সাথে ঠিক মিল রয়েছে কিনা তা নিশ্চিত করতে, চেকসামটি ব্যবহার করা হয়। চেকসাম তৈরির জন্য ব্যবহৃত অ্যালগরিদমগুলি এমন যে প্রোগ্রামে সামান্য পরিবর্তন সম্পূর্ণ ভিন্ন চেকসামের ফলেও ঘটে।

ব্যবহারিক ইউনিক্স এবং ইন্টারনেট সুরক্ষা থেকে নেওয়া উদাহরণ

MD5 (নীল বাক্সে 1500 ডলার রয়েছে)) = 05f8cfc03f4e58cbee731aa4a14b3f03

MD5 (নীল বাক্সে $ 1100 রয়েছে)) = d6dee11aae89661a45eb9d21e30d34cb

বার্তাগুলি, যা কেবলমাত্র একটি একক অক্ষর দ্বারা পৃথক হয় (এবং সেই অক্ষরের মধ্যে কেবলমাত্র একটি বাইনারি বিট দ্বারা) সম্পূর্ণ আলাদা বার্তা হজম হয়।

যদি ডাউনলোড করা ফাইলটিতে 'অফিসিয়াল' ওয়েবসাইটে দেওয়া চেকসামের সমান চেকসাম থাকে, তবে সফ্টওয়্যারটি পরিবর্তন করা হয়নি বলে ধরে নেওয়া যেতে পারে।

পার্শ্ব দ্রষ্টব্য: তত্ত্ব অনুসারে, দুটি পৃথক ফাইলের একই হ্যাশ মান থাকতে পারে। হ্যাশ / চেকসাম অ্যালগরিদমকে সুরক্ষিত হিসাবে বিবেচনা করার জন্য, একই চেকসাম তৈরি করে এমন কোনও ফাইল সন্ধান করা গণনার ক্ষেত্রে খুব ব্যয়বহুল হওয়া উচিত।


1
সুতরাং যদি ফাইল এবং চেকসাম একই হোস্ট দ্বারা সরবরাহ করা হয় তবে এটি কিছুটা অকেজো?
ক্যারোলিস জুডেল

হতে পারে. চেকসাম হ'ল সততা নিরূপণের একটি মাধ্যম। কোনও নির্দিষ্ট দৃশ্যে বলুন, যদি কোনও আক্রমণকারী সংস্থার এফটিপি সার্ভারে অ্যাক্সেস অর্জন করে তবে সে সফ্টওয়্যারটি পরিবর্তন করতে পারে। তবে আপনি যদি এখনও আক্রমণকারী এইচটিটিপি সার্ভারে প্রবেশ না করে থাকেন তবে যদি আপনি কেবলমাত্র সততা নির্ধারণ করতে একই চেকসাম ব্যবহার করতে পারেন। সুতরাং যদি উভয়ই আক্রমণকারীর নিয়ন্ত্রণে থাকে তবে তিনি সহজেই উভয়কে পরিবর্তন করতে পারবেন এবং আপনি পার্থক্যটি জানেন না।
আসভিন পিজে

1
চেকসাম প্রাসঙ্গিক হতে পারে এমন অন্য পরিস্থিতি হিচাপের পরে ফাইল স্থানান্তর পুনরায় শুরু করা হলেও অন্তর্বর্তীতে ফাইলটি পরিবর্তন করা হয়েছে এমন পরিস্থিতি সনাক্ত করা।
সুপারক্যাট

@ কারোলিসজুডেলė ডাউনলোড লিঙ্কটি একই ওয়েবসাইট / হোস্টে থাকতে পারে। তবে এটি কোথায় সমাধান করেছে এটি কোন সার্ভারের নিকটতম তার ভিত্তিতে ভিন্ন হতে পারে। আরও মনে রাখবেন যে, চেকসাম পৃষ্ঠাটি https হওয়া উচিত যখন ডাউনলোড কোনও প্রোটোকল HTTP বা এফটিপি হতে পারে
বালকি

10

এবং অবশ্যই যে কোনও আক্রমণকারী দূষিত উদ্দেশ্যে ফাইলটি পরিবর্তন করতে পারে সেইভাবে প্রদত্ত চেকসামটিও পরিবর্তন করতে পারে।

সবসময় না।

এইচটিটিপিএসে দেওয়া চেকসামের সাথে আপনার একটি লিঙ্ক লিঙ্ক থাকতে পারে। লিঙ্কটি নন-এনক্রিপ্ট করা লিংক হতে পারে - প্লেইন HTTP বা FTP, বা অন্য কিছু।

ডাউনসাইডে, এনক্রিপ্ট করা সংযোগটি সহজেই মধ্যম্যাদিত হয়ে উঠতে পারে, বিপরীতে, এটি ওয়েবমাস্টারের পক্ষে দ্রুত বা আরও বেশি সুবিধাজনক হতে পারে (কম কম্পিউটিংয়ের প্রয়োজনীয় সংস্থান এবং নেটওয়ার্কটিকে স্টাফটি ক্যাশে রাখার সুযোগ রয়েছে)।

যদি চেকসামটি অবিচ্ছিন্ন বিশ্বস্ত সংযোগে পরিবেশন করা হয় এবং পে-লোড চেকসামের সাথে মেলে, তবে আপনি উভয় বিশ্বের সেরা পাবেন (যদি চেকসামটি ক্রিপ্টোগ্রাফিকভাবে সুরক্ষিত থাকে)।


এটি বলেছিল, আপনি আমাকে স্মরণ করিয়ে দিয়েছিলেন যে সেখানে "ডিসট্রাড" আছে যা "সুরক্ষিত" বলে দাবি করেছে এবং তাদের ওয়েবসাইটের লিঙ্কগুলি হ'ল কেবল তাদের ওয়েবসাইটটি এইচটিটিপিতে রয়েছে।

উদাহরণ:

এটি এক ধরণের মজাদার কারণ আপনি সম্ভবত এটি আরও বেশি সুরক্ষিত করতে পারবেন না। এমনকি যদি তারা নিজেরাই দূষিত না হয় তবে কোনও আইএসপি সহজেই ওয়েবসাইট এবং চিত্র উভয়কেই ফেক দিয়ে প্রতিস্থাপন করতে পারে এবং কারও কাছে একটি রগযুক্ত অপারেটিং সিস্টেম ইনস্টল করার সময় মনে হয় যে তারা "সুরক্ষিত" লিনাক্স ডিস্ট্রো পাচ্ছে এটি চূড়ান্ত pwnage।


1
অযৌক্তিক এইচটিটিপি এর চেয়ে অনেকগুলি কম সুরক্ষিত জিনিস রয়েছে, যার জন্য সাবভার্ট করার জন্য একটি সক্রিয় এমআইটিএম প্রয়োজন।
ব্যবহারকারী 253751

4

যতদূর পর্যন্ত টিসিপি / আইপি ত্রুটি পরীক্ষা করা সমস্ত কিছু ধরা দেয় না: /programming//a/17083365/2551539 থেকে

বিভিন্ন ত্রুটি দেখা দিতে পারে (যা টিসিপি সনাক্ত করবে) [জ্যাকব ক্ললারের নির্দেশিত] :

  • প্যাকেটের ভুল ক্রম
  • প্যাকেটের ক্ষতি
  • প্যাকেটের ভিতরে ডেটা দুর্নীতিগ্রস্থ
  • ফ্যান্টম প্যাকেট (রিসিভার এমন প্যাকেট পায় যা কখনও পাঠানো হয়নি)

কিছু অতিরিক্ত তথ্য দিয়ে সম্পাদনা করুন:

এই অধ্যয়নের পৃষ্ঠা 9: http://paperhub.s3.amazonaws.com/8ff1e4414c070e900da8ab3885593085.pdf টিপিসি দ্বারা সনাক্ত করা যেতে পারে এমন ত্রুটি রয়েছে বলে প্রস্তাব দেয়। আমার বোধগম্যতা হল এমনটি ঘটে যখন কোনও ভ্রান্ত ডেটাগ্রাম (গবেষণায় "খারাপ যমজ" নামে অভিহিত) ডেটাগ্রামের মতো একই চেকসাম থাকে (গবেষণায় "ভাল যমজ" নামে পরিচিত)।


2
উত্তরটি আরও সাবধানতার সাথে পড়ুন - এগুলি হ'ল টিসিপি দ্বারা সংশোধিত সমস্ত ত্রুটি।
জ্যাকব ক্রোল

4

সংক্রমণ ত্রুটি ঘটতে পারে। লিঙ্ক-লেয়ার প্রোটোকলগুলিতে এগুলি এড়ানোর জন্য সাধারণত চেকসাম বা ত্রুটি-সংশোধনকারী কোড থাকে তবে এগুলি নিখুঁত নয়: ত্রুটিটি অপ্রচালিত হওয়ার খুব কম সম্ভাবনা রয়েছে। টিসিপি প্যাকেটেও একটি চেকসাম থাকে, যা ত্রুটির সম্ভাবনা 2 ^ 16 দ্বারা হ্রাস করে। এটি খুব ছোট, তবে সংক্রমণ ত্রুটির ননজারো সম্ভাবনা তৈরি করে। এটি এমন এক ধরণের জিনিস যা বেশিরভাগ লোক অজান্তেই তাদের জীবদ্দশায় কখনই মুখোমুখি হয় না, তবে এটি কখনও এক-বিলিয়ন বছরের ক্রিপ্টোগ্রাফিক চেকসামের সম্ভাবনা পরিসরে নয়।

ক্লায়েন্টে একটি হার্ডওয়্যার ত্রুটি, যেমন ডিস্ক দুর্নীতি, ডাউনলোডের ঠিক পরে পরীক্ষা করে সনাক্ত করা সম্ভব নয়, কারণ ক্যাশেড অনুলিপি থেকে চেকসাম গণনা করা হবে। অন্যদিকে বুট করতে ব্যর্থ হলে বুট মিডিয়া চেক করা কার্যকর, অন্যদিকে - আপনি সত্যিই মিডিয়াটি পরীক্ষা করছেন এবং আপনার ধারণা রয়েছে যে হার্ডওয়্যারটি খারাপ হতে পারে।

চেকসামগুলি গণনা করার আসল কারণটি আসলে সফ্টওয়্যার-স্তরের ত্রুটিগুলি সনাক্ত করা। এগুলি হয়। সম্ভাব্য ত্রুটিগুলির মধ্যে রয়েছে:

  • একটি ফাইল আংশিকভাবে ডাউনলোড করা হয়েছিল। ওয়েব সার্ভার এবং ব্রাউজারগুলি বাধা সংযোগগুলি সনাক্ত করতে এবং আংশিক ফাইলগুলি পরিষ্কার করার ক্ষেত্রে খারাপ হতে পারে tend ত্রুটিটি আপনার ডাউনলোডের সময় হতে পারে, বা এটি আপলোডের সময় হতে পারে, এটি যুক্ত হয়।
  • পথে কিছুটা দুর্নীতি হয়েছিল। উদাহরণস্বরূপ, ফাইলটি বিতরণের কিছু মধ্যবর্তী নোড বাইনারি ফাইলটিতে একটি পাঠ্য এনকোডিং রূপান্তর প্রয়োগ করার সিদ্ধান্ত নিয়েছে। অথবা কিছু ভুল কনফিগার্ড সার্ভার সামগ্রীটির পরিবর্তে একটি ত্রুটি বার্তা পরিবেশন করেছে।
  • একটি রূপ: ভুল ফাইল আপলোড করা হয়েছিল।
  • বিরল, তবে এর বিরুদ্ধে সুরক্ষার জন্য দরকারী হতে পারে: একটি শত্রু ফাইল পরিবর্তন করেছে তবে রেফারেন্স চেকসামটি পরিবর্তন করতে অক্ষম। সুরক্ষার অবকাঠামোগুলি কোনও আক্রমণকারীকে একটি অবৈধ ফাইলের চেয়ে একটি অবৈধ চেকসাম প্রচার করতে আরও জটিল করে তোলে। উদাহরণস্বরূপ, বড় ফাইলগুলি প্রায়শই আয়নাগুলির মাধ্যমে বিতরণ করা হয়, যেখানে চেকসামগুলি হস্তক্ষেপের জন্য কম সুযোগের সাথে একটি কেন্দ্রীয় সাইট দ্বারা পরিবেশন করা হয় (কেবলমাত্র প্রকল্পের নেতাদের সার্ভার অ্যাক্সেস, এইচটিটিপিএসের মাধ্যমে বিতরণ)।

অনুশীলনে, ডাউনলোড করা ফাইলের আকার চেক করা সবচেয়ে সাধারণ ত্রুটিগুলি ক্যাচ করে, যা কেটে ফেলা বা অবৈধভাবে রূপান্তরিত ফাইল। চেকসামগুলির সুবিধা রয়েছে যে তারা কঠোরভাবে আরও সমস্যা সনাক্ত করে।


2

তত্ত্ব অনুসারে, নেটওয়ার্ক প্রতিটি একক বিভাগকে যথাযথভাবে সরবরাহ করবে এবং তারা ডিস্কে সঠিকভাবে একত্রিত হবে এবং কোনও কিছুই ভুল হবে না।

বাস্তবে, কম্পিউটারগুলি মেশিন এবং সফটওয়্যার, উভয়ই নকশাকৃত এবং ফলসই মানব দ্বারা নির্মিত। যদি কোনও ডাউনলোড কোনওভাবেই কোনও কারণে বা অন্য কোনও কারণে নেমে আসে না, যেমন ডাউনলোড কিছু মধ্যস্থতাকারী ডিভাইসটির মাধ্যমে ডাউনলোড করা নিরীহ বা নিস্পৃহ যা ডেটাটিকে মঙ্গোল করে, ফাইলটি প্রায় নিশ্চিতভাবেই ছিল কিনা তা যাচাই করার একটা উপায় পেয়ে খুব ভাল লাগছে সরবরাহকারীর পক্ষের ফাইলটির সঠিক প্রতিরূপ হিসাবে ডাউনলোড করা ed

একটি উচ্চ-মানের চেকসাম হ'ল ডেটার অখণ্ডতা যাচাই করার জন্য একটি নির্ভরযোগ্য পদ্ধতি।


0

কোনও চেকসাম 100% নির্ভরযোগ্য হতে পারে না কারণ অনেকগুলি ফাইল একই চেকসামে ম্যাপ করে।

আমরা যখন ট্রেনে অন্য চেকসাম যুক্ত করি তখন আমরা ত্রুটি সনাক্তকরণের সম্ভাবনাটিকে বহুগুণ করি ।

ইন্টারনেটে এত বেশি ট্র্যাফিক রয়েছে যে ত্রুটিগুলি আসলে বেশ সাধারণ।


বিট পচা আছে।
হরিণ হান্টার

স্টোরেজ হার্ডওয়্যার নিজেই যা সনাক্ত করা উচিত, তবে জেডএফএস এবং বিটিআরএফগুলির মূল বৈশিষ্ট্য হিসাবে চেকসামিং এটি আমার নিখুঁতভাবে কাজ করছে সন্দেহ।
ম্যাক্স রেড

0

নিম্নলিখিত পরিস্থিতির কারণে চেকসাম দূষিত ডাউনলোড রোধ করতে সহায়তা করবে:

ডাউনলোড পরিবেশন করার সময় সার্ভারের অভ্যন্তরীণ ত্রুটি রয়েছে তাই ডাউনলোডটি বন্ধ করা হয়েছে।

যখন এটি ঘটে, তখন কয়েকটি সম্ভাব্য ফলাফল রয়েছে:

  • গুড সার্ভার এর - সার্ভারের বাস্তবায়ন Chunked স্থানান্তর এনকোডিং হয় না বগী:
    • উত্তম ক্লায়েন্ট (সিআরএল, উইজেটের মতো) আপনাকে অবহিত করতে সক্ষম হতে পারে যেহেতু সমাপ্তি অংশটি কখনই সার্ভার থেকে প্রেরণ করা হয়নি।
    • খারাপ ক্লায়েন্ট ভাবেন যে ডাউনলোডটি সম্পূর্ণ হয়েছে যেহেতু সার্ভার থেকে আর কোনও ডেটা প্রাপ্ত হচ্ছে না।
  • খারাপ সার্ভার এর - সার্ভারের বাস্তবায়ন Chunked স্থানান্তর এনকোডিং হয় বগী এটা এই খারাপ ডাউনলোডের জন্য সসীম খণ্ড পাঠায় যে:
    • যে কোনও ক্লায়েন্ট ভাবেন যে এই ডাউনলোডটি সফলভাবে শেষ হয়েছে।

আমি জনপ্রিয় ক্লায়েন্ট সরঞ্জাম এবং সার্ভার ফ্রেমওয়ার্কগুলির মধ্যে এই আচরণগুলি দেখেছি, সুতরাং যখন আপনি চেকসাম ব্যবহার করবেন না, তারপরে "ভাল সার্ভার + খারাপ ক্লায়েন্ট" বা "খারাপ সার্ভার + কোনও ক্লায়েন্ট" এর ক্ষেত্রে আপনার কলুষিত ডাউনলোড নজরে যাবে না ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.