পরীক্ষাগুলি যেগুলি বিতরণের তুলনা করে সেগুলি নিয়ম-বহির্ভূত পরীক্ষা। তারা নাল অনুমান দিয়ে শুরু করে যে 2 জনসংখ্যা অভিন্ন, তারপরে সেই অনুমানটিকে প্রত্যাখ্যান করার চেষ্টা করুন। আমরা কখনই নালটিকে সত্য বলে প্রমাণ করতে পারি না, কেবল এটিকে প্রত্যাখ্যান করি, সুতরাং এই পরীক্ষাগুলি সত্যিই 2 জন নমুনা একই জনসংখ্যার (বা অভিন্ন জনসংখ্যা) থেকে আসে তা দেখাতে ব্যবহার করা যায় না।
এটি কারণ বিতরণে সামান্য পার্থক্য থাকতে পারে (যার অর্থ তারা অভিন্ন নয়) তবে এত ছোট যে পরীক্ষাগুলি সত্যিই পার্থক্যটি খুঁজে পায় না।
2 টি বিতরণ বিবেচনা করুন, প্রথমটি 0 থেকে 1 অবধি, দ্বিতীয়টি 2 টি ইউনিফর্মের মিশ্রণ, সুতরাং এটি 0 থেকে 0.999 এর মধ্যে 1 এবং এছাড়াও 9.999 এবং 10 (অন্য কোথাও 0) এর মধ্যে 1। সুতরাং স্পষ্টত এই বিতরণগুলি পৃথক (পার্থক্যটি অর্থবোধক কিনা তা অন্য প্রশ্ন) তবে আপনি যদি প্রতিটি (মোট 100) থেকে 50 এর নমুনা আকার নেন তবে 90% সুযোগের সম্ভাবনা রয়েছে যে আপনি কেবল 0 এবং 0.999 এর মধ্যে মান দেখতে পাবেন এবং কোন বাস্তব পার্থক্য দেখতে অক্ষম।
সমানতালিকা যাচাইকরণ বলা হয় সেখানে করার উপায় আছে যেখানে আপনি জিজ্ঞাসা করেন যে 2 টি বন্টন / জনসংখ্যা সমান, তবে আপনি যা সমতুল্য বলে মনে করেন তা আপনাকে সংজ্ঞায়িত করতে হবে। এটি সাধারণত যে কিছু পরিমাণ পার্থক্য একটি নির্দিষ্ট পরিসরের মধ্যে থাকে, অর্থাৎ 2 টির মধ্যে পার্থক্য 2 টির গড়ের 5% এরও কম হয়, বা কেএস পরিসংখ্যান একটি প্রদত্ত কাট-অফের নীচে থাকে ইত্যাদি you তারপরে পার্থক্য পরিসংখ্যানের জন্য একটি আত্মবিশ্বাসের ব্যবধান গণনা করতে পারে (উপায়ের পার্থক্য কেবল টি আত্মবিশ্বাসের ব্যবধান, বুটস্ট্র্যাপিং, সিমুলেশন বা অন্যান্য পরিসংখ্যানগুলির জন্য অন্যান্য পদ্ধতির প্রয়োজন হতে পারে)। যদি পুরো আত্মবিশ্বাসের ব্যবধানটি "সমতুল্য অঞ্চলে" পড়ে তবে আমরা 2 জনসংখ্যা / বিতরণকে "সমতুল্য" হিসাবে বিবেচনা করি।
সমতুল্য অঞ্চলটি কী হওয়া উচিত তা কঠিন অংশটি নির্ধারণ করছে।