chl ইতিমধ্যে একই ডেটা সেট সহ 25 টি পরীক্ষা পরিচালনা করার সময় একাধিক তুলনার ফাঁদ উল্লেখ করেছে। এটি পরিচালনা করার একটি সহজ উপায় হ'ল পরীক্ষার সংখ্যার (এই ক্ষেত্রে 25) দ্বারা বিভাজন করে পি মান প্রান্তিকিকে সামঞ্জস্য করা। আরও সুনির্দিষ্ট সূত্রটি হ'ল: সমন্বিত পি মান = 1 - (1 - পি মান) ^ (1 / এন)। যাইহোক, দুটি পৃথক সূত্র প্রায় একই সমন্বিত পি মান অর্জন করে।
আপনার হাইপোথিসিস পরীক্ষা অনুশীলন নিয়ে আরও একটি বড় সমস্যা রয়েছে is আপনি অবশ্যই একটি প্রকার I ত্রুটি (মিথ্যা পজিটিভ) এ চলে যাবেন যার মাধ্যমে আপনি 99.9999% স্তরে অত্যন্ত তাত্পর্যপূর্ণ কিছু সত্যই তুচ্ছ পার্থক্য উদঘাটন করবেন। এর কারণ এটি যখন আপনি এত বড় আকারের একটি নমুনা নিয়ে কাজ করেন (এন = 1,313,662), আপনি 0 এর খুব কাছাকাছি একটি স্ট্যান্ডার্ড ত্রুটি পাবেন। এটি কারণ 1,313,662 = 1,146 এর বর্গমূল। সুতরাং, আপনি স্ট্যান্ডার্ড বিচ্যুতি 1,146 দ্বারা ভাগ করবেন। সংক্ষেপে, আপনি মিনিট পার্থক্যগুলি ক্যাপচার করবেন যা পুরোপুরি অনিবার্য হতে পারে।
আমি আপনাকে এই অনুমানের পরীক্ষার কাঠামো থেকে দূরে সরে যাওয়ার পরিবর্তে কার্যকর আকারের ধরণের বিশ্লেষণের পরামর্শ দেব। এই কাঠামোর মধ্যে পরিসংখ্যানের দূরত্বের পরিমাপ হল স্ট্যান্ডার্ড বিচ্যুতি। স্ট্যান্ডার্ড ত্রুটির বিপরীতে, আদর্শ বিচ্যুতিটি নমুনার আকার দ্বারা কৃত্রিমভাবে সঙ্কুচিত হয় না। এবং, এই পদ্ধতির সাহায্যে আপনার ডেটা সেটগুলির মধ্যে উপাদানগুলির পার্থক্য সম্পর্কে আরও ভাল ধারণা পাওয়া যাবে। প্রভাবের আকারটি গড় গড় পার্থক্যের আশেপাশের আত্মবিশ্বাসের ব্যবধানের উপরেও অনেক বেশি আলোকপাত করে যা পরিসংখ্যানগত তাত্পর্য সম্পর্কিত অনুমানের পরীক্ষার ফোকাসের চেয়ে অনেক বেশি তথ্যপূর্ণ যা প্রায়শই মোটেই তাত্পর্যপূর্ণ নয়। আশা করি এইটি কাজ করবে.