আমার কাছে তিনটি গ্রুপের ডেটা রয়েছে, প্রত্যেকটির দ্বি-দ্বি বিতরণ (যেমন প্রতিটি গ্রুপে এমন উপাদান রয়েছে যা হয় সাফল্য বা ব্যর্থতা)। আমার সাফল্যের পূর্বাভাস সম্ভাবনা নেই তবে এর পরিবর্তে সত্যিকারের সাফল্যের হারের প্রতীক হিসাবে কেবলমাত্র প্রতিটিটির সাফল্যের হারের উপর নির্ভর করতে পারি। আমি কেবল এই প্রশ্নটি পেয়েছি , যা নিকটবর্তী তবে এই দৃশ্যের সাথে হুবহু মিল রয়েছে বলে মনে হয় না।
পরীক্ষাটি সহজ করার জন্য, কেবলমাত্র আমি বলতে পারি যে আমার 2 টি গ্রুপ রয়েছে (3 এই বেস কেস থেকে বাড়ানো যেতে পারে)।
- গ্রুপ 1 ট্রায়াল: = 2455
- গ্রুপ 2 ট্রায়াল: = 2730 30
- গ্রুপ 1 সাফল্য: = 1556
- গ্রুপ 2 সাফল্য: = 1671
আমার কাছে প্রত্যাশিত সাফল্যের সম্ভাবনা নেই, আমি কেবল নমুনাগুলি থেকে জানি। সুতরাং দুটি গ্রুপের জন্য আমার সূচিত সাফল্যের হার হ'ল:
- গোষ্ঠী 1 সাফল্যের হার: = 1556/2455 = 63.4%
- গোষ্ঠী 2 সাফল্যের হার: = 1671/2730 = 61.2%
নমুনার প্রতিটি সাফল্যের হার মোটামুটি কাছাকাছি। তবে আমার নমুনার আকারগুলিও বেশ বড়। আমি যদি দ্বি-দ্বি বিতরণের সিডিএফ পরীক্ষা করে দেখি যে এটি প্রথমের চেয়ে কতটা আলাদা (যেখানে আমি প্রথমটি নাল পরীক্ষা বলে ধরে নিচ্ছি) আমি খুব ছোট সম্ভাবনা পেয়েছি যে দ্বিতীয়টি অর্জন করা যায়।
এক্সেলে:
1-বিনম.আইডিএসটি (1556,2455,61.2%, সত্য) = 0.012
যাইহোক, এটি প্রথম ফলাফলের কোনও বৈকল্পিকতা বিবেচনায় নেয় না, এটি কেবল প্রথম ফলাফলটি পরীক্ষার সম্ভাবনা বলে ধরে নেয়।
যদি তথ্যের এই দুটি নমুনা আসলে পরিসংখ্যানগতভাবে একে অপরের থেকে পৃথক হয় তবে পরীক্ষার আরও ভাল উপায় কি হতে পারে?
prop.test
: prop.test(c(1556, 1671), c(2455, 2730))
।