আমি ফিশারদের সঠিক পরীক্ষাটি আরও ভালভাবে বুঝতে চেয়েছিলাম, তাই আমি নীচের খেলনাটির উদাহরণটি প্রস্তুত করেছি, যেখানে f এবং m পুরুষ এবং মহিলা এর সাথে মিলে যায় এবং n এবং y এর সাথে "সোডা সেবন" এর সাথে মিলে যায়:
> soda_gender
f m
n 0 5
y 5 0
স্পষ্টতই, এটি একটি কঠোর সরলকরণ, তবে আমি প্রসঙ্গটি এভাবে চলতে চাইনি। এখানে আমি কেবল ধরে নিয়েছি যে পুরুষরা সোডা পান করেন না এবং মহিলারা সোডা পান করেন না, এবং দেখতে চেয়েছিলেন যে পরিসংখ্যানগত পদ্ধতিগুলি একই সিদ্ধান্তে আসে কিনা।
আমি যখন আর-এ ফিশারদের সঠিক পরীক্ষাটি চালাই, আমি নিম্নলিখিত ফলাফলগুলি পাই:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
এখানে, যেহেতু পি-মানটি 0.007937 হয়, তাই আমরা উপসংহারে পৌঁছাতে পারি যে লিঙ্গ এবং সোডা খরচ যুক্ত।
আমি জানি যে ফিশার-সঠিক পরীক্ষা হাইপারজিওমিটারিক বিতরণের সাথে সম্পর্কিত। সুতরাং আমি এটি ব্যবহার করে অনুরূপ ফলাফল পেতে চাই। অন্য কথায়, আপনি এই সমস্যাগুলি নীচের হিসাবে দেখতে পারেন: 10 টি বল রয়েছে, যেখানে 5 টি "পুরুষ" হিসাবে লেবেলযুক্ত, এবং 5 টি "মহিলা" হিসাবে লেবেলযুক্ত এবং আপনি প্রতিস্থাপন ছাড়াই এলোমেলোভাবে 5 বল আঁকেন এবং আপনি 0 পুরুষ বল দেখতে পাবেন । এই পর্যবেক্ষণের সুযোগ কী? এই প্রশ্নের উত্তর দিতে, আমি নিম্নলিখিত কমান্ডটি ব্যবহার করেছি:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
আমার প্রশ্নগুলি: 1) দুটি ফলাফল কীভাবে আলাদা হয়? ২) উপরে আমার যুক্তিতে কিছু ভুল আছে বা কঠোর নয়?