ন-হাইপোথিসিসটি সত্য বলে ধরে নিলে কমপক্ষে যতটা পর্যবেক্ষণ করা হয় ততই পরীক্ষামূলক-পরিসংখ্যান প্রাপ্তির সম্ভাবনা পি-মান সংজ্ঞায়িত করা হয়। অন্য কথায়,
তবে যদি পরীক্ষা-পরিসংখ্যান বিতরণে বিমোডাল হয়? পি-ভ্যালু কি এই প্রসঙ্গে কিছু বোঝায়? উদাহরণস্বরূপ, আমি আর-তে কিছু বাইমোডাল ডেটা অনুকরণ করতে যাচ্ছি:
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
আর আসুন আমরা 60 একটি পরীক্ষা পরিসংখ্যাত মান পালন অনুমান এবং এখানে আমরা জানি ছবি থেকে এই মান খুব অসম্ভাব্য । সুতরাং আদর্শিকভাবে, আমি একটি পরিসংখ্যান প্রক্রিয়া চাই যা আমি এটি প্রকাশ করার জন্য (বলে, পি-মান) ব্যবহার করি। তবে আমরা যদি সংজ্ঞায়িত হিসাবে পি-মানটির জন্য গণনা করি তবে আমরা একটি সুন্দর উচ্চ-পি মান পাই
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
যদি আমি বিতরণটি না জানতাম তবে আমি উপসংহারে পৌঁছাতে পারি যে আমি যা পর্যবেক্ষণ করেছি তা এলোমেলো সুযোগ দ্বারা। তবে আমরা জানি এটি সত্য নয়।
আমার মনে হয় আমার কাছে প্রশ্নটি হল: পি-ভ্যালু গণনা করার সময় কেন আমরা পর্যবেক্ষণে "কমপক্ষে চরম" হিসাবে মানগুলির সম্ভাবনাটি গণনা করি? এবং যদি আমি উপরের মতো অনুকরণের মতো পরিস্থিতির মুখোমুখি হই, তবে বিকল্প সমাধান কী?