আর-তে আমার 348 টি পরিমাপের একটি নমুনা রয়েছে এবং আমি ভবিষ্যতে পরীক্ষার জন্য এটি সাধারণত বিতরণ করা হয়েছে তা ধরে নিতে পারি কিনা তা জানতে চাই।
মূলত অন্য স্ট্যাকের উত্তর অনুসরণ করে , আমি ঘনত্ব প্লট এবং কিউকিউ প্লটটির সাথে দেখছি:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
আমার কাছে পরিসংখ্যানগুলিতে শক্তিশালী অভিজ্ঞতা নেই তবে এগুলি আমি দেখেছি এমন সাধারণ বিতরণের উদাহরণগুলির মতো দেখতে।
তারপরে আমি শাপিরো-উইলক পরীক্ষাটি চালাচ্ছি:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
যদি আমি এটি সঠিকভাবে ব্যাখ্যা করি তবে এটি আমাকে নাল অনুমানকে প্রত্যাখ্যান করা নিরাপদ বলে জানিয়েছে, যা বিতরণটি স্বাভাবিক।
যাইহোক, আমি দুটি স্ট্যাক পোস্টের মুখোমুখি হয়েছি ( এখানে এবং এখানে ), যা দৃ the়ভাবে এই পরীক্ষার কার্যকারিতা হ্রাস করে। দেখে মনে হচ্ছে নমুনাটি বড় (348 কে বড় হিসাবে বিবেচনা করা হয়?), এটি সর্বদা বলবে যে বিতরণটি স্বাভাবিক নয়।
আমি কিভাবে এই সমস্ত ব্যাখ্যা করা উচিত? আমার কি কিউকিউ প্লটের সাথে থাকা উচিত এবং ধরে নেওয়া উচিত যে আমার বিতরণটি স্বাভাবিক?