এটা কোন যুক্তি নয়। এটি একটি (কিছুটা দৃ strongly়ভাবে বলা হয়েছে) সত্য যে আনুষ্ঠানিক স্বাভাবিকতা পরীক্ষাগুলি সর্বদা আমরা আজ যে বিশাল আকারের নমুনা আকারের সাথে কাজ করি তা প্রত্যাখ্যান করে। এমনকি এটি প্রমাণ করাও সহজ যে এন যখন বড় হয়, এমনকি সিদ্ধ স্বাভাবিক থেকে ক্ষুদ্রতম বিচ্যুতিও একটি উল্লেখযোগ্য ফলাফলের দিকে নিয়ে যায়। এবং প্রতিটি ডেটাসেটে কিছুটা এলোমেলোভাবে থাকার কারণে কোনও একক ডেটাসেটের পুরোপুরি সাধারণভাবে বিতরণ করা নমুনা হবে না। তবে প্রয়োগিত পরিসংখ্যানগুলিতে প্রশ্নটি ডেটা / অবশিষ্টাংশগুলি ... পুরোপুরি স্বাভাবিক, তবে অনুমানগুলি ধরে রাখার পক্ষে যথেষ্ট স্বাভাবিক কিনা তা নয়।
আমাকে শাপিরো-উইলক পরীক্ষা দিয়ে চিত্রিত করুন । নীচের কোডটি এমন একটি বিতরণের সেট তৈরি করে যা স্বাভাবিকতার দিকে যায় তবে সম্পূর্ণ স্বাভাবিক নয়। এরপরে, আমরা shapiro.test
প্রায় সাধারণ-বিতরণ থেকে প্রাপ্ত নমুনাটি স্বাভাবিকতা থেকে বিচ্যুত হয় কিনা তা দিয়ে আমরা পরীক্ষা করি । আর তে:
x <- replicate(100, { # generates 100 different tests on each distribution
c(shapiro.test(rnorm(10)+c(1,0,2,0,1))$p.value, #$
shapiro.test(rnorm(100)+c(1,0,2,0,1))$p.value, #$
shapiro.test(rnorm(1000)+c(1,0,2,0,1))$p.value, #$
shapiro.test(rnorm(5000)+c(1,0,2,0,1))$p.value) #$
} # rnorm gives a random draw from the normal distribution
)
rownames(x) <- c("n10","n100","n1000","n5000")
rowMeans(x<0.05) # the proportion of significant deviations
n10 n100 n1000 n5000
0.04 0.04 0.20 0.87
সর্বশেষ লাইনটি প্রতিটি নমুনা আকারের সিমুলেশনের কোন ভগ্নাংশটি স্বাভাবিকতা থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয় তা পরীক্ষা করে। সুতরাং 87% ক্ষেত্রে, 5000 পর্যবেক্ষণের একটি নমুনা শাপিরো-উইলাক্স অনুসারে স্বাভাবিকতা থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয়। তবুও, আপনি যদি কিউকিউ প্লট দেখতে পান তবে আপনি কখনও কখনও স্বাভাবিকতা থেকে বিচ্যুতি নিয়ে সিদ্ধান্ত নেবেন না। নীচে আপনি উদাহরণ হিসাবে দেখতে পাবেন এলোমেলো নমুনার এক সেট জন্য কিউ-প্লটগুলি
পি-মান সহ
n10 n100 n1000 n5000
0.760 0.681 0.164 0.007