@ শুভর মন্তব্যগুলিতে যেমন জিজ্ঞাসা করেছেন, আমার শ্রেণিবদ্ধ কোনটির জন্য একটি বৈধতা। সম্পাদনা: শাপিরো পরীক্ষার সাথে, যেমন এক-নমুনা কেএস পরীক্ষাটি আসলে ভুলভাবে ব্যবহৃত হয়। হুইপার সঠিক: কোলমোগোরভ-স্মারনভ পরীক্ষার সঠিক ব্যবহারের জন্য, আপনাকে বিতরণযোগ্য পরামিতিগুলি নির্দিষ্ট করতে হবে এবং সেগুলি ডেটা থেকে বের করতে হবে না। একি-নমুনা কেএস-পরীক্ষার জন্য এসপিএসএসের মতো পরিসংখ্যান প্যাকেজগুলিতে এটি করা হয়।
আপনি বিতরণ সম্পর্কে কিছু বলার চেষ্টা করেছেন এবং আপনি টি-টেস্ট প্রয়োগ করতে পারেন কিনা তা পরীক্ষা করতে চান। সুতরাং বিশ্লেষণের অন্তর্নিহিত অনুমানগুলি অবৈধ করার জন্য ডেটা স্বাভাবিকতা থেকে উল্লেখযোগ্য পরিমাণে প্রস্থান করে না তা নিশ্চিত করার জন্য এই পরীক্ষাটি করা হয় । সুতরাং, আপনি আই-ত্রুটি টাইপ করতে আগ্রহী নন, তবে দ্বিতীয় ধরণের ত্রুটিতে আগ্রহী।
গ্রহণযোগ্য পাওয়ারের জন্য ন্যূনতম এন গণনা করতে সক্ষম হতে এখন একটিকে "উল্লেখযোগ্যভাবে আলাদা" সংজ্ঞা দিতে হবে (বলুন 0.8)) বিতরণ সহ, এটি সংজ্ঞায়িত করা সহজ নয় not সুতরাং, আমি প্রশ্নের উত্তর দিলাম না, যেহেতু আমি যে থাম্বটি ব্যবহার করি সেগুলি বাদ দিয়ে আমি কোনও বুদ্ধিমান উত্তর দিতে পারি না: এন> 15 এবং এন <50. কিসের ভিত্তিতে? মূলত অনুভূতি অনুভব করছি, তাই আমি অভিজ্ঞতা বাদে এই পছন্দটি ডিফেন্ড করতে পারি না।
তবে আমি জানি যে কেবলমাত্র 6 টি মান সহ আপনার টাইপ II-ত্রুটিটি প্রায় 1 হিসাবে আবদ্ধ, আপনার পাওয়ার 0 এর কাছাকাছি করে 6 টি পর্যবেক্ষণের সাথে শাপিরো পরীক্ষাটি কোনও সাধারণ, পোয়েসন, ইউনিফর্ম বা এমনকি তাত্পর্যপূর্ণ বিতরণের মধ্যে পার্থক্য করতে পারে না। একটি ধরণের II-ত্রুটি প্রায় 1 হওয়ার সাথে সাথে আপনার পরীক্ষার ফলাফল অর্থহীন।
শাপিরো-পরীক্ষার মাধ্যমে স্বাভাবিকতা পরীক্ষা করার চিত্রণ:
shapiro.test(rnorm(6)) # test a the normal distribution
shapiro.test(rpois(6,4)) # test a poisson distribution
shapiro.test(runif(6,1,10)) # test a uniform distribution
shapiro.test(rexp(6,2)) # test a exponential distribution
shapiro.test(rlnorm(6)) # test a log-normal distribution
কেবলমাত্র যেখানে মানগুলির প্রায় অর্ধেকটি 0.05 এর চেয়ে ছোট, এটি সর্বশেষতম। যা সবচেয়ে চরম ঘটনাও।
আপনি যদি শপিরো পরীক্ষার মাধ্যমে ন্যূনতম এনটি আপনাকে পছন্দ করে এমন শক্তি দেয় তা সন্ধান করতে চান তবে কেউ এই জাতীয় সিমুলেশন করতে পারেন:
results <- sapply(5:50,function(i){
p.value <- replicate(100,{
y <- rexp(i,2)
shapiro.test(y)$p.value
})
pow <- sum(p.value < 0.05)/100
c(i,pow)
})
যা আপনাকে এ জাতীয় শক্তি বিশ্লেষণ করে:
যার থেকে আমি এই সিদ্ধান্তে পৌঁছেছি যে 80% ক্ষেত্রে একটি সাধারণ বিতরণ থেকে একটি সূচককে আলাদা করতে আপনার মোটামুটি সর্বনিম্ন 20 টি মান দরকার values
কোড প্লট:
plot(lowess(results[2,]~results[1,],f=1/6),type="l",col="red",
main="Power simulation for exponential distribution",
xlab="n",
ylab="power"
)