নিম্নলিখিত পরিস্থিতিটি ধরুন:
আমাদের ছোট সংখ্যার আকারের (যেমন এন = 3) সহ একটি বৃহত সংখ্যা রয়েছে (যেমন 20)। আমি লক্ষ্য করেছি যে আমি যদি ইউনিফর্ম বিতরণ থেকে মান উত্পন্ন করি তবে ত্রুটি বিতরণ অভিন্ন হলেও অবশিষ্টাংশগুলি প্রায় স্বাভাবিক দেখাবে। নিম্নলিখিত আর কোডটি এই আচরণটি দেখায়:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
আমি যদি তিনটির একটি দলে কোনও নমুনার অবশিষ্টাংশ দেখি তবে আচরণের কারণ স্পষ্ট:
যেহেতু মোটামুটি ভিন্ন ভিন্ন স্ট্যান্ডার্ড বিচ্যুতি সহ এলোমেলো ভেরিয়েবলের যোগফল, এর বিতরণ স্বতন্ত্র পদগুলির তুলনায় সাধারণ বিতরণের বেশ কিছুটা কাছাকাছি।
এখন ধরে নিন যে সিমুলেটেড ডেটার পরিবর্তে সত্যিকারের ডেটা নিয়ে আমার একই পরিস্থিতি রয়েছে। আমি মূল্যায়ন করতে চাই যে আনোভা স্বাভাবিকতা সম্পর্কিত ধারণা অনুধাবন করে। সর্বাধিক প্রস্তাবিত পদ্ধতিগুলি অবশিষ্টাংশগুলির (যেমন কিউকিউ-প্লট) ভিজ্যুয়াল পরিদর্শন বা অবশিষ্টাংশগুলির উপর একটি স্বাভাবিকতা পরীক্ষা করার পরামর্শ দেয়। এর উপরে আমার উদাহরণ হিসাবে ছোট গ্রুপ আকারের জন্য সত্যই অনুকূল নয়।
আমার কাছে যখন ছোট আকারের অনেকগুলি গোষ্ঠী থাকে তখন এর চেয়ে আরও ভাল বিকল্প কি থাকতে পারে?