আমি ধরে নিয়েছি যে সাম্যতার জন্য একজোড়া নমুনা বৈকল্পিক পরীক্ষা করার সময় আপনি বৈকল্পিকের অনুপাতের জন্য এফ-টেস্ট বলতে বোঝাচ্ছেন (কারণ এটিই সহজতম যেটি স্বাভাবিকতার পক্ষে বেশ সংবেদনশীল; আনোভা-এর জন্য এফ-পরীক্ষা কম সংবেদনশীল)
যদি আপনার নমুনাগুলি সাধারণ বিতরণ থেকে আঁকা হয়, তবে নমুনা বৈকল্পিকের একটি ছোট আকারের স্কোয়ার বিতরণ রয়েছে
কল্পনা করুন যে সাধারণ বিতরণ থেকে প্রাপ্ত ডেটার পরিবর্তে আপনার কাছে এমন বিতরণ ছিল যা সাধারণের চেয়ে ভারী-লেজযুক্ত ছিল। তারপরে আপনি সেই মাপানো চি-স্কোয়ার বিতরণের তুলনায় অনেকগুলি বৃহত্তর বৈকল্পিকতা পেয়ে যাবেন এবং নমুনা বৈকল্পিকের ডানদিকের ডান লেজের মধ্যে বেরিয়ে আসার সম্ভাবনাটি সেই বিতরণের লেজগুলিতে খুব প্রতিক্রিয়াশীল যেখানে থেকে ডেটা টানা হয়েছিল =। (এছাড়াও অনেকগুলি ছোট ছোট বৈচিত্র থাকবে তবে এর প্রভাবটি কিছুটা কম উচ্চারণযোগ্য)
এখন যদি উভয় নমুনা সেই ভারী লেজযুক্ত বিতরণ থেকে আঁকানো হয় তবে অঙ্ককের উপর বৃহত্তর লেজ বড় বড় এফ মানগুলির উত্পন্ন করবে এবং ডিনোমিনেটরের বৃহত্তর লেজটি ছোট এফ মানগুলির একটি অতিরিক্ত উত্পাদন করবে (এবং বিপরীতে বাম পুচ্ছের জন্য)
এই উভয় প্রভাব উভয় নমুনার একই বৈকল্পিক সত্ত্বেও , একটি দ্বি-লেজ পরীক্ষায় প্রত্যাখ্যান করে । এর অর্থ হ'ল যখন সত্য বিতরণটি স্বাভাবিকের চেয়ে ভারী লেজযুক্ত হয়, তখন প্রকৃত তাত্পর্য স্তরটি আমাদের চেয়ে বেশি থাকে।
বিপরীতে, একটি হালকা লেজযুক্ত বন্টন থেকে একটি নমুনা আঁকা নমুনা বৈকল্পিকের একটি বিতরণ উত্পাদন করে যা খুব কম লেজ লেগেছে - ভেরিয়েন্স মানগুলি সাধারণ বিতরণ থেকে প্রাপ্ত ডেটা প্রাপ্তির চেয়ে বেশি "বিভ্রান্তিকর" হয়ে থাকে। আবার, প্রভাবটি নীচের লেজের তুলনায় বেশি উপরের লেজে শক্তিশালী।
এখন যদি উভয় নমুনা সেই হালকা-লেজযুক্ত বিতরণ থেকে আঁকা হয়, এর ফলস্বরূপ মধ্যবর্তী কাছাকাছি এফ মানগুলির একটি অতিরিক্ত এবং উভয় লেজের খুব কম সংখ্যক (প্রকৃত তাৎপর্যের স্তরটি কাঙ্ক্ষিতের চেয়ে কম হবে) ফলাফল করে।
এই প্রভাবগুলি বড় আকারের নমুনার আকারের সাথে অগত্যা অনেক হ্রাস করতে পারে বলে মনে হয় না; কিছু ক্ষেত্রে এটি আরও খারাপ বলে মনে হচ্ছে।
আংশিক চিত্রের মাধ্যমে, এখানে সাধারণ, টি 5 এবং ইউনিফর্ম বিতরণের জন্য 10000 নমুনার রূপগুলি ( n=10 জন্য) দেওয়া হয়েছে, এটি mean 2 9 এর সমান গড় হিসাবে মাপানো হয়েছে :t5χ29
এটি শীর্ষের তুলনায় তুলনামূলকভাবে ছোট হওয়ার কারণে এটি খুব দূরের লেজটি দেখতে কিছুটা শক্ত (এবং t5 এর জন্য লেজের পর্যবেক্ষণগুলি যেখানে আমরা ষড়যন্ত্র করেছিলেন সেখানে ন্যায্য রাস্তাটি প্রসারিত করে) তবে আমরা এর প্রভাবের কিছু দেখতে পাচ্ছি বৈকল্পিক উপর বিতরণ। চি-স্কোয়ার সিডিএফ এর বিপরীত দ্বারা এগুলি রূপান্তর করা সম্ভবত আরও বেশি শিক্ষামূলক,
যা সাধারণ ক্ষেত্রে অভিন্ন দেখায় (যেমনটি এটি হওয়া উচিত), টি-ক্ষেত্রে ক্ষেত্রে উপরের লেজের একটি বড় চূড়া থাকে (এবং নীচের লেজের মধ্যে একটি ছোট শীর্ষ) এবং ইউনিফর্ম ক্ষেত্রে আরও পাহাড়ের মতো তবে প্রশস্ত থাকে ০..6 থেকে ০.৮ এর কাছাকাছি শিখর এবং চূড়ান্ততার তুলনায় তাদের সম্ভাবনা অনেক কম থাকে যদি আমরা সাধারণ বিতরণ থেকে নমুনা নিই।
এর ফলে আমি পূর্বে বর্ণিত বৈকল্পিকের অনুপাতের বিতরণে প্রভাব ফেলব। আবার, লেজগুলির উপর প্রভাবটি দেখতে আমাদের দক্ষতার উন্নতি করতে (যা দেখতে পাওয়া শক্ত হতে পারে), আমি সিডিএফ এর বিপরীত দ্বারা রূপান্তরিত করেছি ( এফ9 , 9 বিতরণের ক্ষেত্রে এই ক্ষেত্রে ):
টি5
একটি সম্পূর্ণ অধ্যয়নের জন্য তদন্ত করার জন্য আরও অনেকগুলি মামলা রয়েছে তবে এটি অন্তত কীভাবে প্রভাবের দিক এবং দিকনির্দেশনা, সেইসাথে এটি কীভাবে উত্থিত হয় তার একটি ধারণা দেয়।