অনুমানগুলি অনির্বচনীয় কারণ তারা অনুমানের পরীক্ষার বৈশিষ্ট্যগুলিকে প্রভাবিত করে (এবং অন্তরগুলি) আপনি ব্যবহার করতে পারেন যার নলের অধীনে যার বিতরণ বৈশিষ্ট্যগুলি সেই অনুমানগুলির উপর নির্ভর করে গণনা করা হয়।
বিশেষত, হাইপোথিসিস পরীক্ষার জন্য, আমরা যে বিষয়গুলির বিষয়ে যত্ন নিতে পারি তা হ'ল আমরা যা চাই তা থেকে সত্য তাৎপর্য স্তরটি কতদূর হতে পারে এবং আগ্রহের বিকল্পগুলির বিরুদ্ধে শক্তি ভাল কিনা।
আপনি যে অনুমানগুলি সম্পর্কে জিজ্ঞাসা করেছেন সেগুলির সাথে সম্পর্কিত:
1. বৈচিত্রের সমতা
আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) এর প্রকরণটি ডিজাইনের প্রতিটি কক্ষে সমান হওয়া উচিত
এটি অবশ্যই তাৎপর্য স্তরে প্রভাব ফেলতে পারে, কমপক্ষে যখন নমুনার আকারগুলি অসম হয়।
(সম্পাদনা করুন) একটি আনোভা এফ-পরিসংখ্যান হ'ল বৈকল্পিকের দুটি অনুমানের অনুপাত (বিভাজনের বিভাজন এবং তুলনাকেই কেন এটি বৈকল্পিক বিশ্লেষণ বলা হয়)। ডিনোমিনেটরটি অনুমান-সাধারণ-থেকে-সমস্ত-কোষের ত্রুটির প্রকরণের অনুমান (অবশিষ্টগুলি থেকে গণনা করা হয়), তবে সংখ্যার পরিবর্তনের উপর ভিত্তি করে অঙ্কটির দুটি উপাদান থাকবে, একটি জনসংখ্যার পরিবর্তনের থেকে এবং একটি ত্রুটি বৈকল্পিক কারণে। যদি নালটি সত্য হয় তবে দুটি বৈকল্পিক যা অনুমান করা হচ্ছে তা একই হবে (সাধারণ ত্রুটির পরিবর্তনের দুটি অনুমান); এই সাধারণ তবে অজানা মানটি বাতিল হয়ে যায় (কারণ আমরা একটি অনুপাত নিয়েছি), একটি এফ-পরিসংখ্যান রেখে যা ত্রুটিগুলির বিতরণের উপর নির্ভর করে (যা অনুমানের অধীনে আমরা এফ বন্টন দেখাতে পারি। (অনুরূপ মন্তব্য টি-তে প্রযোজ্য আমি উদাহরণ হিসাবে পরীক্ষা ব্যবহার।)
[আমার উত্তরে এখানে সেই তথ্যের কিছুটা সম্পর্কে আরও কিছু বিশদ রয়েছে ]
তবে, এখানে দুটি জনসংখ্যার বৈকল্পিক দুটি ভিন্ন-আকারের নমুনাগুলির মধ্যে পৃথক। ডিনোনিয়েটর বিবেচনা করুন (আনোভাতে এফ-পরিসংখ্যান এবং একটি টি-টেস্টে টি-স্ট্যাটিস্টিকগুলির) - এটি দুটি ভিন্ন ভিন্ন অনুমানের সমন্বয়ে গঠিত, একটি নয়, সুতরাং এটির "ডান" বিতরণ থাকবে না (একটি ছোট আকারের চি -এফ এর ক্ষেত্রে স্কোয়ার এবং এর স্কোয়ার রুটের ক্ষেত্রে - আকার এবং স্কেল উভয়ই বিষয়)।
ফলস্বরূপ, এফ-পরিসংখ্যান বা টি-স্ট্যাটিস্টিকের আর এফ- বা টি-বিতরণ থাকবে না, তবে এটি যেভাবে প্রভাবিত হয়েছে তা বিভিন্ন বা বৃহত্তর ছোট নমুনাটি জনসংখ্যার সাথে আঁকা ছিল কিনা তার উপর নির্ভর করে is বৃহত্তর বৈকল্পিকতা। এটি পরিবর্তিতভাবে পি-মানগুলির বিতরণকে প্রভাবিত করে।
শূন্যের অধীনে (অর্থাত্ যখন জনসংখ্যার অর্থ সমান হয়), পি-মানগুলির বিতরণ সমানভাবে বিতরণ করা উচিত। তবে, যদি রূপগুলি এবং নমুনার আকারগুলি অসম হয় তবে উপায়গুলি সমান (তাই আমরা নালটিকে প্রত্যাখ্যান করতে চাই না), পি-মানগুলি সমানভাবে বিতরণ করা হয় না। কী ঘটে তা আপনাকে দেখানোর জন্য আমি একটি ছোট সিমুলেশন করেছি। এই ক্ষেত্রে, আমি মাত্র 2 টি গ্রুপ ব্যবহার করেছি যাতে আনোভা সমান বৈকল্পিক অনুমানের সাথে একটি দুটি-নমুনা টি-পরীক্ষার সমতুল্য। সুতরাং আমি দুটি সাধারণ বিতরণ থেকে নমুনাগুলি সমিত করেছিলাম যার মধ্যে একটি স্ট্যান্ডার্ড বিচ্যুতি সঙ্গে অন্যটির চেয়ে দশগুণ বড়, তবে সমান উপায়ে হয়।
বাম পাশের প্লটের জন্য, বৃহত্তর ( জনসংখ্যা ) স্ট্যান্ডার্ড বিচ্যুতিটি n = 5 এর জন্য এবং ছোট স্ট্যান্ডার্ড বিচ্যুতিটি n = 30 এর জন্য। ডান পাশের প্লটের জন্য বৃহত্তর স্ট্যান্ডার্ড বিচ্যুতি n = 30 এবং ছোট এন = 5 এর সাথে চলেছে। আমি প্রত্যেককে 10000 বার সিমুলেটেড করে প্রতিবার পি-মানটি পাই। প্রতিটি ক্ষেত্রে আপনি হিস্টোগ্রামটি সম্পূর্ণ সমতল (আয়তক্ষেত্রাকার) হতে চান, যেহেতু এর অর্থ সমস্ত তাত্পর্য কিছু তাত্পর্যপূর্ণ স্তরে পরিচালিত হয় আসলে সেই ধরণের প্রথম ত্রুটির হার পান। বিশেষত ধূসররেখার নিকটবর্তী থাকার জন্য হিস্টোগ্রামের বামতম অংশগুলি সবচেয়ে গুরুত্বপূর্ণ:α
যেমনটি আমরা দেখতে পাই, বাম দিকের প্লট (ছোট নমুনায় বৃহত্তর বৈচিত্র) পি-মানগুলি খুব ছোট থাকে - নালটি সত্য হলেও আমরা নাল অনুমানটি প্রায়শই প্রত্যাখ্যান করি (প্রায় উদাহরণ হিসাবে প্রায় অর্ধেক সময়) । এটি হ'ল আমাদের তাত্পর্য স্তরগুলি আমরা যা চেয়েছিলাম তার চেয়ে অনেক বড়। ডান পাশের প্লটটিতে আমরা দেখতে পাই পি-মানগুলি বেশিরভাগ বড় (এবং তাই আমাদের তাত্পর্য স্তরটি আমরা যা চেয়েছিলাম তার চেয়ে অনেক ছোট) - বাস্তবে দশ হাজার সিমুলেশনে একবারও আমরা 5% স্তরে প্রত্যাখ্যান করি নি (সবচেয়ে ক্ষুদ্রতম) পি-মান এখানে ছিল 0.055)। [এটি এমন খারাপ জিনিসের মতো নাও লাগতে পারে, যতক্ষণ না আমরা মনে রাখি যে আমাদের খুব কম তাত্পর্যপূর্ণ স্তরের সাথে যাওয়ার জন্য আমাদেরও খুব কম শক্তি থাকবে ]]
এটা বেশ পরিণতি। এই কারণে ওয়েলচ-স্যাটার্থওয়েট টাইপ টি-টেস্ট বা আনোভা ব্যবহার করা ভাল ধারণা যখন আমাদের কাছে ধারণা করার কোনও ভাল কারণ নেই যে বৈকল্পিকগুলি সমান হয়ে যাবে - তুলনা করে এটি এই পরিস্থিতিতে সবেই প্রভাবিত হয়েছে (I এই ক্ষেত্রেও সিমুলেটেড; সিমুলেটেড পি-ভ্যালুগুলির দুটি বিতরণ - যা আমি এখানে দেখাইনি - ফ্ল্যাটের খুব কাছাকাছি এসেছিল)।
২. প্রতিক্রিয়ার শর্তসাপেক্ষ বিতরণ (ডিভি)
আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) ডিজাইনের প্রতিটি কক্ষের জন্য সাধারণত বিতরণ করা উচিত
এটি কিছুটা কম সরাসরি সমালোচনামূলক - স্বাভাবিকতা থেকে পরিমিত বিচ্যুতির জন্য, তাত্পর্য স্তরটি বড় আকারের নমুনাগুলিতে এতটা প্রভাবিত হয় না (যদিও শক্তি হতে পারে!)।
এখানে একটি উদাহরণ রয়েছে, যেখানে মানগুলি তাত্ক্ষণিকভাবে বিতরণ করা হয় (অভিন্ন বিতরণ এবং নমুনা আকার সহ), যেখানে আমরা দেখতে পারি এই তাত্পর্য স্তর স্তরটি ছোট এ যথেষ্ট কিন্তু বড় এন দিয়ে হ্রাস করা ।nn
আমরা দেখতে পাই যে এন = 5 এ যথেষ্ট পরিমাণে খুব কম পি-ভ্যালু রয়েছে (5% পরীক্ষার জন্য তাত্পর্য স্তর এটি হওয়া উচিত প্রায় অর্ধেক হবে), তবে এন = 50 এ সমস্যা হ্রাস পেয়েছে - 5% এর জন্য এই ক্ষেত্রে পরীক্ষার প্রকৃত তাৎপর্য স্তরটি প্রায় 4.5%।
সুতরাং আমরা "ভাল, এটি ভাল," যদি এন এর তাত্পর্য স্তরটি খুব কাছাকাছি হওয়ার জন্য যথেষ্ট পরিমাণে "বলার জন্য প্রলুব্ধ হতে পারে তবে আমরা একটি শক্তির একটি ভাল চুক্তিও ফেলতে পারি। বিশেষত, এটি জানা যায় যে ব্যাপকভাবে ব্যবহৃত বিকল্পগুলির সাথে তুলনামূলকভাবে টি-টেস্টের অ্যাসেম্পটোটিক আপেক্ষিক দক্ষতা 0 এ যেতে পারে This এর অর্থ এটি হল যে আরও ভাল পরীক্ষার পছন্দগুলি এটি পেতে প্রয়োজনীয় নমুনা আকারের বর্ধনযোগ্য ছোট ভগ্নাংশের সাথে একই শক্তি পেতে পারে means টি-পরীক্ষা। বিকল্প পরীক্ষার সাথে আপনার যেমন প্রয়োজন তেমন শক্তির তুলনায় দ্বিগুণ ডেটা বলার চেয়ে সাধারণের বাইরে আপনার আর কিছু দরকার নেই - জনসংখ্যা বিতরণে স্বাভাবিকভাবে খুব কম ভারী - এবং মাঝারিভাবে বড় নমুনাগুলি এটি করার জন্য যথেষ্ট হতে পারে।
(বিতরণের অন্যান্য পছন্দগুলি তাত্পর্য স্তরটিকে তার চেয়ে বেশি উচ্চতর করতে পারে, বা আমরা এখানে যা দেখলাম তার চেয়ে যথেষ্ট কম করতে পারে))