কেন যখন আমরা সাধারণভাবে বিতরণ করা ত্রুটিগুলি না করে আমাদের তাত্পর্যপূর্ণ বিবৃতিগুলির আপোষের বৈধতা পাই? আত্মবিশ্বাসের ব্যবধানগুলি কেন খুব প্রশস্ত বা সংকীর্ণ হবে?
সংখ্যার এবং ডিনোমিনিটারটি যেভাবে টি-স্ট্যাটিস্টিকসে বিতরণ করা হয় তার ভিত্তিতে আত্মবিশ্বাসের ব্যবধানগুলি নির্ভর করে।
সাধারণ তথ্য সহ টি-স্ট্যাটিস্টিকের সংখ্যার একটি সাধারণ বিতরণ থাকে এবং ডিনোমিনেটরের বর্গের বিতরণ হয় (যা তখন একটি বৈকল্পিক) চি-স্কোয়ার বিতরণের একটি বিশেষ গুণক। যখন অঙ্ক এবং ডিনোমিনিটরটিও স্বতন্ত্র থাকে (পর্যবেক্ষণগুলি স্বতন্ত্র হয়ে থাকে তবে সাধারণ তথ্য হিসাবে এটিই হবে), পুরো পরিসংখ্যানটির টি-বিতরণ থাকে।
এর অর্থ হ'ল t মতো টি-স্ট্যাটিস্টিক একটি মূল পরিমাণ হবে (এর বিতরণটি সত্য slালের সহগ কী তার উপর নির্ভর করে না, এবং এটি অজানা ) এর একটি ফাংশন , যা আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করার জন্য এটি উপযুক্ত করে তোলে ... এবং এই বিরতিগুলি তারপরে কাঙ্ক্ষিত কাভারেজ পেতে তাদের নির্মাণে কোয়ান্টাইলগুলি ব্যবহার করবে ।β^- βগুলিβ^βটি
যদি ডেটা অন্য কোনও বিতরণের থেকে থাকে তবে পরিসংখ্যানটির টি-বিতরণ হবে না। উদাহরণস্বরূপ, যদি এটি ভারী লেজযুক্ত থাকে তবে টি-বিতরণটি কিছুটা হালকা লেজযুক্ত হয়ে থাকে (বাহ্যিক পর্যবেক্ষণগুলি সংখ্যার চেয়ে ডিনোমিনিটারকে বেশি প্রভাবিত করে)। এখানে একটি উদাহরণ। উভয় ক্ষেত্রেই, হিস্টোগ্রামটি 10,000 রিগ্রেশনের জন্য:
বামদিকে হিস্টোগ্রামটি যখন ডেটা শর্তাধীনভাবে হয় স্বাভাবিক, এন = 30 (এবং যেখানে এই ক্ষেত্রে, ) for বিতরণটি যেমনটি দেখায় তেমন দেখাচ্ছে। ডান দিকের হিস্টোগোসটি সেই ক্ষেত্রে হয় যখন শর্তাধীন বিতরণটি সঠিকভাবে স্কিউড এবং ভারী-লেজযুক্ত থাকে এবং হিস্টোগ্রামের বাইরে খুব কম মান দেখা যায় - বিতরণটি সাধারণ ডেটার জন্য তাত্ত্বিক বিতরণের মতো নয়, কারণ পরিসংখ্যানটির আর টি-বিতরণ নেই।β= 0( - ২ , ২ )
একটি 95% টি-আন্তঃকাল (যা আমাদের নমুনায় 95ালু 95% অন্তর্ভুক্ত করা উচিত) -2.048 থেকে 2.048 পর্যন্ত চলে 48 সাধারণ তথ্যের জন্য, এটি আসলে 10000 নমুনা ofালের 95.15% অন্তর্ভুক্ত। স্কিউড ডেটার জন্য এটিতে 99.91% অন্তর্ভুক্ত রয়েছে।