কেন সাধারণভাবে বিতরণ করা ত্রুটিগুলি আমাদের তাত্পর্যপূর্ণ বিবৃতিগুলির বৈধতার সাথে আপস করে?


10

ওএলএস মডেলগুলি বিবেচনা করার ক্ষেত্রে একটি স্বাভাবিকতা অনুমান হয় এবং ত্রুটিগুলি সাধারণত বিতরণ করা হয়। আমি ক্রস যাচাইকরণের মাধ্যমে ব্রাউজ করে চলেছি এবং মনে হচ্ছে ত্রুটিগুলি স্বাভাবিক হওয়ার জন্য ওয়াই এবং এক্স এর স্বাভাবিক ক্রম হওয়া উচিত নয়। আমার প্রশ্ন হ'ল যখন আমাদের অ-সাধারণভাবে বিতরণ করা ত্রুটিগুলি থাকে তখন আমাদের তাত্পর্যপূর্ণ বিবৃতিগুলির আপোষের বৈধতা কেন হয়? আত্মবিশ্বাসের ব্যবধানগুলি কেন খুব প্রশস্ত বা সংকীর্ণ হবে?

উত্তর:


9

কেন যখন আমরা সাধারণভাবে বিতরণ করা ত্রুটিগুলি না করে আমাদের তাত্পর্যপূর্ণ বিবৃতিগুলির আপোষের বৈধতা পাই? আত্মবিশ্বাসের ব্যবধানগুলি কেন খুব প্রশস্ত বা সংকীর্ণ হবে?

সংখ্যার এবং ডিনোমিনিটারটি যেভাবে টি-স্ট্যাটিস্টিকসে বিতরণ করা হয় তার ভিত্তিতে আত্মবিশ্বাসের ব্যবধানগুলি নির্ভর করে।

সাধারণ তথ্য সহ টি-স্ট্যাটিস্টিকের সংখ্যার একটি সাধারণ বিতরণ থাকে এবং ডিনোমিনেটরের বর্গের বিতরণ হয় (যা তখন একটি বৈকল্পিক) চি-স্কোয়ার বিতরণের একটি বিশেষ গুণক। যখন অঙ্ক এবং ডিনোমিনিটরটিও স্বতন্ত্র থাকে (পর্যবেক্ষণগুলি স্বতন্ত্র হয়ে থাকে তবে সাধারণ তথ্য হিসাবে এটিই হবে), পুরো পরিসংখ্যানটির টি-বিতরণ থাকে।

এর অর্থ হ'ল t মতো টি-স্ট্যাটিস্টিক একটি মূল পরিমাণ হবে (এর বিতরণটি সত্য slালের সহগ কী তার উপর নির্ভর করে না, এবং এটি অজানা ) এর একটি ফাংশন , যা আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করার জন্য এটি উপযুক্ত করে তোলে ... এবং এই বিরতিগুলি তারপরে কাঙ্ক্ষিত কাভারেজ পেতে তাদের নির্মাণে কোয়ান্টাইলগুলি ব্যবহার করবে ।β^-βগুলিβ^βটি

যদি ডেটা অন্য কোনও বিতরণের থেকে থাকে তবে পরিসংখ্যানটির টি-বিতরণ হবে না। উদাহরণস্বরূপ, যদি এটি ভারী লেজযুক্ত থাকে তবে টি-বিতরণটি কিছুটা হালকা লেজযুক্ত হয়ে থাকে (বাহ্যিক পর্যবেক্ষণগুলি সংখ্যার চেয়ে ডিনোমিনিটারকে বেশি প্রভাবিত করে)। এখানে একটি উদাহরণ। উভয় ক্ষেত্রেই, হিস্টোগ্রামটি 10,000 রিগ্রেশনের জন্য:

এখানে চিত্র বর্ণনা লিখুন

বামদিকে হিস্টোগ্রামটি যখন ডেটা শর্তাধীনভাবে হয় স্বাভাবিক, এন = 30 (এবং যেখানে এই ক্ষেত্রে, ) for বিতরণটি যেমনটি দেখায় তেমন দেখাচ্ছে। ডান দিকের হিস্টোগোসটি সেই ক্ষেত্রে হয় যখন শর্তাধীন বিতরণটি সঠিকভাবে স্কিউড এবং ভারী-লেজযুক্ত থাকে এবং হিস্টোগ্রামের বাইরে খুব কম মান দেখা যায় - বিতরণটি সাধারণ ডেটার জন্য তাত্ত্বিক বিতরণের মতো নয়, কারণ পরিসংখ্যানটির আর টি-বিতরণ নেই।β=0(-2,2)

একটি 95% টি-আন্তঃকাল (যা আমাদের নমুনায় 95ালু 95% অন্তর্ভুক্ত করা উচিত) -2.048 থেকে 2.048 পর্যন্ত চলে 48 সাধারণ তথ্যের জন্য, এটি আসলে 10000 নমুনা ofালের 95.15% অন্তর্ভুক্ত। স্কিউড ডেটার জন্য এটিতে 99.91% অন্তর্ভুক্ত রয়েছে।


স্কিউড এবং ভারী-লেজযুক্ত সংস্করণে আপনি কোন বিতরণ ব্যবহার করেছেন?
গুং - মনিকা পুনরায়

2
টি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.