নমুনার আকার বৃদ্ধির সাথে কেন টি-বিতরণ আরও সাধারণ হয়ে যায়?


19

উইকিপিডিয়া অনুসারে, আমি বুঝতে পারি যে টি-বিতরণ হ'ল টি-মানের নমুনা বন্টন যখন নমুনাগুলি সাধারণভাবে বিতরণ করা জনগোষ্ঠীর আইড পর্যবেক্ষণ হয়। যাইহোক, আমি স্বজ্ঞাতভাবে বুঝতে পারি না যে এর কারণে কেন টি-বিতরণের আকারটি চর্বিযুক্ত লেজ থেকে প্রায় পুরোপুরি স্বাভাবিক হয়ে যায়।

আমি পেয়েছি আপনি যদি কোনও সাধারণ বিতরণ থেকে নমুনা নিচ্ছেন তবে আপনি যদি কোনও বড় নমুনা নেন তবে এটি সেই বিতরণের অনুরূপ হবে, তবে কেন এটি চর্বিযুক্ত লেজযুক্ত আকারের সাথে শুরু হয় তা পাই না।

উত্তর:


22

আমি একটি স্বজ্ঞাত ব্যাখ্যা দেওয়ার চেষ্টা করব।

টি-স্ট্যাটিস্টিক * এর একটি অংক এবং ডিনোমিনেটর রয়েছে। উদাহরণস্বরূপ, একটি নমুনা টি-টেস্টের পরিসংখ্যান

x¯μ0s/n

* (বেশ কয়েকটি রয়েছে, তবে আপনি যে বিষয়ে জিজ্ঞাসা করছেন তা কভার করার জন্য এই আলোচনা আশাবাদী যথেষ্ট সাধারণ হওয়া উচিত)

অনুমানের অধীনে, সংখ্যার গড় 0 এবং কিছু অজানা স্ট্যান্ডার্ড বিচ্যুতি সহ একটি সাধারণ বিতরণ থাকে।

অনুমানের একই সংখ্যার অধীনে ডিনোমিনিটরটি অঙ্কের বিতরণের মান বিচ্যুতির একটি অনুমান (সংখ্যার উপরে পরিসংখ্যানের স্ট্যান্ডার্ড ত্রুটি)। এটি সংখ্যার থেকে পৃথক। তার বর্গ একটি চি-বর্গক্ষেত্র দৈব চলক স্বাধীনতার তার ডিগ্রী (এটিও টি-বিতরণের df প্রয়োগ হয়) দ্বারা বিভক্ত গুণ বেশি ।σnumerator

যখন স্বাধীনতার ডিগ্রিগুলি ছোট হয়, ডিনোমিনেটরটি মোটামুটি ডান স্কিউ হয়ে থাকে। এটির গড়ের চেয়ে কম হওয়ার উচ্চ সম্ভাবনা রয়েছে, এবং বেশ ছোট হওয়ার তুলনামূলক ভাল সম্ভাবনা রয়েছে। একই সময়ে, এটির গড়ের চেয়ে অনেক বড় হওয়ার কিছুটা সুযোগও রয়েছে।

স্বাভাবিকতা অনুমানের অধীনে, অঙ্ক এবং ডিনোমিনেটর স্বতন্ত্র। সুতরাং আমরা যদি এই টি-স্ট্যাটিস্টিকের বিতরণ থেকে এলোমেলোভাবে আঁকি তবে আমাদের কাছে একটি স্বাভাবিক এলোমেলো সংখ্যা আছে যা এলোমেলোভাবে প্রায় 1 এর কাছাকাছি ডান-স্কিউ বিতরণ থেকে দ্বিতীয় এলোমেলোভাবে * বেছে নেওয়া মান দ্বারা বিভক্ত হয়।

* সাধারণ শব্দটি বিবেচনা না করেই

কারণ এটি ডিনোমিনেটরের উপর রয়েছে, ডিনোমিনেটর বিতরণের ছোট মানগুলি খুব বড় টি-মান তৈরি করে। ডিনোমিনেটরে ডান স্কিউ টি-স্ট্যাটিস্টিককে ভারী-লেজযুক্ত করে তোলে। বন্টন, যখন হর উপর টি-ডিস্ট্রিবিউশান আরো রুঢ়ভাবে হিসাবে একই স্ট্যানডার্ড ডেভিয়েশন সঙ্গে একটি স্বাভাবিকের চেয়ে শীর্ণ তোলে ডান লেজ টি

যাইহোক, স্বাধীনতার ডিগ্রি বড় হওয়ার সাথে সাথে, বিতরণটি আরও বেশি সাধারণ দেখায় এবং এর গড় প্রায় আরও "টাইট" হয়ে যায়।

এখানে চিত্র বর্ণনা লিখুন

যেমন, অংকের বন্টনের আকারে ডিনোমিনেটর দ্বারা বিভাজনের প্রভাব স্বাধীনতার ডিগ্রি বৃদ্ধির সাথে সাথে হ্রাস পায়।

অবশেষে - স্লুটস্কির উপপাদ্যটি আমাদের কাছে যেমনটি হতে পারে তার পরামর্শ হতে পারে - ডিনোমিনেটরের প্রভাব আরও বেশি ধ্রুবক দ্বারা বিভাজনের মতো হয়ে যায় এবং টি-স্ট্যাটিস্টিকের বিতরণ স্বাভাবিকের খুব কাছাকাছি হয়।


ডিনোমিনিটারের পারস্পরিক ক্রিয়াকলাপ হিসাবে বিবেচিত

হুবহু মন্তব্যগুলিতে পরামর্শ দিয়েছিলেন যে ডিনোমিনেটরের পারস্পরিক ক্রিয়াকলাপটি দেখার চেয়ে এটি আরও আলোকিত হতে পারে। এটি হ'ল আমরা আমাদের টি-পরিসংখ্যানগুলিকে অঙ্ক হিসাবে (সাধারণ) বার পারস্পরিক-ডিনোমিনেটর (ডান-স্কিউ) হিসাবে লিখতে পারি।

উদাহরণস্বরূপ, উপরে আমাদের এক-নমুনা-টি পরিসংখ্যান হয়ে উঠবে:

n(x¯μ0)1/s

Xiσx

n(x¯μ0)/σxσx/s

প্রথম শব্দটি স্ট্যান্ডার্ড স্বাভাবিক। দ্বিতীয় শব্দটি (একটি মাপকাটা বিপরীতমুখী-স্কোয়ার এলোমেলো ভেরিয়েবলের বর্গমূল) এরপরে যে মানগুলি 1 এর চেয়ে বড় বা ছোট, এটি "ছড়িয়ে দেওয়া" দ্বারা স্কেল করে।

স্বাভাবিকতা অনুমানের অধীনে, পণ্যটিতে দুটি পদ স্বতন্ত্র। সুতরাং আমরা যদি এই টি-স্ট্যাটিস্টিক বিতরণ থেকে এলোমেলোভাবে আঁকি তবে আমাদের ডান-স্কিউ বিতরণ থেকে একটি স্বাভাবিক এলোমেলো সংখ্যা (পণ্যটির প্রথম শব্দ) দ্বিতীয়বার এলোমেলোভাবে বেছে নেওয়া মান (সাধারণ শব্দটি বিবেচনা না করে) বার ' সাধারণত 'প্রায় 1।

যখন ডিএফটি বড় হয়, মানটি 1 এর খুব কাছাকাছি থাকে তবে যখন ডিএফ ছোট হয় তবে এটি বেশ স্কিউ হয় এবং বিস্তারটি বড় হয়, এই স্কেলিং ফ্যাক্টরের বড় ডান লেজটি লেজটিকে বেশ মোটা করে তোলে:

এখানে চিত্র বর্ণনা লিখুন


ধন্যবাদ! এটি অনেকটা স্পষ্ট করে দিয়েছে, তবে আমি এখনও এই বিষয়ে কিছুটা অনিশ্চিত ছিলাম "এর বর্গক্ষেত্রটি একটি চি-স্কোয়ারের এলোমেলো পরিবর্তনশীল যা এর ডিগ্রি দ্বারা বিভক্ত (এটি টি-বিতরণের ডিএফও হয়) সময় [সংখ্যার মানক বিচ্যুতি) "। আপনি কি তা উল্লেখ করেছেন কেবল এটি জানার জন্য দরকারী জিনিস হিসাবে বা এটি আমার প্রশ্নের উত্তরের প্রত্যক্ষ প্রাসঙ্গিকতার কিছু? আমি বুঝতে পারি যে এটি ডিনোমিনেটরের বর্গক্ষেত্রের বিতরণের বিপরীতে, যা আপনার চিত্রায় চিত্রিত হয়েছে।
ব্যবহারকারী1205901 - মনিকা

2
পরিসংখ্যাত বিতরণের স্বাভাবিকের চেয়ে গুরুতর-টেইলড হবে যদিও তা ছিল না বিশেষভাবে তার df প্রয়োগ একটি চি-বর্গক্ষেত্র বর্গমূল; এই অর্থে এটি সরাসরি ছেড়ে দেওয়ার উত্তরটি পরিবর্তন করে না। কিন্তু অন্তত এটা জন্য যেখানে scaled- একটি ব্যাখ্যা হিসেবে কাজ করে চি ডিস্ট্রিবিউশন চিত্রটি থেকে এসেছেন।
গ্লেন_বি

3
আমি ভাবছি নমুনা স্ট্যান্ডার্ড বিচ্যুতিটির পারস্পরিক সম্পর্কের ভিত্তিতে এই বিশ্লেষণ পরিচালনা করা কিছুটা আলোকিত হতে পারে । এটি যে যুক্তির সাথে মিলিয়েছে যে স্যাম্পল এসডি নমুনা অর্থের চেয়ে পৃথক (একটি মূল ধারণা যা কিছুটা বেশি জোর এবং ব্যাখ্যা দিয়ে উপকৃত হবে, আইএমএইচও), লোকেদের নমুনা এসডি দ্বারা বোঝায় যে নমুনার বিভাজনটি বোঝাতে হবে অন্যথায় কী সাধারণ বিতরণ হবে তা ছড়িয়ে দিন। (এটি অবশ্যই
গোসেটের

1
@ যেহেতু আমি পারস্পরিক বিচারের দিক থেকে এটি নিয়ে আলোচনা করার একটি অংশ যুক্ত করেছি, তবে মূল আলোচনাটিও ধরে রেখেছি (এটি আমার কাছে আরও প্রত্যক্ষ বলে মনে হয় তবে আমি প্রশংসা করি যে পারস্পরিক পারিশ্রমিকের দিক থেকে অনেক লোক এতে আরও বেশি কিছু পেতে পারে) । আমি স্বাধীনতার সাথেও কিছুটা যুক্ত করব
Glen_b -Rininstate মনিকা

1
s/nσ/ns/σσ/sσ

8

@ গ্লেেন_বি নমুনার আকার বৃদ্ধির সাথে টি স্ট্যাটিস্টিককে কেন আরও স্বাভাবিক দেখায় সে সম্পর্কে আপনাকে অন্তর্দৃষ্টি দিয়েছিল। আপনি ইতিমধ্যে পরিসংখ্যান বিতরণ পেয়েছি এখন, আমি আপনাকে মামলার জন্য আরও কিছু প্রযুক্তিগত ব্যাখ্যা দেব।

n1n

(1+x2n1)n/2n1B(n12,12).

এটা দেখা সম্ভব

1n1B(n12,12)12π,

এবং

(1+x2n1)n/2exp(x2/2),

n


2
1/n(1+(x/n)2)1tnস্বাধীনতার মাত্রা? এটি ক্রমটি কেন "চর্বিযুক্ত লেজযুক্ত আকারের সাথে শুরু হয়" তা জানতে চায়।
whuber

2
nn

2

আমি কেবল এমন কিছু ভাগ করতে চেয়েছিলাম যা আমার অন্তর্দৃষ্টিটিকে শিক্ষানবিশ হিসাবে সহায়তা করেছিল (যদিও এটি অন্যান্য উত্তরের চেয়ে কম কঠোর)।

Z,Z1,...,Zn

ZZ12+...+Zn2n

n

n1Zn

E[Z2]=1nZi2nZi2

nZ1=Z

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.