যখন নমুনা বড় হয় তখন কেন গড় অনুমান করতে টি-বিতরণ ব্যবহার করবেন না?


17

বুনিয়াদি পরিসংখ্যান কোর্সগুলি প্রায়শই যখন নমুনার আকার n বড় হয় (সাধারণত 30 বা 50 এর বেশি হয়) তখন জনসংখ্যার প্যারামিটারের গড় অনুমান করার জন্য একটি সাধারণ বিতরণ ব্যবহার করার পরামর্শ দেয় । শিক্ষার্থীর টি-বিতরণ নমুনার মানক বিচ্যুতির অনিশ্চয়তার জন্য অ্যাকাউন্টে ছোট ছোট নমুনা আকারের জন্য ব্যবহৃত হয়। যখন নমুনার আকারটি বড় হয়, তখন নমুনা স্ট্যান্ডার্ড বিচ্যুতি জনসংখ্যার মান বিচ্যুতি সম্পর্কে একটি ভাল তথ্য দেয়, একটি সাধারণ-বিতরণ অনুমানের অনুমতি দেয়। আমি তা পেয়েছি

আপনি যখন নিজের আত্মবিশ্বাসের ব্যবধানটি ঠিকঠাক পেতে পারেন তবে কেন একটি অনুমান ব্যবহার করবেন? নমুনা আকার নির্বিশেষে, সাধারণ বিতরণটি ব্যবহার করার কী দরকার যদি এটি টি-বিতরণের সাথে হুবহু পেতে পারে এমন কোনও কিছুর একটি অনুমান হয়?


@ গ্লেন_বি হ্যাঁ, এটি অন্তর অনুমানকারী হবে। এই অন্তরগুলি সম্পর্কে: "জনসংখ্যার মান বিচ্যুতি (σ) জানা না থাকলে এবং নমুনার আকার ছোট (এন <30)" (ওয়েব.পিডিএক্স.ইডু / এসটিপাকবি / থেকে ডাউনলোড / PA551 / NormalVersusTdistribution.doc)। জনসংখ্যার স্ট্যান্ডার্ড বিচ্যুতিটি জানা না থাকলেও লোকেরা কেন সমস্ত সময় টি-বিতরণ ব্যবহার করে না?
পার্টিনাএক্স

উত্তর:


15

কেবল শিরোনামের সাথে সম্পর্কিত বিষয়ে স্পষ্ট করতে আমরা টি-ডিস্ট্রিবিউশনটি গড়টি নির্ধারণ করতে (কমপক্ষে একটি বিন্দুর অনুমানের অর্থে) ব্যবহার করছি না, তবে এর জন্য একটি অন্তরাল তৈরি করতে চাইছি।

আপনি যখন নিজের আত্মবিশ্বাসের ব্যবধানটি ঠিকঠাক পেতে পারেন তবে কেন একটি অনুমান ব্যবহার করবেন?

এটি একটি ভাল প্রশ্ন (যতক্ষণ না আমরা 'ঠিক' নিয়ে খুব জেদ পাই না, যেহেতু একেবারে টি-বিতরণ করার অনুমানগুলি আসলে ধারণ করে না)।

"জনসংখ্যার স্ট্যান্ডার্ড বিচ্যুতি (σ) জানা না থাকলে এবং নমুনার আকার ছোট হলে (n <30)" সমস্যা সমাধানের সময় আপনাকে টি-বিতরণ টেবিলটি ব্যবহার করতে হবে "

জনসংখ্যার স্ট্যান্ডার্ড বিচ্যুতিটি জানা না থাকলেও লোকেরা কেন সমস্ত সময় টি-বিতরণ ব্যবহার করে না?

আমি পরামর্শটিকে সর্বোত্তম - সম্ভাব্য বিভ্রান্তিকর হিসাবে বিবেচনা করি। কিছু পরিস্থিতিতে, টি-ডিস্ট্রিবিউশনটি এখনও ব্যবহার করা উচিত যখন স্বাধীনতার ডিগ্রিগুলি এর চেয়ে ভাল ডিল হয়।

সাধারণ যেখানে যুক্তিসঙ্গত আনুমানিকতা বিভিন্ন জিনিস উপর নির্ভর করে (এবং তাই পরিস্থিতির উপর নির্ভর করে)। তবে, (কম্পিউটার সহ) যেহেতু কেবল t ব্যবহার করা মোটেই কঠিন নয় , এমনকি ডেফ খুব বড় হলেও, আপনাকে কেন আশ্চর্য করতে হবে যে এন = 30 এ কিছু আলাদা করার বিষয়ে কেন চিন্তা করার দরকার।

যদি নমুনার আকারগুলি সত্যিই বড় হয় তবে এটি একটি আত্মবিশ্বাসের ব্যবধানে একটি উল্লেখযোগ্য পার্থক্য তৈরি করবে না, তবে আমি মনে করি না এন = 30 সর্বদা 'সত্যই বড়' এর কাছাকাছি থাকে।


সেখানে এক পরিস্থিতিতে যেখানে এটি পরিবর্তে সাধারন ব্যবহার করতে জানার জন্য পারে t - এটি যখন আপনার ডেটা স্পষ্টভাবে টি-বিতরণ পাওয়ার শর্তগুলি পূরণ করে না, তবে আপনি এখনও গড়ের আনুমানিক স্বাভাবিকতার পক্ষে তর্ক করতে পারেন (যদি n বেশ বড়)। যাইহোক, এই পরিস্থিতিতে, প্রায়শই টি অনুশীলনে একটি ভাল অনুমান এবং এটি কিছুটা 'নিরাপদ' হতে পারে। [এরকম পরিস্থিতিতে আমি সিমুলেশন দিয়ে তদন্ত করতে আগ্রহী হতে পারি]]


2
আমি পড়তে কোথাও আছে এই নথিতে যে ভালো যখন α = 5 % । তবে আমি নিশ্চিত যে এটি যথেষ্ট। n=30α=5%
স্টাফেন লরেন্ট

1
@ স্টাফেনলরেন্ট বেশিরভাগ কারণে এটি 5% জরিমানা করা উচিত, তবে এই জাতীয় রায়গুলি পৃথক ব্যক্তির পক্ষে to এমন পরিস্থিতি রয়েছে - আমি আজ কেবলমাত্র একটির মুখোমুখি হয়েছি - যেখানে ত্রুটির মাত্রাটি পর্যাপ্ত হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

2
@ স্টাফেনলরেন্ট আপনি জনসন, ভিই (2013) এর কাছ থেকে কিছুটা শালীন অন্তর্দৃষ্টি পেতে পারেন। পরিসংখ্যানগত প্রমাণের জন্য সংশোধিত মানজাতীয় বিজ্ঞান একাডেমির কার্যক্রম , 110 (48): 19313–19317। এই নিবন্ধটি পোস্টটির সাথে খাপ খায় - কেন সর্বাধিক প্রকাশিত গবেষণামূলক গবেষণাগুলি গবেষণার মিথ্যা সমালোচনা ( এক বিজ্ঞান কীভাবে ভুল হয় )
আলেক্সিস

4
@ স্টাফেনলরেন্ট আপনার নিবন্ধটি আমার প্রশ্নের উত্তর দেয়। রেকর্ডের জন্য, এর উপসংহার একটি মোটামুটি অনুবাদ: "শিক্ষার্থীদের টি-বিতরণের সান্নিধ্য হিসাবে সাধারণ বিতরণের ব্যবহার কেবলমাত্র বিংশ শতাব্দীর প্রযুক্তিগত সীমাবদ্ধতার ফসল These এই সীমাবদ্ধতাগুলি আধুনিক পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার দিয়ে অদৃশ্য হয়ে গেছে, এবং এখন আর নেই is এই অ-রক্ষণশীল অনুমান ব্যবহারের কোনও কারণ "।
পার্টিনেক্স

2
@ থান্ডারচিম্প ক্যাভেট: যদি জনসংখ্যার বৈচিত্রটি জানা থাকে (যেমন জনসংখ্যার অনুপাতের অনুমান করা - দ্বৈতদৈর্ঘ্য পরিবর্তনশীলের গড়), তবে স্ট্যান্ডার্ড স্বাভাবিক ( জেড ), এবং টি বিতরণ উপযুক্ত নয়।
অ্যালেক্সিস

7

এটি একটি historicalতিহাসিক অ্যানক্রোনিজম। পরিসংখ্যান তাদের অনেক আছে।

আপনার যদি কম্পিউটার না থাকে তবে টি-বিতরণটি ব্যবহার করা শক্ত এবং সাধারণ বিতরণ ব্যবহার করা আরও সহজ। নমুনার আকার একবার বড় হয়ে গেলে, সেগুলি দুটি বিতরণ একই হয়ে যায় ('বৃহত্তর কত' বড় অন্য প্রশ্ন)।


1
এটি গভীর প্রশ্নের জন্য একটি অগভীর উত্তর বলে মনে হচ্ছে।
অ্যালেক্সিস

2
আপনি কি বোঝাতে চেয়েছেন তা নিশ্চিত না। আপনি কি কারণ মনে করেন না? (সর্বাধিক উত্সাহিত উত্তর একই পয়েন্টটি তৈরি করে - যদিও আরও স্পষ্ট এবং বিস্তৃতভাবে।)
জেরেমি মাইলস

1
আপনার উত্তর আমার কাছে পড়ার কারণে আমি হ্রাস পেয়েছি: কারণ ইতিহাস। আপনার প্রশ্নের সংক্ষিপ্ত পুনঃপঠন।
অ্যালেক্সিস

2
আমাকে জানানোর জন্য ধন্যবাদ - এটি একটি বেনাম ডাউনভোটের চেয়ে সুন্দর যেটির কারণ আমি জানতাম না।
জেরেমি মাইলস

3
Orতিহাসিকভাবে, টেবিলগুলিতে মানগুলি অনুসন্ধান করে এই বিতরণগুলির মধ্যে একটি "ব্যবহৃত" হয়েছিল। সাধারণ বিতরণ ব্যবহার করা সহজতর যে একমাত্র উপায়টি হ'ল স্বাধীনতার ডিগ্রিগুলির সাথে সম্পর্কিত কলামটি বেছে নিতে হবে না। এটি খুব কমই উদ্বেগের বিষয়। কি করেনি বই অত্যন্ত বড় হয়ে যাবে: সীমা ব্যবহার ছিল যে কিছু সময়ে এটি সামান্য জ্ঞান স্বাধীনতা বৃহৎ ডিগ্রী থেকে টেবিল প্রসারিত করে তোলে।
whuber

1

ex2n


1
যা মাপ আনুমানিক হিসাব সাংখ্যিক ত্রুটি না টি এটি ব্যবহার থেকে লাভ গুরুত্বে অতিক্রম করা?
জোনা

2
অবশ্যই আপনি নির্বিচারে নির্ভুলতার জন্য টি-মানগুলি গণনা করতে পারেন, এবং সেগুলি আপনি যে পরিমাণের সাথে তুলনা করছেন তার পরিমাণের মতো নির্ভুল হতে পারে।
নিল জি

"অন্য কথায়," সঠিক "টি-মান" নির্ভুল "নয়, এবং আনুমানিক ত্রুটির মধ্যে, মানটি সাধারণ মানের সিডিএফ মানের সমান" " আমি নিশ্চিত নই এটি আঙ্গুলের নির্ভরযোগ্য নিয়ম।
শ্যাডট্যালকার

2
এই উত্তরটি পয়েন্টটি মিস করে। উদাহরণস্বরূপ, ক্রমবর্ধমান সাধারণ বিতরণ এবং সংখ্যক শিক্ষার্থীদের টি বিতরণের মান-2 কেবলমাত্র নমুনার আকার ছাড়িয়ে গেলে ১ that তম উল্লেখযোগ্য চিত্রে (অর্থাৎ প্রায় দ্বিগুণ নির্ভুলতার জন্য) অবিচ্ছিন্ন হয়ে উঠুন 5,9325×1016। এটি সূচিত করে যে সংখ্যাগত ত্রুটি কোনও ব্যবহারিক সমস্যার ক্ষেত্রে সমস্যা নয় issue
হোবার

1
হুবহু, আপনি ঠিক বলেছেন। আমি "সংখ্যাসূচক ত্রুটি" ভুলভাবে ব্যবহার করেছি। আমি বোঝাচ্ছিলাম সমস্ত ত্রুটিগুলি পরিচালনা করে: সংখাগুলির সংখ্যাসমূহ, সীমাবদ্ধতার সাথে কাজ করার জন্য সংখ্যাসূচক ত্রুটি এবং কাটা কাটার কারণে সংখ্যাসূচক ত্রুটি। যদি কেউ অসীম নির্ভুলতার সাথে কাজ করতে পারে তবে টি-বিতরণকে সাধারণের সাথে প্রতিস্থাপনের কোনও যৌক্তিকতা থাকবে না
ভিক্টরজুরকোভস্কি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.