কীসের জন্য (প্রতিসামগ্রী) বন্টন বলতে নমুনাটির চেয়ে বেশি নমুনা গড়ের তুলনায় আরও কার্যকর অনুমানক হয়?


17

আমি এই বিশ্বাসের অধীনে পরিশ্রম করেছি যে নমুনা মিডিয়ান মধ্য প্রবণতার চেয়ে বেশি দৃ rob়তর পরিমাপ, তার চেয়ে বেশি যেহেতু এটি বিদেশীদের অগ্রাহ্য করে। তাই আমি জানতে পেরে ( অন্য প্রশ্নের উত্তরে ) অবাক হয়েছি যে একটি সাধারণ বিতরণ থেকে প্রাপ্ত নমুনাগুলির জন্য, নমুনার গড়ের প্রকরণটি নমুনার মধ্যকের পরিবর্তনের চেয়ে কম (কমপক্ষে বড় n ) কম।

আমি গাণিতিকভাবে বুঝতে পারি কেন এটি সত্য। এটি দেখার কি কোনও "দার্শনিক" উপায় আছে যা অন্যান্য বিতরণের অর্থের পরিবর্তে মধ্যকটি কখন ব্যবহার করতে পারে সে সম্পর্কে অন্তর্দৃষ্টি দিয়ে সহায়তা করে?

এমন কোনও গাণিতিক সরঞ্জাম রয়েছে যা কোনও নির্দিষ্ট বিতরণের জন্য দ্রুত প্রশ্নের উত্তর দিতে সহায়তা করে?

উত্তর:


20

আসুন ধরে নেওয়া যাক আমরা প্রতিসাম্যিক বিতরণগুলিতে বিবেচনা সীমাবদ্ধ করি যেখানে গড় এবং প্রকরণটি সীমাবদ্ধ (সুতরাং কাচি, উদাহরণস্বরূপ, বিবেচনা থেকে বাদ দেওয়া হয়েছে)।

আরও, আমি প্রথমে নিজেকে একটানা ইউনিমোডাল কেসগুলিতে সীমাবদ্ধ করতে চলেছি, এবং প্রকৃতপক্ষে বেশিরভাগ ক্ষেত্রেই 'সুন্দর' পরিস্থিতিতে (যদিও পরে আমি ফিরে এসে অন্য কিছু ক্ষেত্রে আলোচনা করব)।

আপেক্ষিক প্রকরণটি নমুনার আকারের উপর নির্ভর করে। অ্যাসিপটোটিক বৈকল্পিকগুলির ( বার) অনুপাতের বিষয়ে আলোচনা করা সাধারণ , তবে আমাদের মনে রাখা উচিত যে ছোট নমুনা আকারে পরিস্থিতি কিছুটা আলাদা হবে। (মাঝারিটি মাঝেমধ্যে এর অ্যাসিপোটোটিক আচরণের চেয়ে মাঝারিটি লক্ষণীয়ভাবে আরও ভাল বা খারাপ আচরণ করে example উদাহরণস্বরূপ, সাধারণভাবে এন = 3 দিয়েnn=3 এটির দক্ষতা 63৩% এর পরিবর্তে প্রায় %৪%। অ্যাসিম্পটোটিক আচরণ সাধারণত বেশ মাঝারি ক্ষেত্রে একটি ভাল গাইড হয় is নমুনা আকার, যদিও।)

অ্যাসিম্পটোটিকগুলি মোকাবেলা করা মোটামুটি সহজ:

গড়: বৈকল্পিক = σ 2n×σ2

মিডিয়ান : ভেরিয়েন্স = 1n× যেখানে(এম)1[4f(m)2]f(m) হ'ল মাঝারিটির ঘনত্বের উচ্চতা।

সুতরাং যদি f(m)>12σ , মধ্যমা এসিম্পটোটিকভাবে আরও দক্ষ হতে হবে।

[সাধারণ ক্ষেত্রে, , তাই1f(m)=12πσ , যেহেতু2/as এরঅসম্পূর্ণ আপেক্ষিক দক্ষতাπ1[4f(m)2]=πσ222/π )]

আমরা দেখতে পাচ্ছি যে মধ্যকের বৈচিত্রটি খুব ঘনত্বের কেন্দ্রস্থলের আচরণের উপর নির্ভর করে, যখন গড়ের বৈচিত্রটি মূল বন্টনের বিভিন্নতার উপর নির্ভর করে (যা কিছুটা ক্ষেত্রে ঘনত্ব দ্বারা সর্বত্র প্রভাবিত হয় এবং বিশেষত, কেন্দ্র থেকে আরও দূরে আচরণের মাধ্যমে আরও)

যা বলা যায়, যদিও মিডিয়ান গড়ের তুলনায় বহিরাগতদের দ্বারা কম আক্রান্ত হয় এবং আমরা প্রায়শই দেখতে পাই যে বিতরণটি যখন ভারী লেজযুক্ত হয় (যা আরও বহিরাগত উত্পাদন করে) তখন এর গড়ের চেয়ে কম পার্থক্য থাকে, আসলে কী এর কার্যকারিতা চালায়? মিডিয়ান অন্তর্নিহিত হয় । এটি প্রায়শই ঘটে থাকে (একটি নির্দিষ্ট পরিবর্তনের জন্য) দুজনের একসাথে যাওয়ার প্রবণতা রয়েছে।

এটি হ'ল, মোটা কথা বলতে গেলে, লেজটি ভারী হওয়ার সাথে সাথে একই সময়ে "পিকিয়ার" পাওয়ার জন্য বিতরণের ( এর একটি নির্দিষ্ট মূল্যে ) বন্টন রয়েছে (আরও কুর্তোটিক, আলগা অর্থে)। এটি অবশ্য একটি নির্দিষ্ট জিনিস নয় - এটি সাধারণত বিবেচিত ঘনত্বগুলির বিস্তৃত পরিসর জুড়ে কেস হিসাবে দেখা যায়, তবে এটি সর্বদা ধারণ করে না। যখন এটি ধরে থাকে তখন মধ্যকের বৈচিত্র কমে আসবে (কারণ বিতরণের মধ্যকের আশেপাশের অঞ্চলে আরও সম্ভাবনা থাকে), যখন গড়ের বৈকল্পিক স্থির থাকে (কারণ আমরা σ 2 স্থির করেছিσ2σ2 )।

সুতরাং বিভিন্ন সাধারণ ক্ষেত্রে জুড়ে মাঝারি প্রায়শই লেজটি ভারী হওয়ার সময় গড়ের চেয়ে "ভাল" করার প্রবণতা পোষণ করে (তবে আমাদের অবশ্যই মনে রাখতে হবে এটি প্রতিরূপ উদাহরণগুলি তুলনামূলক তুলনামূলক সহজ)। সুতরাং আমরা কয়েকটি কেস বিবেচনা করতে পারি, যা আমরা প্রায়শই কী দেখি তা আমাদের দেখায়, তবে সেগুলিতে আমাদের খুব বেশি পড়া উচিত নয়, কারণ ভারী লেজ সর্বজনীনভাবে উচ্চতর শিখরে যায় না।

আমরা জানি মিডিয়ান প্রায় 63.7% দক্ষ হিসাবে ( এন এর জন্য)n বড়) স্বাভাবিক সময়ে গড় হিসাবে।

কি সম্পর্কে, একটি লজিস্টিক বিতরণ বলুন, যা সাধারণের মতো কেন্দ্রের প্রায় অনুরাগী, তবে ভারী লেজ থাকে ( এক্স হিসাবেx বড় হওয়ার সাথে সাথে তারা ঘৃণ্য হয়ে ওঠে)।

আমরা যদি স্কেলের মাপদণ্ড নিতে 1 হতে, লজিস্টিক ভ্যারিয়েন্স হয়েছে 1/4 মধ্যমা এবং উচ্চতা, তাই 1π2/3। ভেরিয়ানস অনুপাত তারপরπ2/120.82বৃহৎ নমুনা যাতে, মধ্যমা গড় দক্ষ হিসাবে মোটামুটিভাবে 82% হয়।14f(m)2=4π2/120.82

আসুন ঘাতক-জাতীয় লেজযুক্ত অন্য দুটি ঘনত্ব বিবেচনা করি তবে ভিন্ন শিখরতা।

প্রথমত, হাইপারবোলিক কর্তক ( ) বন্টনsech , যার জন্য মান আকারে কেন্দ্রে ভ্যারিয়েন্স 1 এবং উচ্চতা , সুতরাং অ্যাসিপটোটিক বৈকল্পিকের অনুপাত 1 (দুটি বড় নমুনায় সমান দক্ষ)। তবে, ছোট নমুনাগুলিতে গড়টি আরও দক্ষ হয় (উদাহরণস্বরূপn=5এর মধ্যকার ক্ষেত্রে এর পার্থক্য প্রায় 95% হয়)।12n=5

এখানে আমরা দেখতে পাচ্ছি যে, আমরা কীভাবে এই তিনটি ঘনত্বের মাধ্যমে অগ্রগতি করতে পারি (বৈকল্পিক ধ্রুবক ধারণ করে), যেটি মধ্যস্থতার উচ্চতা বৃদ্ধি করে:

এখানে চিত্র বর্ণনা লিখুন

আমরা কি আরও উঁচুতে যেতে পারি? আসলে আমরা পারি। উদাহরণস্বরূপ, দ্বিগুণ ক্ষয়কারী বিবেচনা করুন । স্ট্যান্ডার্ড ফর্মটির বৈকল্পিকতা 2 রয়েছে, এবং মধ্যস্থতার উচ্চতা (সুতরাং যদি আমরা চিত্রের মতো ইউনিট ভেরিয়েন্সে স্কেল করি তবে শীর্ষটি1 এ থাকে12 , ঠিক 0.7 এর উপরে)। মধ্যমাটির অ্যাসিম্পটোটিক বৈকল্পিক গড়ের চেয়ে অর্ধেক।12

যদি আমরা কোনও নির্দিষ্ট পরিবর্তনের জন্য বিতরণটিকে শীর্ষতর করে তুলি (সম্ভবত লেজটিকে তাত্পর্যমূলক তুলনায় আরও বেশি ভারী করে) তবে মিডিয়ান এখনও আরও দক্ষ (তুলনামূলকভাবে কথা বলা) হতে পারে be সেই চূড়াটি কতটা উঁচুতে যেতে পারে তার সত্যিকারের কোনও সীমা নেই।

ν=5

...

সীমাবদ্ধ নমুনার আকারে, মাঝারি বিতরণের বিভিন্নতার স্পষ্টরূপে গণনা করা কখনও কখনও সম্ভব। যেখানে এটি সম্ভবপর নয় - বা এমনকি কেবল অসুবিধাগুলিও - আমরা বিতরণ থেকে আঁকা এলোমেলো নমুনাগুলি জুড়ে মিডিয়েনটির বিভিন্নতা (বা প্রকরণের অনুপাত *) গণনা করতে সিমুলেশনটি ব্যবহার করতে পারি (যা আমি উপরে ছোট ছোট নমুনার চিত্রগুলি পেতে পেতে পারি )।

* যদিও আমাদের প্রায়শই বাস্তবে গড়ের বৈচিত্রের প্রয়োজন হয় না, যেহেতু আমরা যদি বিতরণের বিভিন্নতা জানি তবে আমরা এটি গণনা করতে পারি, এটি নিয়ন্ত্রণের চেয়ে আরও কার্যকর হতে পারে, কারণ এটি একটি নিয়ন্ত্রণের পরিবর্তনের মতো কাজ করে (গড়টি) এবং মিডিয়ান প্রায়শই বেশিরভাগ সম্পর্কযুক্ত হয়)।


1

(এক্স)=12-|এক্স-μ|,-<এক্স<
যার প্রত্যাশা রয়েছে μ এবং বৈকল্পিক 2. চলুন এক্স1,এক্স2,...,এক্সএনএকটি আইড নমুনা হতে। তারপরে বড় নমুনাগুলির জন্য পাটিগণিতের গড়ের বিস্তৃতি (সঠিক) সহ একটি সাধারণ বিতরণ হবে (প্রায়)2/এন, যদিও মধ্যমাটির বৈকল্পিকতার সাথে একটি এ্যাসিম্পটিক স্বাভাবিক বিতরণ থাকবে 14এন(μ)2=14এন/4=1/এন<2/এনসুতরাং পার্থক্য বরং বড়।

সাধারণ বিতরণের জন্য (সাথে σ2=1) আমরা বিপরীত তুলনা পাই, পাটিগণিতের গড়ের বৈচিত্র রয়েছে (সঠিক) 1/এন মিডিয়ায় বৈচিত্র রয়েছে (প্রায়, বৃহত্তর) এন) 14এন(1/2π)2=π2এন1.57/এন>1/এন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.