নমুনা মিডিয়ানদের জন্য কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য


54

যদি আমি একই বন্টন থেকে অঙ্কিত পর্যাপ্ত পরিমাণে পর্যবেক্ষণের মাঝারিটি গণনা করি, তবে কেন্দ্রীয় সীমাবদ্ধতাটি কি মধ্যযুগীয়দের বন্টনকে প্রায় কোনও সাধারণ বন্টনকে আনুমানিক বলবে? আমার বোধগম্যতা যে প্রচুর পরিমাণে নমুনার মাধ্যমের সাথে এটি সত্য, তবে এটি মেডিয়ানদের ক্ষেত্রেও সত্য?

যদি তা না হয়, স্যাম্পল মিডিয়ানদের অন্তর্নিহিত বিতরণ কী?


9
আপনার কিছু নিয়মিততার শর্ত প্রয়োজন যাতে সীমা সীমাবদ্ধতায় পুনরুদ্ধারের অধীনে মধ্যমদের একটি সাধারণ বিতরণ থাকে। তা দেখতে ভুল হয়ে যেতে পারে, পয়েন্ট একটি সসীম সংখ্যা, বলো, এর বেশী কোনো বন্টন বিবেচনা X উপর অভিন্ন {1,0,1}
কার্ডিনাল

5
নিয়মিততার শর্তাবলীর বিষয়ে: যদি অন্তর্নিহিত বিতরণটির ঘনত্ব থাকে যা (সত্য) মাঝারিতে পার্থক্যযোগ্য হয়, তবে নমুনা মধ্যকের একটি অ্যাসিম্পটোটিক স্বাভাবিক বিতরণ থাকবে যা ডেরাইভেটিভের উপর নির্ভর করে iance এটি স্বেচ্ছাচারিত পরিমাণের জন্য আরও সাধারণভাবে ধারণ করে।
কার্ডিনাল

6
@ কার্ডিনাল আমি বিশ্বাস করি আপনার অতিরিক্ত শর্তের প্রয়োজন: ঘনত্ব যখন দ্বিতীয় পার্থক্যযুক্ত হয়, মধ্যস্থে শূন্যের সমান হয় এবং সেখানে শূন্যের প্রথম ডেরাইভেটিভ থাকে, তবে নমুনা মিডিয়ানের অ্যাসিম্পটোটিক বিতরণ দ্বিপদী হবে।
whuber

4
@ শুভ: হ্যাঁ, যেহেতু ঘনত্ব (আমি অজান্তেই আগে বলেছি এটির উদ্বেগ নয়) একটি পারস্পরিক হিসাবে প্রকরণে প্রবেশ করে, সেই সময়ে ঘনত্বের মান অবশ্যই শূন্য হওয়া উচিত নয়। সেই শর্তটি বাদ দেওয়ার জন্য ক্ষমা চাই!
কার্ডিনাল

4
প্রাথমিক counterexamples কোনো বন্টন যে সম্ভাবনা নির্ধারণ ব্যবহার করে তৈরি করা যেতে পারে একটি বিরতি করতে ( - , μ ] এবং সম্ভাব্যতা 1 / 2 থেকে [ μ + + δ , ) যেখানে δ > 0 , যেমন একটি বের্নুলির যেমন ( 1 / 2 ) ( μ = 0 , δ = 1 )। নমুনা মিডিয়ানগুলি μ এর চেয়ে কম বা সমান হবে μ1/2(,μ]1/2[μ+δ,)δ>0,(1/2)μ=0,δ=1μহিসাবে প্রায়ই তারা এর চেয়ে বড় বা সমান হিসাবে মাঝারিটি ( μ , μ + δ ) বড় নমুনাগুলির জন্য 0 না পৌঁছানোর সুযোগটি কার্যকরভাবে সীমাবদ্ধ বিতরণে ( μ , μ + δ ) "ফাঁক" রেখে যায় - যা সম্ভবত তখন অস্বাভাবিক হবে, এটি কীভাবে মানসম্মত হয় তা বিবেচ্য নয়। μ+δ(μ,μ+δ)0(μ,μ+δ)
হোবার

উত্তর:


38

আপনি যদি সূচক ভেরিয়েবলের ক্ষেত্রে কাজ করেন (যেমন Zi=1 যদি Xix এবং অন্যথায় 0 ) তবে আপনি সরাসরি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি Z এর মাঝামাঝি ক্ষেত্রে প্রয়োগ করতে পারেন এবং ডেল্টা পদ্ধতিটি ব্যবহার করে এটিকে পরিবর্তন করুন FX1(Z¯) জন্য একটি অ্যাসিম্পটোটিক সাধারণ বিতরণ , যার ফলস্বরূপ আপনি X নির্দিষ্ট কোয়ান্টাইলগুলির জন্য অ্যাসিম্পটোটিক স্বাভাবিকতা পান ।

সুতরাং কেবল মধ্যমা নয়, চতুর্ভুজগুলি, 90 তম পার্সেন্টাইল, ... ইত্যাদি

ঢিলেঢালাভাবে, যদি আমরা বিষয়ে কথা বলছি q যথেষ্ট বৃহৎ নমুনা তম নমুনা সমাংশক, আমরা যে আনুমানিক একটি সাধারণ বন্টনের থাকবে মানে সঙ্গে পেতে q তম জনসংখ্যা সমাংশক xq এবং ভ্যারিয়েন্স q(1q)/(nfX(xq)2)

অত: পর মধ্যমা (জন্য q=1/2 ), ভালোই বড় নমুনা ভ্যারিয়েন্স প্রায় হতে হবে 1/(4nfX(μ~)2)

অবশ্যই ধরে রাখার পথে সমস্ত শর্তাদি আপনার অবশ্যই প্রয়োজন, সুতরাং এটি সমস্ত পরিস্থিতিতে কার্যকর হয় না, তবে ধারাবাহিক বিতরণের জন্য যেখানে জনসংখ্যার পরিমাণের ঘনত্ব ইতিবাচক এবং পার্থক্যযোগ্য, ইত্যাদি ...

তদ্ব্যতীত, এটি চূড়ান্ত কোয়ান্টাইলগুলিকে ধরে রাখে না, কারণ সিএলটি সেখানে লাথি দেয় না (জেডের গড় গড় অসম্পূর্ণভাবে স্বাভাবিক হবে না)। চরম মূল্যবোধের জন্য আপনার আলাদা তত্ত্বের প্রয়োজন।


সম্পাদনা: whuber সমালোচনা সঠিক; এটি x কাজ করবে যদি নমুনা মিডিয়ান না হয়ে জনসংখ্যার মাঝারি হন। আসলে সঠিকভাবে কাজ করার জন্য যুক্তিটি সংশোধন করা দরকার।


5
আমি মনে করি এই ব্যাখ্যার একটি যৌক্তিক অংশ অনুপস্থিত হতে পারে: নমুনা মিডিয়ান পেতে কোনও কীভাবে সূচক ব্যবহার করে ? দেখতে পাচ্ছি কিভাবে যখন হয় অন্তর্নিহিত মধ্যমা, নির্দেশক এক্স আমিএক্স কাজ করবে কিন্তু এই সূচক নেই না নমুনা মধ্যমা বা উহার ফাংশন সঙ্গে কাকতালীয়ভাবে। xXix
whuber

এক্স এর নির্দিষ্ট কোয়ান্টাইলের অ্যাসিপটোটিক স্বাভাবিকতা পেতে আপনি এ্যাসিম্পটিক সাধারণ বিতরণ থেকে কীভাবে যাবেন ? সম্পাদনা: আমি পেয়েছি, যে ¯ Z শতাংশের মান 0-100% হয়ে যায় সুতরাং কোয়ান্টাইল মানগুলি asyptotically স্বাভাবিকFX1(Z¯)Z¯
অ্যাডাম

48

মূল ধারণাটি হ'ল মিডিয়ানের নমুনা বন্টন বিতরণ ফাংশনের দিক থেকে প্রকাশ করা সহজ তবে মাঝারি মানের দিক থেকে প্রকাশ করা আরও জটিল। একবার যখন আমরা বুঝতে পারি যে বিতরণ ফাংশনটি কীভাবে সম্ভাব্যতা হিসাবে মানগুলি আবার প্রকাশ করতে পারে এবং আবার ফিরে আসে তখন মধ্যমটির সঠিক নমুনা বিতরণ পাওয়া সহজ । এটির মধ্যস্থতার নিকট বন্টনের ক্রিয়াকলাপের আচরণের একটি বিশদ বিশ্লেষণ প্রয়োজন যে এটি অসম্পূর্ণভাবে স্বাভাবিক।

(একই বিশ্লেষণটি কেবল মিডিয়ান নয়, কোনও কোয়ান্টাইলের নমুনা বিতরণের জন্য কাজ করে।)

আমি এই প্রকাশে কঠোর হওয়ার কোন প্রয়াস করব না, তবে আপনার যদি মনে করার মনোভাব থাকে তবে আমি দৃ manner়তার সাথে যথাযথভাবে ন্যায্য পদক্ষেপগুলিতে এটি সম্পাদন করব।


স্বজ্ঞা

এগুলি হ'ল পারমাণবিক গ্যাসের 70 টি পরমাণুযুক্ত একটি বক্সের স্ন্যাপশট:

চিত্র 1

প্রতিটি ছবিতে আমি একটি অবস্থান পেয়েছি, একটি লাল উল্লম্ব রেখা হিসাবে দেখানো হয়েছে, যা পরমাণুগুলি বাম (কালো বিন্দু হিসাবে আঁকা) এবং ডান (সাদা বিন্দু) এর মধ্যে দুটি সমান গ্রুপে বিভক্ত করে। এটি পজিশনের একটি মাঝারি : পরমাণুর 35 টি তার বামে এবং 35 টি তার ডানদিকে থাকে। মিডিয়ানরা পরিবর্তিত হয় কারণ পরমাণুগুলি বাক্সের চারপাশে এলোমেলোভাবে চলেছে।

আমরা এই মধ্যবর্তী অবস্থানের বিতরণে আগ্রহী। আমার পদ্ধতির বিপরীতে এই জাতীয় প্রশ্নের উত্তর দেওয়া হয়েছে: আসুন প্রথমে কোথাও একটি উল্লম্ব রেখা আঁকুন, অবস্থান এ বলুন । আধটি পরমাণু এক্স এর বামে এবং অর্ধেক তার ডানদিকে আসার কী সুযোগ ? বামে পরমাণুগুলিতে পৃথকভাবে এক্স বামে থাকার সম্ভাবনা ছিল । ডানদিকে পরমাণুগুলির স্বতন্ত্রভাবে ডানদিকে 1 - x হওয়ার সম্ভাবনা ছিল । ধরে নিচ্ছি যে তাদের অবস্থানগুলি পরিসংখ্যানগতভাবে স্বতন্ত্র, সম্ভাবনাগুলি বহুগুণ হয়ে যায়, x 35 ( 1 - x ) 35 দেয়xxx1xx35(1x)35এই বিশেষ কনফিগারেশন সুযোগ জন্য। At০ পরমাণুর বিভাজককে দুটি ৩৫- এলিমেন্ট টুকরোতে সমান কনফিগারেশন অর্জন করা যেতে পারে । এই জাতীয় সমস্ত বিভাজনের জন্য এই সংখ্যাগুলি যুক্ত করা একটি সুযোগ দেয়7035

Pr(x is a median)=Cxn/2(1x)n/2

যেখানে হল মোট পরমাণুর সংখ্যা এবং দুটি পরমাণু উপগোষ্ঠীতে পরমাণুর বিভাজনের সংখ্যার সাথে সমানুপাতিক ।সি এনnCn

এই সূত্রটি বিটার বিতরণ(n/2+1,n/2+1) হিসাবে মিডিয়ানের বিতরণ চিহ্নিত করে ।

এখন আরও জটিল আকারের একটি বাক্স বিবেচনা করুন:

চিত্র ২

আবারও মিডিয়ানদের ভিন্নতা রয়েছে। বাক্সটি কেন্দ্রের কাছাকাছি থাকায় সেখানে এর পরিমাণ খুব বেশি নেই: পরমাণুর বাম অর্ধেক অংশে দখল করা আয়তনের একটি সামান্য পরিবর্তন (আবার কালোগুলি) - বা, আমরা স্বীকারও করতে পারি, এলাকায় বাম হিসাবে এইগুলো দেখানো করুন - একটি অপেক্ষাকৃত বড় পরিবর্তন অনুরূপ আনুভূমিক অবস্থান মধ্যমা করুন। প্রকৃতপক্ষে, কারণ বাক্সের একটি ক্ষুদ্র অনুভূমিক অংশ দ্বারা বেষ্টিত অঞ্চলটি সেখানে উচ্চতার সমানুপাতিক , মধ্যবর্তীদের পরিবর্তনগুলি বাক্সের উচ্চতা দ্বারা বিভক্ত । এটি বর্গক্ষেত্র বাক্সের চেয়ে মিডিয়াকে এই বাক্সের জন্য আরও পরিবর্তনশীল করে তোলে কারণ এটি মাঝখানে অনেক কম।

সংক্ষেপে, যখন আমরা ক্ষেত্রের (বাম এবং ডানদিকে) মধ্যস্থতার অবস্থান পরিমাপ করি তখন মূল বিশ্লেষণ (বর্গাকার বাক্সের জন্য) অপরিবর্তিত থাকে stands বাক্সের আকৃতি কেবল বিতরণকে জটিল করে তোলে যদি আমরা মাঝারিটিকে এর অনুভূমিক অবস্থানের দিক থেকে পরিমাপ করার জন্য জোর করি। যখন আমরা এটি করি, অঞ্চল এবং অবস্থানের উপস্থাপনের মধ্যে সম্পর্কটি বাক্সের উচ্চতার সাথে বিপরীতভাবে সমানুপাতিক।

এই ছবিগুলি থেকে আরও শিখতে হবে। এটি স্পষ্ট যে কয়েকটি অণু (উভয়) বাক্সে থাকলে, এর বেশি সম্ভাবনা থাকে যেগুলির মধ্যে অর্ধেকটি দুর্ঘটনাক্রমে দূরে উভয় দিকে ক্লাস্টার বয়ে যেতে পারে। পরমাণুর সংখ্যা বাড়ার সাথে সাথে এ জাতীয় চরম ভারসাম্যহীনতার সম্ভাবনা হ্রাস পায়। এটি ট্র্যাক করার জন্য, আমি "মুভিগুলি" নিয়েছিলাম - 5000 ফ্রেমের দীর্ঘ ধারাবাহিক - ভরা বাঁকা বাক্সের জন্য , তারপরে , তারপরে এবং অবশেষে পরমাণু দিয়ে এবং মধ্যস্থদের লক্ষ করেছি। এখানে মধ্যবর্তী অবস্থানগুলির হিস্টোগ্রামগুলি রয়েছে:15 75 37531575375

চিত্র 3

স্পষ্টতই, পর্যাপ্ত পরিমাণে পরমাণুর জন্য, তাদের মধ্যম অবস্থানের বন্টনটি বেল-আকৃতির দেখতে শুরু করে এবং সংকীর্ণভাবে বৃদ্ধি পায়: এটি কেন্দ্রীয় সীমাবদ্ধ তাত্ত্বিক ফলাফলের মতো দেখায়, তাই না?


পরিমাণগত ফলাফল

"বাক্স" অবশ্যই কিছু বিতরণের সম্ভাব্যতা ঘনত্ব চিত্রিত করে: এর শীর্ষটি ঘনত্ব ফাংশন (পিডিএফ) এর গ্রাফ। সুতরাং অঞ্চলগুলি সম্ভাব্যতা উপস্থাপন করে। একটি বাক্সের মধ্যে এলোমেলোভাবে এবং স্বাধীনভাবে পয়েন্ট স্থাপন এবং তাদের অনুভূমিক অবস্থানগুলি পর্যবেক্ষণ করা বিতরণ থেকে একটি নমুনা আঁকার এক উপায়। ( প্রত্যাখ্যানের নমুনা নেওয়ার পেছনে এটিই ধারণা ))n

পরবর্তী চিত্র এই ধারণাগুলি সংযুক্ত করে।

চিত্র 4

এটি জটিল দেখায়, তবে এটি সত্যই সহজ। এখানে সম্পর্কিত চারটি প্লট রয়েছে:

  1. উপরের প্লটটি আকার এর একটি এলোমেলো নমুনা সহ একটি বিতরণের পিডিএফ দেখায় । মিডিয়ানের চেয়ে বেশি মানগুলি সাদা বিন্দু হিসাবে দেখানো হয়; কালো বিন্দু হিসাবে মিডিয়ানের চেয়ে কম মান। এটির জন্য একটি উল্লম্ব স্কেলের প্রয়োজন নেই কারণ আমরা জানি মোট অঞ্চলটি unityক্য।n

  2. মাঝের প্লটটি একই বিতরণের জন্য ক্রমবর্ধমান বিতরণ ফাংশন: এটি সম্ভাব্যতা বোঝাতে উচ্চতা ব্যবহার করে । এটি প্রথম প্লটের সাথে এর অনুভূমিক অক্ষটি ভাগ করে। এর উল্লম্ব অক্ষটি অবশ্যই থেকে যেতে হবে কারণ এটি সম্ভাবনার প্রতিনিধিত্ব করে।101

  3. বাম প্লটটি বোঝা যাচ্ছে পাশাপাশি পড়া: এটি বিটা বিতরণের পিডিএফ । এটি দেখায় যে বাক্সের মধ্যকটি কীভাবে পরিবর্তিত হবে, যখন মধ্যকটি মাঝের বাম এবং ডানদিকে (তার অনুভূমিক অবস্থানের পরিবর্তে পরিমাপের পরিবর্তে) অঞ্চলের ক্ষেত্রে পরিমাপ করা হয়। আমি এই পিডিএফ থেকে এলোমেলো পয়েন্ট আঁকছি, যেমনটি দেখানো হয়েছে এবং মূল সিডিএফের সাথে সম্পর্কিত জায়গাগুলিগুলিতে তাদের অনুভূমিক ড্যাশযুক্ত রেখার সাথে সংযুক্ত করেছি: এভাবেই ভলিউমগুলি (বামদিকে পরিমাপ করা হয়) পজিশনে রূপান্তরিত হয় (উপরের অংশের মধ্যবর্তী অংশে পরিমাপ করা হয়) , এবং নীচের গ্রাফিক্স)। এই পয়েন্টগুলির একটি প্রকৃতপক্ষে শীর্ষ প্লটে প্রদর্শিত মিডিয়ানের সাথে মিল; আমি এটি দেখতে একটি শক্ত উল্লম্ব রেখা আঁকছি।16(n/2+1,n/2+1)16

  4. নীচের প্লটটি হ'ল মিডিয়ানের নমুনা ঘনত্ব, এটির অনুভূমিক অবস্থান দ্বারা পরিমাপ করা। এটি অঞ্চল (বাম চক্রান্তে) অবস্থানে রূপান্তর করে প্রাপ্ত হয়। রূপান্তর সূত্রটি মূল সিডিএফের বিপরীত দ্বারা দেওয়া হয়: এটি কেবল বিপরীত সিডিএফের সংজ্ঞা ! (অন্য কথায়, সিডিএফ অবস্থানকে বামে রূপান্তরিত করে; বিপরীত সিডিএফ অঞ্চল থেকে অন্য স্থানে রূপান্তর করে।) আমি বাম প্লট থেকে র্যান্ডম পয়েন্টগুলি নীচের প্লটের অভ্যন্তরে র্যান্ডম পয়েন্টগুলিতে কীভাবে রূপান্তরিত করে তা দেখিয়ে উল্লম্ব ড্যাশযুক্ত রেখাগুলি প্লট করেছি I । পড়ার এই প্রক্রিয়াটি এবং তারপরে নীচে কীভাবে অঞ্চল থেকে পজিশনে যেতে হয় তা আমাদের জানায়।

যাক মূল বিতরণের সিডিএফ (মধ্যম চক্রান্ত) এবং হতে বিটা বিতরণের সিডিএফ। সুযোগ যে মধ্যমা কিছু অবস্থান বাঁদিকে এই ব্যবস্থার সবচেয়ে গুরত্বপূর্ণ জন্য , প্রথম ব্যবহার প্রাপ্ত এলাকায় বাঁদিকে বক্স-এ: এই হল নিজেই। বামে বিটা বিতরণ আমাদের সুযোগ বলে দেয় যে অর্ধেক পরমাণু এই ভলিউমের মধ্যেই থাকবে, : এটি মধ্যবর্তী অবস্থানের সিডিএফ । এর পিডিএফ সন্ধান করতে (নীচের চক্রান্তে প্রদর্শিত হিসাবে), ডেরাইভেটিভ নিন:FGxFxF(x)G(F(x))

ddxG(F(x))=G(F(x))F(x)=g(F(x))f(x)

যেখানে পিডিএফ (শীর্ষস্থানীয় প্লট) এবং হ'ল বিটা পিডিএফ (বাম প্লট)।fg

এটি কোনও অবিচ্ছিন্ন বিতরণের জন্য মধ্যম বিতরণের সঠিক সূত্র । (ব্যাখ্যায় কিছু যত্নের সাথে এটি যে কোনও বিতরণে প্রয়োগ করা যেতে পারে, অবিচ্ছিন্ন হোক বা না হোক।)


অ্যাসিম্পোটিক ফলাফল

যখন খুব বড় হয় এবং এর মিডিয়েনটিতে কোনও লাফ না থাকে, তখন নমুনার মাঝারিটি অবশ্যই বিতরণের সত্যিকারের মাঝারি এর কাছাকাছি থাকতে পারে । পূর্ববর্তী সূত্রে পিডিএফ ক্রমাগত is , এর নিকটবর্তী বলে ধরে দ্বারা প্রদত্ত এর মান থেকে খুব বেশি পরিবর্তন হবে না তদুপরি, এর মান থেকে সেখানে খুব বেশি পরিবর্তন ঘটবে না: প্রথম আদেশে,nFμfμ f(x)μ,f(μ).F

F(x)=F(μ+(xμ))F(μ)+F(μ)(xμ)=1/2+f(μ)(xμ).

সুতরাং, বড় হওয়ার সাথে সাথে একটি চির উন্নতির প্রায় সঙ্গেn

g(F(x))f(x)g(1/2+f(μ)(xμ))f(μ).

এটি কেবলমাত্র বিটা বিতরণের স্থান এবং স্কেলের এক শিফট। মাধ্যমে পুনরুদ্ধারটি এর পরিবর্তকটিকে দ্বারা ভাগ করবে (যা আরও ভাল ছিল নেনজারো!)। ঘটনাচক্রে, বিটার বিভিন্নতা খুব কাছাকাছি ।f(μ)f(μ)2(n/2+1,n/2+1)n/4

এই বিশ্লেষণটি ডেল্টা পদ্ধতির প্রয়োগ হিসাবে দেখা যেতে পারে ।

অবশেষে, বিটা বড় জন্য প্রায় সাধারণ । এটি দেখার অনেক উপায় আছে; সম্ভবত সবচেয়ে সহজ হ'ল এটির পিডিএফটির লগারিদমটি কাছাকাছি দেখতে :(n/2+1,n/2+1)n1/2

log(C(1/2+x)n/2(1/2x)n/2)=n2log(14x2)+C=C2nx2+O(x4).

(ধ্রুবক এবং কেবলমাত্র একক স্থানে মোট অঞ্চলকে স্বাভাবিক করে তোলেন)) মধ্যে তৃতীয় ক্রমের মাধ্যমে , এটি সহ সাধারণ পিডিএফ লগের সমান (এই যুক্তিটি পিডিএফের লগের পরিবর্তে বৈশিষ্ট্যযুক্ত বা কমুল্যান্ট উত্পন্ন ফাংশন ব্যবহার করে কঠোর করা হয়েছে made)CCx,1/(4n).

এটি পুরোপুরি রেখে, আমরা এটি শেষ করি

  • নমুনা মিডিয়ানের বিতরণে প্রায় ,1/(4nf(μ)2)

  • এবং এটি বৃহত্তর পক্ষে প্রায় সাধারণ ,n

  • সমস্ত সরবরাহিত পিডিএফ অবিরত এবং মিডিয়েন মিউতে ননজারোfμ.


আমি 4 র্থ চিত্র পছন্দ করি। আপনি কি এটি আর ব্যবহার করে তৈরি করেছেন?
এংগ্রস্টুডেন্ট

@Engr আমি সম্ভবত এটা পছন্দ এক তৈরি করা থাকতে পারে R, হয়তো ব্যবহার layout, কিন্তু আসলে এটা দিয়ে করা হয়েছিল ম্যাথামেটিকাল 9.
whuber

1
'এটি সৌন্দর্যের জিনিস।
এনগ্রিস্টুডেন্ট

@ কে বিটা (এন / 2 + 1, এন / 2 + 1) বিটা (1,1) এর অধীনে নয়? উদাহরণস্বরূপ @.pt
টিম

1
@ টিম আমি পূর্বের রেফারেন্সটির প্রাসঙ্গিকতা বুঝতে পারি না, তবে আমি আপনাকে চিহ্নিত করে প্রশংসা করি যে "অন্তর্দৃষ্টি" বিভাগে চিহ্নিত বিটা বিতরণের সঠিক নাম বিটা । আমি যেখানেই এটি সংশোধন করব (যা আলোচনার বিভিন্ন স্থানে রয়েছে)। (n/2+1,n/2+1)
whuber

18

@EngrStudent উত্তর আলোকজ্জ্বল আমাদের বলে যে, আমরা আশা করতে পারে ভিন্ন ফলাফল যখন বন্টন হয় ক্রমাগত , এবং যখন এটা বিযুক্ত ( "লাল" গ্রাফ, যেখানে নমুনা মধ্যমা এর মধ্যে asymptotic বন্টন দর্শনীয়ভাবেই ব্যর্থ স্বাভাবিক মত দেখুন, ডিস্ট্রিবিউশন বাইনমিয়াল মিলা (3), জ্যামিতিক (11), হাইপারজমেট্রিক (12), নেতিবাচক দ্বিপদী (14), পইসন (18), স্বতন্ত্র ইউনিফর্ম (22)।

এবং প্রকৃতপক্ষে এই ক্ষেত্রে। বিতরণটি জটিল হলে জিনিসগুলি জটিল হয়ে যায়। আমি নিখুঁত ধারাবাহিক মামলার প্রমাণ সরবরাহ করব, মূলত @ Glen_b দ্বারা ইতিমধ্যে প্রদত্ত উত্তরটি বিশদ বিবরণের চেয়ে আরও কিছু না করে, এবং তারপরে বিতরণটি বিচ্ছিন্ন হলে কী ঘটে তা নিয়ে আমি একটু আলোচনা করব, ডাইভিংয়ে আগ্রহী যে কারও জন্য সাম্প্রতিক রেফারেন্স সরবরাহ করব হবে।

কোনোরকম একটানা বিতরণ
IID একটি সংগ্রহ বিবেচনা একেবারে একটানা র্যান্ডম ভেরিয়েবল বিতরণের ফাংশনটি (সিডিএফ) সঙ্গে এবং ঘনত্ব ফাংশন । সংজ্ঞা যেখানে নির্দেশক ফাংশন। অতএব একটি , {X1,...Xn}FX(x)=P(Xix)FX(x)=fX(x)ZiI{Xix}I{}Zi

E(Zi)=E(I{Xix})=P(Xix)=FX(x),Var(Zi)=FX(x)[1FX(x)],i

যাক এই IID Bernoullis নমুনা গড়, সংশোধন করা হয়েছে জন্য সংজ্ঞায়িত হতে যেমন যার মানে কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রয়োগ হয় এবং আমাদের রয়েছেYn(x)x

Yn(x)=1ni=1nZi
E[Yn(x)]=FX(x),Var(Yn(x))=(1/n)FX(x)[1FX(x)]

n(Yn(x)FX(x))dN(0,FX(x)[1FX(x)])

মনে রাখবেন যে অভিজ্ঞতা অভিজ্ঞতা বিতরণ ফাংশন ব্যতীত অন্য কোনও নয়। "ডেল্টা পদ্ধতি" প্রয়োগ করে আমাদের কাছে রয়েছে যে আগ্রহের বিন্দুতে শূন্য-বিহীন সহ একটি অবিচ্ছিন্ন এবং ডিফারেনটেবল ফাংশন জন্য, আমরা পাইYn(x)=F^n(x)g(t)g(t)

n(g[F^n(x)]g[FX(x)])dN(0,FX(x)[1FX(x)](g[FX(x)])2)

এখন, যেখানে the বিপরীত ফাংশনটিকে বোঝায়। এটি একটি অবিচ্ছিন্ন এবং পার্থক্যযোগ্য ফাংশন (যেহেতু হয়), এবং আমাদের বিপরীত ফাংশন উপপাদ্য দ্বারাg(t)FX1(t),t(0,1)1FX(x)

g(t)=ddtFX1(t)=1fx(FX1(t))

- তে এই ফলাফলগুলি theোকাতে ডেল্টা-পদ্ধতিতে প্রাপ্ত অ্যাসিম্পটোটিক ফলাফলg

n(FX1(F^n(x))FX1(FX(x)))dN(0,FX(x)[1FX(x)][fx(FX1(FX(x)))]2)

এবং সরলকরণ,

n(FX1(F^n(x))x)dN(0,FX(x)[1FX(x)][fx(x)]2)

.. যে কোনও নির্দিষ্ট । এখন জনসংখ্যার (সত্য) মধ্যম, সেট করুন । তারপরে আমাদের এবং উপরের সাধারণ ফলাফলটি আমাদের আগ্রহের ক্ষেত্রে হয়ে যায়,xx=mFX(m)=1/2

n(FX1(F^n(m))m)dN(0,1[2fx(m)]2)

তবে নমুনা মিডিয়ায় রূপান্তর । এই কারণFX1(F^n(m))m^

FX1(F^n(m))=inf{x:FX(x)F^n(m)}=inf{x:FX(x)1ni=1nI{Xim}}

বৈষম্যের ডান হাতটি রূপান্তর করে এবং সবচেয়ে ছোট যার জন্য শেষ পর্যন্ত , এটি নমুনা মাঝারি।1/2xFX1/2

সুতরাং আমরা প্রাপ্ত

n(m^m)dN(0,1[2fx(m)]2)
যা কেন্দ্রীয় একেবারে অবিচ্ছিন্ন বিতরণের জন্য নমুনা মিডিয়ানের জন্য উপপাদ্যকে সীমাবদ্ধ করুন।


বিতরণ বিচ্ছিন্নকরণ যখন বিতরণটি বিচ্ছিন্ন হয় (বা যখন নমুনায় সম্পর্ক থাকে) তখন যুক্তি দেওয়া হয় যে নমুনা কোয়ান্টাইলগুলির "ধ্রুপদী" সংজ্ঞা, এবং সেইজন্য মধ্যস্থতারও, তাত্ত্বিক ধারণাটি প্রথম স্থানে বিভ্রান্তিকর হতে পারে কোয়ান্টাইলগুলি দ্বারা কেউ মাপার চেষ্টা করে তা পরিমাপ করার জন্য ব্যবহৃত হয়।
যে কোনও ক্ষেত্রে এটি অনুকরণ করা হয়েছে যে এই শাস্ত্রীয় সংজ্ঞার অধীনে (আমরা সবাই জানি), নমুনা মধ্যকের asympotic বিতরণ অ-সাধারণ এবং একটি পৃথক বিতরণ।

নমুনা কোয়ান্টাইলগুলির বিকল্প সংজ্ঞা হ'ল "মধ্য-বিতরণ" ফাংশনের ধারণাটি ব্যবহার করে, যা হিসাবে সংজ্ঞায়িত করা হয়

Fmid(x)=P(Xx)12P(X=x)

মিড-ডিস্ট্রিবিউশন ফাংশনের ধারণার মাধ্যমে নমুনা কোয়ান্টাইলগুলির সংজ্ঞাটি একটি সাধারণীকরণ হিসাবে দেখা যায় যা বিশেষ ধরণের ক্রমাগত বিতরণকে অন্তর্ভুক্ত করতে পারে, তবে এটিও অবিচ্ছিন্ন নয় ones

অন্যান্য ফলাফলের সাথে পৃথক বিতরণের ক্ষেত্রেও এটি সন্ধান করা হয়েছে যে এই ধারণার মাধ্যমে সংজ্ঞায়িত নমুনা মিডিয়ানের একটি ... বিস্তারিত বর্ণিত বৈকল্পিক সহ একটি asyptotically স্বাভাবিক বিতরণ রয়েছে।

এর বেশিরভাগই সাম্প্রতিক ফলাফল। রেফারেন্সটি হ'ল মা, ওয়াই, জেন্টন, এমজি, এবং পারজেন, ই। (2011)। পৃথক বিতরণের নমুনা কোয়ান্টাইলগুলির অ্যাসিম্পটোটিক বৈশিষ্ট্য। পরিসংখ্যান গণিত ইনস্টিটিউট এর বার্তা, 63 (2), 227-243। , যেখানে কেউ পুরানো প্রাসঙ্গিক সাহিত্যের সাথে একটি আলোচনা এবং লিঙ্ক খুঁজে পেতে পারে।


2
(+1) নিবন্ধের জন্য। এটি একটি দুর্দান্ত উত্তর।
অ্যালেক্স উইলিয়ামস

আপনি দয়া করে ব্যাখ্যা করতে পারেন কেন নমুনা মিডিয়ান রূপান্তর করে ? FX1(F^n(m))m^
কাসা

আমি জানি যে , তবে আমি দেখতে পাচ্ছি না যে নমুনা মিডিয়ান কীভাবে সমানF^n(m)FX(m)m^FX1(F^n(m))
কাসা

1
@ কাসা আমি বিষয়টি সম্পর্কে কিছুটা ব্যাখ্যা করেছি।
অ্যালেকোস পাপাদোপল্লোস 25:58

আমি এটিকে আবার সামনে আনার জন্য দুঃখিত: তবে সবচেয়ে ছোট যার জন্য অবশেষে , জনসংখ্যা মধ্যম, নমুনা মাঝারি নয়, তাই না? xFX(x)1/2
কাসা

10

হ্যাঁ এটি কেবলমাত্র মধ্যস্থদের জন্য নয়, তবে কোনও নমুনা কোয়ান্টাইলের জন্য। এই কাগজটি অনুলিপি করছেন , ইউসিএলএর অধ্যাপক টিএস ফার্গুসন লিখেছেন (তাঁর পৃষ্ঠাটি এখানে রয়েছে ), যা আকর্ষণীয়ভাবে নমুনা গড় এবং নমুনা কোয়ান্টাইলের যৌথ বন্টন নিয়ে কাজ করে:

যাক বন্টন ফাংশন IID হতে , ঘনত্ব মানে এবং সসীম ভ্যারিয়েন্স । যাক দিন বোঝাতে এর -th সমাংশক , যাতে । ধরে নিন যে ঘনত্বের এ অবিচ্ছিন্ন এবং ধনাত্মক । যাক বোঝাতে নমুনা -th সমাংশক। তারপরX1,...,XnF(x)f(x)μσ20<p<1xppFF(xp)=pf(x)xpYn=X(n:np)p

n(Ynxp)dN(0,p(1p)/(f(xp))2)

জন্য (মধ্যমা), এবং আপনি মধ্যমা জন্য CLT আছে,p=1/2xp=m

n(Ynm)dN(0,[2f(m)]2)

1
খুশী হলাম। এটি উল্লেখ করার মতো যে নমুনাটির মধ্যবর্তীতার পরিমাণটি যেমন নমুনা বোঝায় তার পক্ষে অনুমান করা তত সহজ নয়।
মাইকেল এম

@ আলেকোস - আপনি এই প্রশ্নের জন্য দুটি উত্তর কীভাবে পেয়েছেন?
EngrStudent

1
@ এঞ্জারস্টুডেন্ট সিস্টেম এটির অনুমতি দেয়, এটি আপনাকে যাচাই করতে বলেছে যে আপনি সত্যই দ্বিতীয় উত্তর যুক্ত করতে চান।
আলেকোস পাপাদোপল্লোস

8

আমি গ্লেন_বি প্রদত্ত বিশ্লেষণাত্মক উত্তরটি পছন্দ করি। এটি একটি ভাল উত্তর।

এটি একটি ছবি প্রয়োজন। আমি ছবি পছন্দ করি

প্রশ্নের উত্তরের স্থিতিস্থাপকতার ক্ষেত্রগুলি এখানে:

  • বিশ্বে প্রচুর বিতরণ হয়। মাইলেজ পৃথক হতে পারে।
  • পর্যাপ্তর বিভিন্ন অর্থ রয়েছে। কোনও তত্ত্বের প্রতি-উদাহরণের জন্য, কখনও কখনও "যথেষ্ট" পূরণের জন্য একটি একক পাল্টা উদাহরণ প্রয়োজন। দ্বিপদী অনিশ্চয়তা শত শত বা হাজার হাজার নমুনা ব্যবহার করে স্বল্প ত্রুটি হারের বিক্ষোভের প্রয়োজন হতে পারে।

একটি স্ট্যান্ডার্ড স্বাভাবিকের জন্য আমি নিম্নলিখিত ম্যাটল্যাব কোডটি ব্যবহার করেছি:

mysamples=1000;

loops=10000;

y1=median(normrnd(0,1,mysamples,loops));

cdfplot(y1)

এবং আমি আউটপুট হিসাবে নিম্নলিখিত প্লট পেয়েছি:

এখানে চিত্র বর্ণনা লিখুন

তাহলে প্রোব-প্লট (যেখানে সরলরেখার অর্থ খুব স্বাভাবিক-মত) ব্যবহার করা ব্যতীত অন্য 22 বা এতগুলি "বিল্ট-ইন" বিতরণগুলির জন্য কেন এটি করবেন না?

এখানে চিত্র বর্ণনা লিখুন

এবং এটির জন্য উত্স কোডটি এখানে রয়েছে:

mysamples=1000;

loops=600;

y=zeros(loops,23);

y(:,1)=median(random('Normal', 0,1,mysamples,loops));

y(:,2)=median(random('beta', 5,0.2,mysamples,loops));
y(:,3)=median(random('bino', 10,0.5,mysamples,loops));
y(:,4)=median(random('chi2', 10,mysamples,loops));
y(:,5)=median(random('exp', 700,mysamples,loops));

y(:,6)=median(random('ev', 700,mysamples,loops));
y(:,7)=median(random('f', 5,3,mysamples,loops));
y(:,8)=median(random('gam', 10,5,mysamples,loops));
y(:,9)=median(random('gev', 0.24, 1.17, 5.8,mysamples,loops));
y(:,10)=median(random('gp', 0.12, 0.81,mysamples,loops));

y(:,11)=median(random('geo', 0.03,mysamples,loops));
y(:,12)=median(random('hyge', 1000,50,20,mysamples,loops));
y(:,13)=median(random('logn', log(20000),1.0,mysamples,loops));
y(:,14)=median(random('nbin', 2,0.11,mysamples,loops));
y(:,15)=median(random('ncf', 5,20,10,mysamples,loops));

y(:,16)=median(random('nct', 10,1,mysamples,loops));
y(:,17)=median(random('ncx2', 4,2,mysamples,loops));
y(:,18)=median(random('poiss', 5,mysamples,loops));
y(:,19)=median(random('rayl', 0.5,mysamples,loops));
y(:,20)=median(random('t', 5,mysamples,loops));

y(:,21)=median(random('unif',0,1,mysamples,loops));
y(:,22)=median(random('unid', 5,mysamples,loops));
y(:,23)=median(random('wbl', 0.5,2,mysamples,loops));


figure(1); clf
hold on

for i=2:23
    subplot(4,6,i-1)

    probplot(y(:,i))
    title(['Probplot of ' num2str(i)])
    axis tight

    if not(isempty(find(i==[3,11,12,14,18,22])))
        set(gca,'Color','r')
    end

end

আমি যখন বিশ্লেষণাত্মক প্রমাণটি দেখি তখন মনে হতে পারে "তত্ত্বের সাথে তারা সকলে ফিট থাকতে পারে" তবে আমি যখন চেষ্টা করে দেখি তখন আমি মেজাজকে বলতে পারি "এমন অনেকগুলি উপায় রয়েছে যা এটি এত ভালভাবে কাজ করে না, প্রায়শই বিচ্ছিন্ন বা অত্যন্ত বাধা জড়িত ving মানগুলি "এবং এটি আমাকে অর্থ ব্যয়ের যে কোনও ক্ষেত্রে তত্ত্বটি প্রয়োগ করতে আরও সতর্ক হতে চায়।

শুভকামনা।


আমি কি ভুল বা যে বিতরণের জন্য মিডিয়ান সাধারণত বিতরণ করা হয় না তা বিযুক্ত?
SEF
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.