একই অর্থ, ভিন্ন ভিন্নতা


14

মনে করুন আপনার আটজন রানার রেস চালাচ্ছেন; বলুন যে তাদের পৃথক রান সময়গুলির বিতরণ সাধারণ এবং প্রতিটিটির অর্থ 11 সেকেন্ড। রানার একের স্ট্যান্ডার্ড বিচ্যুতিটি হ'ল ক্ষুদ্রতম, দ্বিতীয় দ্বিতীয় বৃহত্তম, তৃতীয় বৃহত্তম, ইত্যাদি, এবং আটটি বৃহত্তম। দুটি প্রশ্ন আমাকে বিভ্রান্ত করছে: (1) প্রথমটি সর্বশেষকে পরাজিত করার সম্ভাবনা কী এবং (২) দৌড় প্রতিযোগিতায় সবচেয়ে বেশি সম্ভাবনা রয়েছে?

আমার উত্তর 1/2 এবং 8 যথাক্রমে। তারা একই গড়, সম্ভাব্যতা ভাগ যেহেতু x¯1x¯8<0 ঠিক হয় 1/2 কোন? আমি কীভাবে দ্বিতীয় অংশটি কঠোরভাবে প্রদর্শন করতে পারি, এবং জয়ের সঠিক সম্ভাবনা গণনা করতে পারি? আগাম ধন্যবাদ.


1
@ সিলভারফিশ প্রথমে (র্যান্ডম ভেরিয়েবল হিসাবে মডেল করা ) শেষ ( এক্স এন , এক্স 1 এর স্বতন্ত্র ধরে নেওয়া ) তুলনা করার ক্ষেত্রে আমাদের কেবল জেড = এক্স 1 - এক্স এন বিবেচনা করতে হবে । এটির শূন্য গড় সহ একটি প্রতিসম ধারাবাহিক বিতরণ রয়েছে। সর্বশেষ যে হয় সে সুযোগটি হল জেড < 0X1XnX1Z=X1XnZ<0 , যা (প্রতিসাম্য এবং ধারাবাহিকতা দ্বারা) সমান দাবি হিসাবে। যদিও শেষেরটিতে দৌড়ে জয়ের আরও বেশি সম্ভাবনা রয়েছে, তবে কোনও প্যারাডাক্স নেই: বেশিরভাগ সময় যখন প্রথমটি হেরে যায় , অন্য কেউ আসলে দৌড় জিততে পারে।1/2
whuber

1
@ শুভ ধন্যবাদ, আমি যা বলতে চাইছিলাম তা আমি পরিষ্কার করতে পেরেছি - বিভ্রান্তি রোধ করতে অপসারণ করব। 1/2 এর চিত্রটি সঠিক, তবে তাদের গড় সময়গুলির সাথে তুলনা করার উত্তর ভুল এবং এটি জনসংখ্যার সাথে বিভ্রান্তিকে আমন্ত্রণ জানায়। আপনি লিখতে, এটা পার্থক্য হওয়া উচিত এক্স আমিxi¯Xi
সিলভার ফিশ

@ সিলভার এটি অনুমানের বিপদটি হাইলাইট করে যে আমরা কারওর স্বরলিপিটির অর্থ কী তা আমরা সবসময় জানি কারণ এটি পরিচিত দেখায়। আমি (overlines "উপস্থিত সঙ্গে যে বিষয় উপর glossed " এবং " এক্স 8 কারণ অভিপ্রেত অর্থ স্পষ্ট যথেষ্ট ছিল") এবং উহ্য যে তাদের কেউই সম্ভবত প্রতিনিধিত্ব করতে পারে কিছু বলতে চাইছেন: এই প্রেক্ষাপটে তারা আছে জন্য দাঁড়াতে এলোমেলো ভেরিয়েবলগুলি নিজেরাই (যা আমি এক্স 1 এবং এক্স এন লিখেছি )। x1x8X1Xn
হোয়বার

উত্তর:


15

যদিও সঠিক সম্ভাবনা গণনা করা যায় না (বিশেষ পরিস্থিতিতে এন এর সাথে বাদে) ), এটি উচ্চতর নির্ভুলতায় দ্রুত গণনা করা যেতে পারে। এই সীমাবদ্ধতা সত্ত্বেও, এটি দৃor়তার সাথে প্রমাণ করা যেতে পারে যে সবচেয়ে বড় স্ট্যান্ডার্ড বিচ্যুতি সহ রানার জয়ের সবচেয়ে বড় সম্ভাবনা রয়েছে। চিত্রটি পরিস্থিতি চিত্রিত করে এবং দেখায় যে কেন এই ফলাফল স্বজ্ঞাতভাবে স্পষ্ট:n2

Figure

পাঁচ রানার সময়ের জন্য সম্ভাবনার ঘনত্বগুলি দেখানো হয়েছে। সকল একটানা ও একটি সাধারণ গড় সম্পর্কে প্রতিসম হয় । (সমস্ত সময় ধনাত্মক হয় তা নিশ্চিত করার জন্য স্কেলড বিটা ঘনত্ব ব্যবহার করা হয়েছিল)) গা blue় নীল রঙে আঁকা এক ঘনত্বের প্রসার অনেক বেশি। এর বাম লেজের দৃশ্যমান অংশটি এমন সময়কে উপস্থাপন করে যা অন্য কোনও রানার সাধারণত মেলে না। যেহেতু অপেক্ষাকৃত বৃহত অঞ্চল সহ সেই বাম লেজটি প্রশংসনীয় সম্ভাবনার প্রতিনিধিত্ব করে, তাই এই ঘনত্বের সাথে রানার দৌড়ে বিজয়ী হওয়ার সর্বাধিক সম্ভাবনা রয়েছে। (তাদেরও শেষ অবধি আসার সর্বাধিক সম্ভাবনা আছে!)μ

এই ফলাফলগুলি কেবলমাত্র সাধারণ বিতরণের চেয়ে বেশি ক্ষেত্রে প্রমাণিত হয়: এখানে উপস্থাপিত পদ্ধতিগুলি প্রতিসম এবং অবিচ্ছিন্ন বিতরণগুলিতেও সমানভাবে কার্যকর হয় (চলমান সময়ের মডেল হিসাবে সাধারণ বিতরণ ব্যবহারে যারা আপত্তি করে তার পক্ষে এটি আগ্রহী হবে will) যখন এই অনুমানগুলি লঙ্ঘন করা হয় তখন সবচেয়ে বড় স্ট্যান্ডার্ড বিচ্যুতির সাথে রানার জয়ের সবচেয়ে বেশি সম্ভাবনা নাও থাকতে পারে (আমি কাউন্টারিক্সের উদাহরণগুলি এখানে রেখেই চলেছি) আগ্রহী পাঠক), তবে আমরা এখনও হালকা অনুমানের অধীনে প্রমাণ করতে পারি যে এসডি পর্যাপ্ত পরিমাণে বড় হওয়া সত্ত্বেও সবচেয়ে বড় এসডি সহ রানারের পক্ষে জয়ের সেরা সম্ভাবনা থাকবে।

চিত্রটি আরও পরামর্শ দেয় যে স্ট্যান্ডার্ড বিচ্যুতি (তথাকথিত "সেমভিরিয়েন্স") এর একতরফা অ্যানালগগুলি বিবেচনা করে একই ফলাফল পাওয়া যেতে পারে, যা কেবলমাত্র একদিকে বিতরণ ছড়িয়ে দেওয়ার পরিমাপ করে। বাম দিকে দুর্দান্ত ছড়িয়ে পড়া (ভাল সময়ের দিকে) একজন রানারকে বিজয়ী হওয়ার আরও বেশি সম্ভাবনা থাকা উচিত, বিতরণটির বাকি অংশে যা ঘটেছিল তা নির্বিশেষে। এই বিবেচনাগুলি আমাদের সম্পত্তি কীভাবে তা জানার জন্য সহায়তা করে সেরা হওয়ার (একটি গোষ্ঠীতে) গড় হিসাবে অন্য সম্পত্তি থেকে পৃথক হয় ।


যাক র্যান্ডম রানার্স 'বার প্রতিনিধিত্বমূলক ভেরিয়েবল হও। প্রশ্ন অনুমান তারা স্বাধীন ও সাধারণত সাধারণ গড় সঙ্গে বিতরণ করা হয় μ । (যদিও এটি আক্ষরিক অর্থেই একটি অসম্ভব মডেল, কারণ এটি নেতিবাচক সময়ের জন্য ইতিবাচক সম্ভাবনা পোষণ করে, এটি এখনও বাস্তবের জন্য একটি যুক্তিসঙ্গত সমীকরণ হতে পারে তবে স্ট্যান্ডার্ড বিচ্যুতির তুলনায় যথেষ্ট ছোটX1,,Xnμ ।)μ

নিম্নলিখিত যুক্তিটি সম্পাদন করার জন্য, স্বাধীনতার অনুমানটি ধরে রাখুন তবে অন্যথায় ধরে নিন যে এর বিতরণ এফ আই দ্বারা দেওয়া হয়েছে এবং এই বিতরণী আইন যে কোনও কিছু হতে পারে। সুবিধার্থে, ধরে নিন ডিস্ট্রিবিউশন এফ এন ঘনত্ব এফ এন দিয়ে অবিচ্ছিন্ন থাকে । পরে প্রয়োজন হিসাবে আমরা অতিরিক্ত অনুমানগুলি প্রয়োগ করতে পারি যদি তারা সাধারণ বিতরণের ক্ষেত্রে অন্তর্ভুক্ত থাকে।XiFiFnfn

যেকোন এবং অনন্য d y এর জন্য , শেষ রানার ব্যবধানে একটি সময় থাকার সম্ভাবনা ( y - d y , y ] এবং দ্রুততম রানার হ'ল সমস্ত প্রাসঙ্গিক সম্ভাব্যতাগুলি গুণ করে (কারণ সমস্ত সময় স্বাধীন):ydy(ydy,y]

Pr(Xn(ydy,y],X1>y,,Xn1>y)=fn(y)dy(1F1(y))(1Fn1(y)).

এই সমস্ত পারস্পরিক একচেটিয়া সম্ভাবনা ফলন একীকরণ

Pr(Xnmin(X1,X2,,Xn1))=Rfn(y)(1F1(y))(1Fn1(y))dy.

সাধারণ বিতরণগুলির জন্য, এই অবিচ্ছেদ্যটিকে বন্ধ ফর্মের মধ্যে মূল্যায়ন করা যাবে না যখন : এটির সংখ্যাসমূহের মূল্যায়ন প্রয়োজন।n>2

Figure

এই চিত্রটি 1: 2: 3: 4: 5 অনুপাতের স্ট্যান্ডার্ড বিচ্যুতিপ্রাপ্ত পাঁচ রানার প্রত্যেকের জন্য সংহতকরণের পরিকল্পনা করে। এসডি যত বড় হবে তত বেশি ফাংশনটি বামে স্থানান্তরিত হয় - এবং এর অঞ্চলটি তত বেশি হয়। অঞ্চলগুলি প্রায় 8: 14: 21: 26: 31%% বিশেষত, বৃহত্তম এসডি সহ রানারের জয়ের সম্ভাবনা রয়েছে 31%।


যদিও একটি বদ্ধ ফর্মটি পাওয়া যায় না, তবুও আমরা দৃ conc় সিদ্ধান্ত নিতে পারি এবং প্রমাণ করতে পারি যে বৃহত্তম এসডি সহ রানার জয়ের সম্ভাবনা সবচেয়ে বেশি। আমাদের বিতরণগুলির মধ্যে কোনওটির স্ট্যান্ডার্ড বিচ্যুতি হিসাবে কী ঘটে তা অধ্যয়ন করতে হবে, বলে , পরিবর্তন হয়। যখন দৈব চলক এক্স এন দ্বারা rescaled হয় σ > 0 তার গড় প্রায়, তার এসডি দ্বারা গুন করা হয় σ এবং এন ( Y ) d Y এ পরিবর্তন হবে এন ( Y / σ ) Y / σFnXnσ>0σfn(y)dyfn(y/σ)dy/σ। ভেরিয়েবলের পরিবর্তন করার :অবিচ্ছেদ্য y = x σ ner এরক্রিয়া হিসাবেরানার এন জয়েরসুযোগের জন্য একটি অভিব্যক্তি দেয় σy=xσnσ

ϕ(σ)=Rfn(y)(1F1(yσ))(1Fn1(yσ))dy.

এখন ধরুন যে সমস্ত এন বিতরণের মধ্যস্থতাগুলি সমান এবং সমস্ত বিতরণগুলি প্রতিসম এবং ক্রমাগত, ঘনত্ব সহ f i । (এটি অবশ্যই প্রশ্নের শর্তের অধীনে, কারণ একটি সাধারণ মিডিয়ান এটির গড়।) একটি সাধারণ (স্থানীয়) পরিবর্তনশীল পরিবর্তনের মাধ্যমে আমরা ধরে নিতে পারি যে এই সাধারণ মাঝারিটি 0 হয় ; প্রতিসম অর্থ f n ( y ) = f n ( - y ) এবং 1 - F j ( - y ) = F j ( y)nfi0fn(y)=fn(y) সবার জন্য Y । এই সম্পর্কগুলি আমাদেরকে ( - , 0 ] ইন্টিগ্রাল ওভার ( 0 , ) দেওয়ারজন্য একীভূত করতে সম্মত করে1Fj(y)=Fj(y)y(,0](0,)

ϕ(σ)=0fn(y)(j=1n1(1Fj(yσ))+j=1n1Fj(yσ))dy.

ফাংশন পার্থক্যযোগ্য। এর ডেরাইভেটিভ, একীকরণের পার্থক্য করে প্রাপ্ত, একক সংখ্যার সমষ্টি যেখানে প্রতিটি পদটি ফর্মের হয়ϕ

yfn(y)fi(yσ)(jin1Fj(yσ)jin1(1Fj(yσ)))

i=1,2,,n1

Fj(x)1Fj(x)x0x=yσ0yfn(y)fi(yσ) are clearly nonnegative because densities cannot be negative and y0. We may conclude that ϕ(σ)0 for σ0, proving that the chance that player n wins increases with the standard deviation of Xn.

This is enough to prove that runner n will win provided the standard deviation of Xn is sufficiently large. This is not quite satisfactory, because a large SD could result in a physically unrealistic model (where negative winning times have appreciable chances). But suppose all the distributions have identical shapes apart from their standard deviations. In this case, when they all have the same SD, the Xi are independent and identically distributed: nobody can have a greater or lesser chance of winning than anyone else, so all chances are equal (to 1/n). Start by setting all distributions to that of runner n. Now gradually decrease the SDs of all other runners, one at a time. As this occurs, the chance that n wins cannot decrease, while the chances of all the other runners have decreased. Consequently, n has the greatest chances of winning, QED.


@Phonon That's correct. (But please do not confuse the distributions with estimates derived from samples. The distribution is a mathematical model, not a set of data.) Increasing the SD by a factor of λ, say, uniformly stretches the horizontal axis. Because (by the Law of Total Probability) the density function will cover a unit area, that stretch must be compensated by a stretch of the vertical axis by 1/λ, thereby preserving all areas. Thus, smaller SDs correspond to taller peaks and larger SDs to shorter peaks.
whuber

Many thanks for your reply, makes perfect sense. So knowledge of peak values alone in this sense is rather important.
Phonon
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.