বিটা বিতরণের পিছনে অন্তর্দৃষ্টি কী?


438

দাবি অস্বীকার: আমি কোনও পরিসংখ্যানবিদ নই, তবে একটি সফটওয়্যার ইঞ্জিনিয়ার। পরিসংখ্যানগুলিতে আমার বেশিরভাগ জ্ঞান স্ব-শিক্ষার দ্বারা আসে, সুতরাং আমার কাছে এখনও ধারণাগুলি বোঝার অনেক ফাঁক রয়েছে যা এখানকার অন্যান্য ব্যক্তির পক্ষে তুচ্ছ মনে হতে পারে। সুতরাং আমি খুব কৃতজ্ঞ যদি উত্তরগুলিতে কম নির্দিষ্ট শর্তাদি এবং আরও ব্যাখ্যা অন্তর্ভুক্ত থাকে। কল্পনা করুন যে আপনি আপনার দাদীর সাথে কথা বলছেন :)

আমি উপলব্ধি করার চেষ্টা করছি প্রকৃতি এর বিটা বিতরণ কিভাবে প্রতিটি ক্ষেত্রে এটি ব্যাখ্যা করা কি এটা জন্য ব্যবহার করা উচিত এবং -। যদি আমরা কথা বলি, সাধারণ বিতরণ, এটির ট্রেনের আগমনের সময় হিসাবে এটি বর্ণনা করা যায়: বেশিরভাগ ঘন ঘন এটি সময়মতো আসে, কিছুটা কম ঘন ঘন এটি 1 মিনিট আগে বা 1 মিনিট দেরিতে হয় এবং খুব কমই এটি তফাত দিয়ে আসে গড় থেকে 20 মিনিটের। ইউনিফর্ম বিতরণ লটারিতে প্রতিটি টিকিটের সম্ভাবনা বিশেষত বর্ণনা করে। দ্বিপদী বিতরণ মুদ্রা উল্টানো এবং আরও দিয়ে বর্ণনা করা যেতে পারে। কিন্তু এখানে কি বিটা বিতরণের স্বজ্ঞাত ব্যাখ্যা রয়েছে ?

যাক, এবং । এক্ষেত্রে বিটা ডিস্ট্রিবিউশন এর মতো দেখতে পাওয়া যায় (আর তে উত্পন্ন):α=.99β=.5B(α,β)

এখানে চিত্র বর্ণনা লিখুন

তবে আসলে এর অর্থ কী? ওয়াই-অক্ষগুলি সম্ভবত একটি সম্ভাবনার ঘনত্ব, তবে এক্স-অক্ষের মধ্যে কী রয়েছে?

এই উদাহরণ বা অন্য কোনও দ্বারা আমি কোনও ব্যাখ্যাটির খুব প্রশংসা করব।


13
Y- অক্ষটি কোনও সম্ভাবনা নয় (যা সুস্পষ্ট, কারণ সংজ্ঞা অনুসারে কোনও সম্ভাবনা অন্তরালের বাইরে থাকতে পারে না , তবে এই প্লটটি এবং - নীতিগতভাবে - পর্যন্ত প্রসারিত হয় )। এটি একটি সম্ভাবনার ঘনত্ব : ইউনিট প্রতি এক সম্ভাবনা (এবং আপনি রেট হিসাবে বর্ণনা করেছেন )। [0,1]50xx
whuber

4
@ শুভ: হ্যাঁ, আমি পিডিএফ কী তা বুঝতে পেরেছি - এটি আমার বর্ণনায় ভুল ছিল। একটি বৈধ নোট জন্য ধন্যবাদ!
15:33 এ 13:32

1
আমি চেষ্টা করব এবং রেফারেন্সটি খুঁজে পাব তবে আমি জেনেছি সাধারণ বিটা বিতরণের আরও কয়েকটি উদ্ভট আকারগুলির সাথে ফিজিক্সের মতো অ্যাপ্লিকেশন রয়েছে। এছাড়াও, আপনি এটি ডেটা-দুর্বল পরিবেশে বিশেষজ্ঞের ডেটা (মিনিট, মোড, সর্বাধিক) এর সাথে ফিট করতে পারেন এবং এটি ত্রিভুজাকার বিতরণ (দুর্ভাগ্যক্রমে প্রায়শই আইআই দ্বারা ব্যবহৃত হয়) ব্যবহার করার চেয়ে ভাল। a+(ba)Beta(α1,α2)
সিক্রেটএজেন্টম্যান

স্পষ্টতই আপনি কখনও রেলওয়ে সংস্থা ডয়চে বাহনের সাথে ভ্রমণ করেন নি। আপনি কম আশাবাদী হতে চাই।
মুরগি

উত্তর:


621

সংক্ষিপ্ত সংস্করণটি হ'ল বিটা বিতরণটি সম্ভাবনার বন্টনের প্রতিনিধিত্বকারী হিসাবে বোঝা যায় - এটি হ'ল এটি সম্ভাবনার সমস্ত সম্ভাব্য মান উপস্থাপন করে যখন আমরা জানি না যে সম্ভাবনাটি কী। এটি সম্পর্কে আমার প্রিয় স্বজ্ঞাত ব্যাখ্যা:

যে কেউ বেসবল অনুসরণ করে সে ব্যাটিং গড়ের সাথে পরিচিত simply কেবল কোনও খেলোয়াড় যখন ব্যাট করতে যায় তার সংখ্যা দ্বারা বিভক্তভাবে বেস হিট হওয়ার পরিমাণটি (তাই এটি কেবলমাত্র 0এবং এর মধ্যে শতাংশের এক শতাংশ 1)। .266সাধারণত ব্যাটিং গড় .300হিসাবে বিবেচিত হয় , এবং এটি একটি দুর্দান্ত বলে বিবেচিত হয়।

কল্পনা করুন যে আমাদের বেসবল খেলোয়াড় রয়েছে এবং আমরা তার মরসুম-ব্যাটিং গড়ের গড় কত হবে তা ভবিষ্যদ্বাণী করতে চাই। আপনি বলতে পারেন যে আমরা এখন পর্যন্ত তার ব্যাটিং গড়টি ব্যবহার করতে পারি- তবে এটি একটি মরসুমের শুরুতে খুব খারাপ ব্যবস্থা হবে! যদি কোনও খেলোয়াড় একবার ব্যাট করতে উঠে যায় এবং একা পায় তবে তার ব্যাটিং গড় সংক্ষিপ্তভাবে হয় 1.000, আর যদি তিনি স্ট্রাইক আউট করেন তবে তার ব্যাটিং গড় হয় 0.000। আপনি পাঁচ বা ছয়বার ব্যাট করতে গেলে এর চেয়ে বেশি ভাল হয় না - আপনি ভাগ্যবান স্ট্রাইক পেতে পারেন এবং গড়ে গড়ে উঠতে পারেন 1.000, বা একটি দুর্ভাগা স্ট্রাইক পেতে পারেন এবং গড় পেতে পারেন 0, যার মধ্যে দুটিই কীভাবে দূরবর্তীভাবে ভাল ভবিষ্যদ্বাণী নয় আপনি সেই মরসুমে ব্যাট করবেন।

প্রথম ব্যাট হাতে আপনার ব্যাটিং গড়টি কেন আপনার শেষ ব্যাটিং গড়ের ভাল ভবিষ্যদ্বাণী নয়? যখন কোনও খেলোয়াড়ের প্রথম ব্যাটে স্ট্রাইকআউট হয় তখন কেন কেউ অনুমান করেন না যে তিনি পুরো মৌসুমে কখনই হিট পাবেন না? কারণ আমরা পূর্বের প্রত্যাশা নিয়ে যাচ্ছি আমরা জানি যে ইতিহাসে, বেশিরভাগ ব্যাটিং গড় একটি seasonতুতে কিছুটা দু'পাশে খুব বিরল ব্যতিক্রম সহ এমন কিছু .215এবং betweenতুতে জুড়ে থাকে .360। আমরা জানি যে কোনও খেলোয়াড় যদি শুরুতে একটানা কয়েকটা স্ট্রাইকআউট পান তবে এটি ইঙ্গিত দিতে পারে যে সে গড়ের চেয়ে কিছুটা খারাপ হতে পারে, তবে আমরা জানি যে সে সম্ভবত এই ব্যাপ্তি থেকে বিচ্যুত হবে না।

আমাদের ব্যাটিং গড় সমস্যাটি দেওয়া, যা দ্বিপদী বিতরণ (সাফল্য এবং ব্যর্থতার একটি ধারা) দিয়ে প্রতিনিধিত্ব করা যেতে পারে , এই পূর্বের প্রত্যাশাগুলি উপস্থাপনের সর্বোত্তম উপায় (যা আমরা পরিসংখ্যানগুলিতে কেবল পূর্বে বলি ) তা বিটা বিতরণের সাথে রয়েছে, বলা হচ্ছে, আমরা খেলোয়াড়কে তার প্রথম দোল নিতে দেখার আগে আমরা তার ব্যাটিং গড় কতটা আশা করি। বিটা বিতরণের ডোমেন হ'ল (0, 1)এক সম্ভাবনার মতো, তাই আমরা ইতিমধ্যে জানি আমরা সঠিক পথে রয়েছি but তবে এই কাজের জন্য বিটার যথাযথতা এর চেয়ে অনেক বেশি।

আমরা আশা করি যে প্লেয়ারের মৌসুম-দীর্ঘ ব্যাটিং গড় প্রায় সম্ভাব্য .27, তবে এটি যথাযথভাবে হতে .21পারে .35। Para এবং পরামিতিগুলির সাথে এটি একটি বিটা বিতরণের মাধ্যমে উপস্থাপিত হতে পারে :β = 219α=81β=219

curve(dbeta(x, 81, 219))

বিটা (81, 219)

আমি দুটি কারণে এই পরামিতিগুলি নিয়ে এসেছি:

  • হ'লαα+β=8181+219=.270
  • আপনি প্লটে দেখতে পাচ্ছেন যে, এই বিতরণটি প্রায় পুরোপুরিভাবেই থাকে (.2, .35)- ব্যাটিং গড়ের পক্ষে যুক্তিসঙ্গত পরিসর।

আপনি বিটা বিতরণ ঘনত্বের প্লটে x অক্ষটি কী উপস্থাপন করে জানতে চেয়েছিলেন - এখানে এটি তার ব্যাটিং গড়কে উপস্থাপন করে। সুতরাং লক্ষ করুন যে এক্ষেত্রে y- অক্ষগুলিই কেবল সম্ভাবনা (বা আরও স্পষ্টভাবে সম্ভাবনার ঘনত্ব) নয়, তবে এক্স-অক্ষটিও রয়েছে (ব্যাটিং গড় হিটের সম্ভাবনা মাত্র, সর্বোপরি)! বিটা বিতরণ একটি সম্ভাব্যতা বিতরণের প্রতিনিধিত্ব করছে সম্ভাব্যতার

তবে এখানে কেন বিটা বিতরণ এত উপযুক্ত। কল্পনা করুন খেলোয়াড়টি একক হিট পায়। মরসুমে তাঁর রেকর্ড এখন 1 hit; 1 at bat। তারপরে আমাদের আমাদের সম্ভাবনাগুলি আপডেট করতে হবে- আমরা আমাদের নতুন তথ্য প্রতিফলিত করতে এই সম্পূর্ণ বক্ররেখাটিকে কিছুটা উপরে স্থানান্তরিত করতে চাই। যদিও এটি প্রমাণ করার জন্য গণিতটি কিছুটা জড়িত ( এটি এখানে দেখানো হয়েছে ), ফলাফলটি খুব সহজ । নতুন বিটা বিতরণটি হ'ল:

Beta(α0+hits,β0+misses)

যেখানে এবং আমরা যে প্যারামিটারগুলি দিয়ে শুরু করেছি - তা হচ্ছে 81 এবং 219. সুতরাং, এই ক্ষেত্রে, 1 (তার এক হিট) বেড়েছে, এবংβ 0 α βα0β0αβBeta(81+1,219)

curve(dbeta(x, 82, 219))

এখানে চিত্র বর্ণনা লিখুন

লক্ষ্য করুন যে এটি সবেমাত্র পরিবর্তিত হয়েছে - পরিবর্তনটি সত্যিই খালি চোখে অদৃশ্য! (এটি কারণ হিট আসলে কিছুই বোঝায় না)।

Beta(81+100,219+200)

curve(dbeta(x, 81+100, 219+200))

এখানে চিত্র বর্ণনা লিখুন

লক্ষ্য করুন যে বাঁকটি এখন উভয়ই পাতলা এবং ডান দিকে উন্নত হয়েছে (উচ্চতর ব্যাটিং গড়) এটি আগের তুলনায়- প্লেয়ারের ব্যাটিং গড়টি কী তা আমাদের আরও ভালভাবে উপলব্ধি করে।

αα+β81+10081+100+219+200=.303100100+200=.3338181+219=.270

সুতরাং, বিটা বিতরণ সম্ভাব্য বন্টন প্রতিনিধিত্বমূলক জন্য সবচেয়ে ভাল হয় সম্ভাব্যতার - যদি আমরা কি একটি সম্ভাব্যতা আগাম যেখানে জানি না, কিন্তু আমরা কিছু যুক্তিসঙ্গত অনুমান আছে।


5
@ ফ্রেন্ড: খুশি হয়েছে - আমি আশা করি আপনি বেসবল অনুসরণ করবেন (অন্যথায় আমি অবাক হয়েছি যদি এটি বোধগম্য হয়!)
ডেভিড রবিনসন

11
বিভিন্ন সংখ্যক পর্যালোচনার সাথে বাইনারি অ্যামাজন বিক্রেতার র‌্যাঙ্কিং ব্যবহার করে জন কুকের অনুরূপ উদাহরণ এখানে। মন্তব্যে পূর্বেরটি
দিমিত্রি ভি। মাস্টারভ

4
α0=β0=1/2

4
+ আপনার কাছে আরও ডেটা থাকাকালীন আপনি কীভাবে বিতরণটি আপডেট করবেন সে সম্পর্কে আপনার ব্যাখ্যাটি আমি পছন্দ করি।
মাইক ডুনলাভে

2
@ ব্যবহারকারী ২99৯997 এগুলি .27 এর পছন্দসই গড়টি দিয়েছে এবং একটি মানক বিচ্যুতি যা ব্যাটিং গড় (প্রায় .025) সম্পর্কে মোটামুটি বাস্তবসম্মত। প্রসঙ্গত, আমি এখানে একটি পছন্দসই গড় এবং বৈচিত্র থেকে কীভাবে α এবং calc গণনা করব তার একটি ব্যাখ্যা দিয়েছি ।
ডেভিড রবিনসন

48

একটি বিটা বিতরণ জিনিস, একটি সীমিত পরিসর আছে 0 মত 1 মডেল ব্যবহার করা হয়।

উদাহরণগুলি হ'ল পরীক্ষায় সাফল্যের সম্ভাবনা হ'ল সাফল্য এবং ব্যর্থতার মতো মাত্র দুটি ফলাফল। যদি আপনি সীমিত সংখ্যক পরীক্ষা-নিরীক্ষা করেন এবং কিছু সফল হন তবে আপনি এটি একটি বিটা বিতরণের মাধ্যমে যা বলতে পারেন তা উপস্থাপন করতে পারেন।

আর একটি উদাহরণ অর্ডার পরিসংখ্যান । উদাহরণস্বরূপ, আপনি যদি বেশ কয়েকটি (বলুন 4) ইউনিফর্ম 0,1 এলোমেলো সংখ্যা তৈরি করে এবং সেগুলি সাজান, তৃতীয়টির বিতরণ কী?

nss>1Beta(s+1,(ns)+1)

সে সম্পর্কে আরও ...


41

(0,1)

অবিকল, , , ইউ এনU1Unn(0,1)U(1)U(n)(U1,,Un)U1UnU(1)=min(Ui)U(n)=max(Ui)U(k)Beta(k,n+1k)k=1,,n

এই ফলাফলটি দেখায় যে বিটা বিতরণগুলি প্রাকৃতিকভাবে গণিতে প্রদর্শিত হয় এবং এটিতে গণিতে কিছু আকর্ষণীয় প্রয়োগ রয়েছে।


28

দুটি মূল অনুপ্রেরণা রয়েছে:

প্রথমত, বিটা বিতরণটি বের্নোল্লি বিতরণের আগে সম্মিলিত। এর অর্থ হ'ল যদি আপনি যদি মুদ্রার পক্ষপাতদুটির মতো অজানা সম্ভাবনা বোধ করেন যা আপনি বার বার মুদ্রা ফ্লিপ করে অনুমান করছেন তবে মুদ্রা উল্টানোর ক্রম দ্বারা অজানা পক্ষপাতের উপর প্রেরিত সম্ভাবনাটি বিটা-বিতরণযোগ্য।

দ্বিতীয়ত, বিটা বিতরণটি একটি তাত্পর্যপূর্ণ পরিবার হওয়ার ফলস্বরূপ এটি পর্যাপ্ত পরিসংখ্যানের সেটগুলির জন্য সর্বাধিক এনট্রপি বিতরণ। বিটা ডিস্ট্রিবিউশনের যদি এই সব তথ্য, এবং জন্য মধ্যে । এর অর্থ এই যে আপনি যদি কেবলমাত্র নমুনা জন্য এই পর্যাপ্ত পরিসংখ্যানের গড় পরিমাপ তবে নমুনাগুলির বিতরণ সম্পর্কে আপনি যে সর্বনিম্ন অনুমান করতে পারেন তা হ'ল এটি বিটা-বিতরণ islog(x)log(1x)x[0,1]x1,,xn

বিটা বিতরণ সাধারণত [0,1] এর চেয়ে বেশি মডেলিংয়ের জন্য বিশেষ নয় কারণ অনেকগুলি বন্টন সেই সমর্থনে কাটা যেতে পারে এবং অনেক ক্ষেত্রে আরও প্রযোজ্য।


23

এখানে চিত্র বর্ণনা লিখুন

আসুন ধরে নেওয়া যাক যে কোনও ই-কমার্স ওয়েবসাইটে কোনও বিক্রেতার কাছে 500 রেটিং পাওয়া যায় যার মধ্যে 400 ভাল এবং 100 টি খারাপ।

আমরা এটিকে 500 দৈর্ঘ্যের বার্নোল্লি পরীক্ষার ফলাফল হিসাবে মনে করি যা 400 সাফল্য (1 = ভাল) দিকে পরিচালিত করে যখন অন্তর্নিহিত সম্ভাবনা অজানা।p

বিক্রেতার রেটিংয়ের ক্ষেত্রে নিষ্পাপ গুণমানটি ৮০% কারণ 0.8 = 400/500 But তবে রেটিংগুলির ক্ষেত্রে "সত্য" গুণটি আমরা জানি না।

তাত্ত্বিকভাবে এর "সত্য" মানের একটি বিক্রেতারও 500 রেটিংয়ের 400 টি ভাল থাকতে পারে।p=77%

চিত্রটির পয়েন্টি বার প্লটটি প্রায়শই এটি কতটা সিমুলেশনে সুখী হয় তার ফ্রিকোয়েন্সি উপস্থাপন করে যে প্রদত্ত "সত্য" 500 এর 500 রেটিং ভাল ছিল। বার প্লটটি সিমুলেশনের ফলাফলের হিস্টোগারের ঘনত্ব।p

এবং যেমন আপনি দেখতে পাচ্ছেন - এবং (কমলা) এর জন্য বিটা বিতরণের ঘনত্বের বক্রতা বার চার্টটিকে (সিমুলেশনের জন্য হিস্টোগারের ঘনত্ব) শক্তভাবে ঘিরে রয়েছে।α=400+1β=100+1

তাই বিটা বিতরণ মূলত সম্ভাব্যতা করে একটি বের্নুলির পরীক্ষা সাফল্যের সম্ভাব্যতা সংজ্ঞায়িত পরীক্ষা ফলাফল দেওয়া।p

library(ggplot2)

# 90% positive of 10 ratings
o1 <- 9
o0 <- 1
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim1 <- data.frame(p=rep(0:M/M,v))
df_beta1 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

# 80% positive of 500 ratings
o1 <- 400
o0 <- 100
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim2 <- data.frame(p=rep(0:M/M,v))
df_beta2 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

ggplot(data=df_sim1,aes(p)) +
    scale_x_continuous(breaks=0:10/10) +

    geom_histogram(aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta1 ,aes(p,y),colour=I("red"),size=2,alpha=.5) +

    geom_histogram(data=df_sim2, aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta2,aes(p,y),colour=I("orange"),size=2,alpha=.5)

http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/


3
আপনার অবদানের জন্য ধন্যবাদ! যদিও আমি কিছু নিয়ে আশ্চর্য হয়েছি: যদিও হিস্টগ্রামের কিংবদন্তি তাদের দেখায় বিটা ঘনত্ব , আপনি দাবি করেছেন যে এগুলি দ্বিপদী সিমুলেশনের ফলাফলও বর্ণনা করে ("এটি কতবার সিমুলেশনে সুখী হয়")। উদাহরণস্বরূপ এগুলি মোটামুটি কাছাকাছি উপস্থিত হওয়ার পরেও দুটি আলাদা জিনিস। (এটি বৃহত প্যারামিটার এবং
বিমোমিয়াল

এটি একটি ভাল পয়েন্ট! তবে কীভাবে এটি প্রপ্রেসভাবে পুনর্বিবেচনা করবেন আমি নিশ্চিত নই। আমি যদি কেবল হিস্টোগ্রামের পরিকল্পনা করতাম তবে অবশ্যই আপনি এর ঘনত্বের পরিমাণ দেখতে পাবেন না। হ্যাঁ, হিস্টোগ্রামটি আসলে আমি অনুমান করি যে কেবলমাত্র ছোট করে দেওয়া হয়নি তবে প্রকৃত হিস্টগ্রামের (আনুমানিক) ঘনত্ব। রান সংখ্যার দিক দিয়ে আমি একটি ফ্যাক্টরও বের করতে পেরেছি এবং এটিকে রৈখিকভাবে স্কেল করতে পারি তবে এটি প্রায় একই প্লাসটি দেখতে পাবেন যা আমি (আসলে) তুলনা করতে চাই তা হ'ল সিমুলেশনের ফলাফলের ঘনত্বের সাথে বিটার ঘনত্ব ( মূল হিস্টগ্রামের ঘনত্ব)।
রাফেল

8

এখনও অবধি উত্তরগুলির প্রসারিততায় বিটা আরভিগুলির একটি নমুনা অনুপাতের পূর্বের হিসাবে উত্পন্ন হওয়ার যৌক্তিকতা coveredেকে দেওয়া হয়েছিল এবং একটি চৌকস উত্তরের পরিসংখ্যান অর্ডার করতে বিটা আরভি সম্পর্কিত রয়েছে।

দুটি গামা (কে_আই, ১) আরভিগুলির মধ্যে একটি সহজ সম্পর্ক থেকে বিটা বিতরণও দেখা দেয়, i = 1,2 এগুলিকে এক্স এবং ওয়াই। এক্স / (এক্স + ওয়াই) এর একটি বিটা বিতরণ রয়েছে।

গামা আরভিগুলিতে স্বতন্ত্র ইভেন্টগুলির জন্য মডেলিংয়ের আগমনের সময়গুলির মধ্যে ইতিমধ্যে তাদের যুক্তি রয়েছে, সুতরাং আমি এটি সম্বোধন করব না যেহেতু এটি আপনার প্রশ্ন নয়। তবে ধারাবাহিকভাবে সম্পাদিত দুটি কাজের মধ্যে একটির একটি সম্পূর্ণ করতে ব্যয় করা "সময়ের কিছু অংশ" প্রাকৃতিকভাবে নিজেকে একটি বিটা বিতরণে leণ দেয়।


1
+1 গামা ব্যবহার করে বিটা বিতরণ গঠনের বিষয়ে উল্লেখ করার জন্য ধন্যবাদ। আমি শুনেছি আপনি যদি বিটাটিকে একটি ডিরিচলেট হিসাবে সাধারণীকরণ করতে চান তবে আপনি আরও বেশি গামাসকে ডিনোমিনেটরে রেখেছেন। সম্ভবত কোনও পরিসংখ্যানবিদ এটি জানেন তবে আমার কাছে বুদ্ধিমান পর্যবেক্ষণের আত্মবিশ্বাসের অন্তরগুলি দেখার সময় এটি সত্যিই কার্যকর ছিল।
মাইক ডুনলাভে

4

আমার অন্তর্নিহিততা বলে যে এটি সাফল্যের বর্তমান অনুপাত " " এবং ব্যর্থতার বর্তমান অনুপাত " " উভয়কেই "ওজন করে" : । যেখানে ধ্রুবকটি । x(1x)f(x;α,β)=constantxα1(1x)β11/B(α,β)α সাফল্য অবদানের জন্য "ওজন" মত হল। ব্যর্থতা অবদানের জন্য "ওজন" মত হল। আপনার একটি দ্বি মাত্রিক প্যারামিটার স্পেস রয়েছে (সাফল্যের অবদানের জন্য একটি এবং ব্যর্থতার অবদানের জন্য একটি) যা এটিকে সম্পর্কে চিন্তাভাবনা করা এবং বোঝা এক ধরণের কঠিন করে তোলে।β


3

উদ্ধৃত উদাহরণে পরামিতিগুলি পূর্ববর্তী বছর থেকে আলফা = 81 এবং বিটা = 219 [৮০০ ব্যাট বা 300১ ও ৩০০ - ৮১ = ২১৯) এ হিট]

আমি জানি না যে তারা 81 টি হিট এবং 219 আউটসের পূর্ব অনুমানটিকে কী বলে তবে ইংরেজিতে, এটি একটি অগ্রাধিকার অনুমান।

খেয়াল করুন কীভাবে মৌসুমটি বাম বা ডানদিকে বাঁক বদল করে এবং মোডাল সম্ভাব্যতা বাম বা ডানদিকে পরিবর্তিত হয় তবে এখনও একটি বক্ররেখা রয়েছে।

আমি অবাক হই যে লার্জ অফ লার্জ নাম্বারগুলি শেষ পর্যন্ত ব্যাটিং গড়কে .270 এ চালিত করে।

সাধারণভাবে আলফা এবং বিটা অনুমান করার জন্য পূর্বের ঘটনাগুলির সম্পূর্ণ সংখ্যা (ব্যাটস এ) নেওয়া হবে, ব্যাটিং গড় হিসাবে পরিচিত, মোট হিট (আলফা), বিটা বা গ্র্যান্ড টোটাল বিয়োগ ব্যর্থতা অর্জন করবে) এবং ভয়েলা - আপনার সূত্র আছে তারপরে, প্রদর্শিত হিসাবে অতিরিক্ত তথ্য কাজ করুন।


2

F(X)=tanh((x/p)n) যা ডানদিকে আবদ্ধ নয়।

যাইহোক, আপনি যদি একটি মাইক্রোস্কোপিক পর্যবেক্ষণ থেকে একটি আকার বিতরণ উত্পাদন করেন এবং আপনার সংখ্যায় একটি কণা বিতরণ হয়, এবং আপনার লক্ষ্য ভলিউম বিতরণ নিয়ে কাজ করা? ডানদিকে আবদ্ধ সংখ্যায় মূল বন্টন পাওয়া প্রায় বাধ্যতামূলক। সুতরাং, রূপান্তরটি আরও সুসংগত কারণ আপনি নিশ্চিত যে নতুন ভলিউমের বিতরণটি আপনি যে বিরতিতে কাজ করছেন তার মধ্যবর্তী কোনও মধ্যবর্তী বা মাঝারি আকারের উপস্থিত হবে না। এছাড়াও, আপনি গ্রিনল্যান্ড আফ্রিকা প্রভাব এড়িয়ে চলুন।

রূপান্তরটি খুব সহজ যদি আপনার নিয়মিত আকার হয়, অর্থাত্, একটি গোলক বা প্রিজম থাকে। সংখ্যা বিটা বিতরণের আলফা প্যারামিটারে আপনাকে তিনটি ইউনিট যুক্ত করতে হবে এবং ভলিউম বিতরণ পেতে হবে।


1
সাইটে স্বাগতম। এটি কি ওপি-র প্রশ্নের উত্তর হিসাবে উদ্দেশ্য ছিল? এটি কীভাবে বিটা বিতরণের পিছনে অন্তর্নিহিতের সাথে সম্পর্কিত বলে আপনি পরিষ্কার করতে পারেন?
গুং

বিটা বিতরণ সম্পর্কে অন্তর্দৃষ্টি স্পষ্ট করতে সম্পাদনা করুন।
Glen_b

1

আমার মনে হয় বিটা বিতরণের পিছনে কোন স্বজ্ঞাততা নেই! বিটা বিতরণ FIX পরিসরের সাথে একটি খুব নমনীয় বিতরণ! এবং পূর্ণসংখ্য a এবং b এর জন্য এটি মোকাবেলা করা এমনকি সহজ। এছাড়াও বিটার অনেকগুলি বিশেষ ক্ষেত্রে এর অভিন্ন অর্থ বিতরণের মতো মূল অর্থ রয়েছে। সুতরাং যদি ডেটাটি এই জাতীয় মডেল করা দরকার হয় বা কিছুটা নমনীয়তার সাথে হয় তবে বিটা খুব ভাল পছন্দ।


0

ইন আরেকটি প্রশ্ন বিটা বিতরণ বিটা পিছনে নিম্নলিখিত স্বজ্ঞা প্রদান করা হয় বিষয়ে:

অন্য কথায় বিটা বিতরণকে জিটটার বিতরণের কেন্দ্রে সম্ভাব্যতার বিতরণ হিসাবে দেখা যায়।

বিস্তারিত জানার জন্য https://stats.stackexchange.com/a/429754/142758 এ সম্পূর্ণ উত্তরটি দেখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.