বায়েসিয়ান পরিসংখ্যান শেখানোর জন্য সহজ বাস্তব বিশ্বের উদাহরণ?


10

আমি বায়েশিয়ান পরিসংখ্যান শেখানোর জন্য কিছু "বাস্তব বিশ্বের উদাহরণ" সন্ধান করতে চাই। বায়েশিয়ান পরিসংখ্যান একজনকে পূর্বের জ্ঞানকে বিশ্লেষণে আনুষ্ঠানিকভাবে অন্তর্ভুক্ত করতে দেয়। আমি শিক্ষার্থীদের তাদের বিশ্লেষণে পূর্ববর্তী জ্ঞানকে অন্তর্ভুক্ত করার কয়েকটি সহজ বাস্তব বিশ্বের উদাহরণ দিতে চাই যাতে শিক্ষার্থীরা কেন প্রথম স্থানে বায়সিয়ান পরিসংখ্যান ব্যবহার করতে চায় তার প্রেরণাকে আরও ভালভাবে বুঝতে পারে।

জনগণের গড়, অনুপাত, রিগ্রেশন ইত্যাদি অনুমানের মতো সাধারণ কোনও বাস্তব বিশ্বের উদাহরণ সম্পর্কে আপনি কি অবগত আছেন যেখানে গবেষকরা আনুষ্ঠানিকভাবে পূর্বের তথ্যকে অন্তর্ভুক্ত করেন? আমি বুঝতে পারি যে বায়েশিয়ানরা "অ-তথ্যমূলক" প্রিরিয়ারগুলিও ব্যবহার করতে পারে, তবে আমি বিশেষত সত্যিকারের উদাহরণগুলিতে আগ্রহী যেখানে তথ্যমূলক প্রিয়ারগুলি (যেমন বাস্তব পূর্বের তথ্য) ব্যবহৃত হয়।


আমি মনে করি আইকিউ একটি খুব ভাল উদাহরণ।
হিজਸੇব

কঠোরভাবে কোনও উত্তর নয় তবে আপনি যখন তিনবার একটি মুদ্রা ফ্লিপ করেন এবং মাথা দু'বার উঠে আসে তখন কোনও শিক্ষার্থী বিশ্বাস করবে না, সেই মাথাটি লেজ হিসাবে দ্বিগুণ হয়ে গেছে hat এটি সত্যিকারের গবেষণার পরেও সত্যই নিশ্চিত।
বার্নহার্ড

1
আপনি সত্যই লিখেছেন এই উত্তরটি আপনি যাচাই করতে পারেন: stats.stackexchange.com/a/134385/61496
ইয়ার

আপনি সম্ভবত বেইস বিধি, যা ঘনত্ববাদী সম্ভাবনা / অনুমান এবং বায়েসীয় পরিসংখ্যানগুলিতে প্রয়োগ করা যেতে পারে যেখানে "সম্ভাবনা" বিশ্বাসের একটি সংক্ষিপ্তসার, সংঘাত করছেন?
অ্যাডামো

উত্তর:


6

বায়েশিয়ান অনুসন্ধান তত্ত্বটি বায়েশিয়ান পরিসংখ্যানগুলির একটি আকর্ষণীয় বাস্তব-বিশ্ব অ্যাপ্লিকেশন যা সমুদ্রের হারিয়ে যাওয়া জাহাজগুলির সন্ধানের জন্য বহুবার প্রয়োগ করা হয়েছে। শুরু করতে, একটি মানচিত্র স্কোয়ারে বিভক্ত। প্রতিটি বর্গক্ষেত্র সর্বশেষ জ্ঞাত অবস্থান, শিরোনাম, সময় নিখোঁজ, স্রোত ইত্যাদির উপর ভিত্তি করে হারিয়ে যাওয়া পাত্রটি রাখার পূর্ব সম্ভাবনা নির্ধারিত হয় অতিরিক্তভাবে, প্রতিটি বর্গক্ষেত্রটি জাহাজটি যদি সেই বর্গক্ষেত্রের মধ্যে থাকে তবে এটি নির্ধারণের শর্তযুক্ত সম্ভাবনা নির্ধারিত হয় তার উপর ভিত্তি করে জলের গভীরতার মতো জিনিস। এই বিতরণগুলি মানচিত্রের স্কোয়ারগুলিকে অগ্রাধিকার হিসাবে সংযুক্ত করা হয়েছে যা ইতিবাচক ফলাফল তৈরির সর্বাধিক সম্ভাবনা রয়েছে - জাহাজের পক্ষে সম্ভবত এটি সম্ভবত সবচেয়ে সম্ভাবনামুলক জায়গা নয়, তবে সম্ভবত জাহাজটি সন্ধান করার সবচেয়ে সম্ভাবনাময় জায়গা।


1
চমৎকার, এগুলি হ'ল থিওরি দ্য ডট উইল ডাই না: এই বিনোদনমূলক বইয়ে বর্ণিত অ্যাপ্লিকেশনগুলির মধ্যে এগুলি বর্ণনা করা হয়েছে : বাইস রুল কীভাবে এনিগমা কোডটি ক্র্যাক করেছে, রাশিয়ান সাবমেরিনকে হান্ট ডাউন করেছে এবং দুটি শতাব্দীর বিতর্ক থেকে বিজয়ী হয়েছে । এছাড়াও, টিউরিং এই ধরণের যুক্তি ব্যবহার করে এনজিমা ফাটল।
jpmuc

সম্ভাবনাবাদী কিন্তু এটি কি বেয়েসিয়ান?
অ্যান্ড্রু

5

আমি মনে করি ক্রমিক সংখ্যাগুলি থেকে উত্পাদন বা জনসংখ্যার আকার অনুমান করা আকর্ষণীয় যদি .তিহ্যগত ব্যাখ্যামূলক উদাহরণ থাকে। এখানে আপনি সর্বাধিক পৃথক পৃথক বিতরণ চেষ্টা করছেন। আপনার পূর্বের নির্বাচনের উপর নির্ভর করে সর্বাধিক সম্ভাবনা এবং বায়েশিয়ান অনুমানগুলি বেশ স্বচ্ছ উপায়ে পৃথক হবে।

সম্ভবত সবচেয়ে বিখ্যাত উদাহরণটি দ্বিতীয় বিশ্বযুদ্ধের সময় জার্মান ট্যাঙ্কগুলির উত্পাদন হারের অনুমান করা হচ্ছে (র‌্যাগসস অ্যান্ড ব্রোডি, ১৯৪৪) দ্বারা ঘন ঘন সংঘটিত সেটিংয়ে করা ট্যাঙ্ক সিরিয়াল নম্বর ব্যান্ড এবং প্রস্তুতকারক কোড থেকে tan বায়েশিয়ান দৃষ্টিকোণ সম্পর্কিত তথ্য বিশিষ্ট ব্যক্তিদের সাথে একটি বিকল্প বিশ্লেষণ (ডাউনি, ২০১৩) দ্বারা এবং (হাহলে এবং হোল্ড, ২০০৪) দ্বারা একটি অযৌক্তিক অননুমোদিত প্রিরিয়ার দ্বারা সম্পন্ন হয়েছে। (হাহলে ও হেল্ড, ২০০৪) রচনায় সাহিত্যে পূর্বের চিকিত্সার আরও অনেক উল্লেখ রয়েছে এবং এই সাইটে এই সমস্যা নিয়ে আরও আলোচনা রয়েছে।

সূত্র:

অধ্যায় 3, ডাউনে, অ্যালেন। থাই বায়েস: পাইথনে বায়েসিয়ান পরিসংখ্যান। "ও'রিলি মিডিয়া, ইনক।", 2013।

উইকিপিডিয়া

রগলস, আর; ব্রোডি, এইচ। (1947)। "দ্বিতীয় বিশ্বযুদ্ধের অর্থনৈতিক বুদ্ধিমত্তার একটি অভিজ্ঞতা অভিজ্ঞতা"। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল। 42 (237): 72।

হাহলে, মাইকেল এবং লিওনহার্ড হেল্ড। জনসংখ্যার আকারের বায়েশিয়ান অনুমান। নং 499. আলোচনার কাগজ // সন্ডারফর্সচুংস্রেইরিচ 386 ডের লুডভিগ-ম্যাক্সিমিলিয়ানস-ইউনিভার্সিটি মিচেন, 2006।


3

স্পেসিও-টেম্পোরাল ডেটা , উইলির জন্য ক্রেসি ও উইকল স্ট্যাটিস্টিক্সে একটি দুর্দান্ত গল্প আছে, ১৯৮৮ সালে হারিয়ে যাওয়া ইউএসএস বৃশ্চিকের (বায়সিয়ান) অনুসন্ধানের বিষয়ে, যে সাবমেরিনটি হারিয়ে গিয়েছিল We আমরা আমাদের শিক্ষার্থীদের কাছে এই গল্পটি বলি এবং তাদের একটি সম্পাদন করতে পারি ( সরলীকৃত) সিমুলেটর ব্যবহার করে অনুসন্ধান করুন ।

একই ধরণের উদাহরণগুলি হারিয়ে যাওয়া উড়ানের MH370 এর গল্পটির চারপাশে নির্মিত হতে পারে; আপনি MH370 , স্প্রঞ্জার-ভার্লাগের অনুসন্ধানে ডেভি এট আল।, বেইসিয়ান পদ্ধতিগুলি সন্ধান করতে চাইতে পারেন ।


1

এখানে একটি গড়, আনুমানিক হিসাব একটি উদাহরণ , সাধারন একটানা তথ্য থেকে। উদাহরণস্বরূপ সরাসরি আবিষ্কার করার আগে, আমি নরমাল-নরমাল বায়েশিয়ান ডেটা মডেলের জন্য কিছু গণিত পর্যালোচনা করতে চাই।θ

দ্বারা চিহ্নিত এন ক্রমাগত মানগুলির একটি এলোমেলো নমুনা বিবেচনা করুন , y n । এখানে ভেক্টর Y = ( Y 1 , , Y এন ) টি তথ্য জড়ো প্রতিনিধিত্ব করে। জ্ঞাত বৈকল্পিক এবং স্বতন্ত্র এবং অভিন্নভাবে বিতরণকৃত (আইআইডি) নমুনাগুলির সাথে সাধারণ তথ্যগুলির সম্ভাব্যতা মডেলY1,,YএনY=(Y1,,Yএন)টি

Y1,,Yএন|θ~এন(θ,σ2)

বা আরও সাধারণত বায়েশিয়ান লিখেছেন,

Y1,,Yএন|θ~এন(θ,τ)

যেখানে ; τ যথার্থ হিসাবে পরিচিতτ=1/σ2τ

এই স্বরলিপিটি সহ, জন্য তখন ঘনত্বYআমি

(Yআমি|θ,τ)=(τ2π)×এক্সপি(-τ(Yআমি-θ)2/2)

শাস্ত্রীয় পরিসংখ্যান (অর্থাত সর্বোচ্চ সম্ভাবনা) আমাদেরকে একটি অনুমান দেয় θ = ˉ Yθ^=Y¯

বায়েশিয়ান দৃষ্টিকোণে আমরা পূর্বের তথ্য সহ সর্বাধিক সম্ভাবনা যুক্ত করি। এটি স্বাভাবিক ডেটা মডেল জন্য গতকাল দেশের সর্বোচ্চ তাপমাত্রা একটি পছন্দ জন্য অন্য সাধারন বন্টন হয় । সাধারণ বিতরণটি সাধারণ বিতরণের সাথে সম্মিলিতθ

θ~এন(একটি,1/)

এই সাধারণ-সাধারণ (বহু বীজগণিতের পরে) ডেটা মডেল থেকে আমরা যে পোস্টেরিয়র বিতরণ করি তা হ'ল অন্য সাধারণ বিতরণ।

θ|Y~এন(+ +এনτএকটি+ +এনτ+ +এনτY¯,1+ +এনτ)

উত্তরোত্তর নির্ভুলতা এবং গড়টি a এবং ˉ y , b এর মধ্যবর্তী ওজনযুক্ত গড়+ +এনτএকটিY¯+ +এনτএকটি+ +এনτ+ +এনτY¯

এই বায়েশিয়ান পদ্ধতিটির উপযোগিতাটি আপনি বিতরণ পেয়েছেন তা থেকে আসে y কেবলমাত্র একটি অনুমানের চেয়ে θ একটি স্থির (অজানা) মানের চেয়ে এলোমেলো পরিবর্তনশীল হিসাবে দেখা হয়। তদ্ব্যতীত , এই মডেলটিতে আপনার অনুমান the অনুভূতিক গড় এবং পূর্বের তথ্যের মধ্যে একটি ওজনযুক্ত গড়।θ|Yθθ

এটি বলেছিল, আপনি এখন এটি বর্ণনা করার জন্য যে কোনও সাধারণ-ডেটা পাঠ্যপুস্তকের উদাহরণ ব্যবহার করতে পারেন। আমি airqualityআর এর মধ্যে থাকা ডেটা সেট করব average গড় বায়ুর গতি (এমপিএইচ) অনুমান করার সমস্যাটি বিবেচনা করুন।

> ## New York Air Quality Measurements
> 
> help("airquality")
> 
> ## Estimating average wind speeds
> 
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>

এখানে চিত্র বর্ণনা লিখুন

> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
> 
> 
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
> 
> a = 12
> b = 2
> 
> ## Your posterior would be N((1/))
> 
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
> 
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
> 

এখানে চিত্র বর্ণনা লিখুন

> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5%     97.5% 
9.958984 10.047404 

এই বিশ্লেষণে, গবেষক (আপনি) বলতে পারেন যে প্রদত্ত ডেটা + পূর্বের তথ্য, আপনার 50 শতাংশ পার্সেন্টাইল ব্যবহার করে গড় বাতাসের অনুমান, গতি 10.00324 হওয়া উচিত, যা কেবলমাত্র ডেটা থেকে গড় ব্যবহারের চেয়ে বেশি। আপনি একটি সম্পূর্ণ বিতরণও পাবেন, যা থেকে আপনি 2.5 এবং 97.5 কোয়ান্টাইল ব্যবহার করে 95% বিশ্বাসযোগ্য ব্যবধানটি বের করতে পারেন।

নীচে আমি দুটি উল্লেখ অন্তর্ভুক্ত করছি, আমি কেসেলার সংক্ষিপ্ত কাগজটি উচ্চভাবে পড়ার পরামর্শ দিচ্ছি। এটি বিশেষত বোধগম্য বায়স পদ্ধতিগুলির উদ্দেশ্যে, তবে সাধারণ মডেলগুলির জন্য সাধারণ বায়েশিয়ান পদ্ধতি ব্যাখ্যা করে।

তথ্যসূত্র:

  1. কেসেলা, জি। (1985)। এমিরিকাল বেইস ডেটা অ্যানালাইসিসের পরিচিতি। আমেরিকান পরিসংখ্যানবিদ, 39 (2), 83-87।

  2. গেলম্যান, এ। (2004)। বায়েশিয়ান ডেটা বিশ্লেষণ (২ য় সংস্করণ, পরিসংখ্যান বিজ্ঞানের পাঠ্য)। বোকা রাতন, ফ্লা: চ্যাপম্যান ও হল / সিআরসি।


1

গবেষণার একটি ক্ষেত্র যেখানে আমি বিশ্বাস করি যে বেইশিয়ান পদ্ধতিগুলি একেবারে প্রয়োজনীয়, সেগুলি অনুকূল নকশা design

এক্সβএক্স

এক্সβββএক্স

  • এন=0β^

  • β^

  • β=1β^=5এক্সβ=5এক্স

  • β

এক্সএক্স

এক্সβ

βএক্স

এক্স


1

আমি ইদানীং এই প্রশ্নটি নিয়ে ভাবছিলাম, এবং আমার মনে হয় আমার এমন একটি উদাহরণ রয়েছে যেখানে বায়সিয়ানরা বোধগম্য হন, ব্যবহারের সাথে পূর্বের সম্ভাবনাটি: ক্লিনিকাল পরীক্ষার সম্ভাবনা অনুপাত।

উদাহরণটি এটির একটি হতে পারে: প্রতিদিনের অনুশীলনের অবস্থার অধীনে প্রস্রাবের ডাইপ্লাইডের বৈধতা (পারিবারিক অনুশীলন 2003; 20: 410-2)। ধারণাটি হ'ল প্রস্রাবের ডাইপ্লাইডের ইতিবাচক ফলাফলটি মূত্র সংক্রমণের ডায়াগনস্টিকে কী বোঝায়। ইতিবাচক ফলাফলের সম্ভাব্যতা অনুপাত:

এলআর(+ +)=টিগুলিটি+ +|এইচ+ +টিগুলিটি+ +|এইচ-=এসএনগুলিআমিআমিআমিটিY1-গুলিপিআমিআমিআমিটিY
এইচ+ +এইচ-

হেআর(+ +|টিগুলিটি+ +)=এলআর(+ +)×হেআর(+ +)
হেআরহেআর(+ +|টিগুলিটি+ +)হেআর(+ +)

এলআর(+ +)=12.2এলআর(-)=0.29

পি+ +=2/3পি+ +|টিগুলিটি+ +=0.96পি+ +|টিগুলিটি-=0.37

এখানে পরীক্ষাটি সংক্রমণ সনাক্তকরণে ভাল তবে সংক্রমণটি বাতিল করা ভাল নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.