এখানে একটি গড়, আনুমানিক হিসাব একটি উদাহরণ , সাধারন একটানা তথ্য থেকে। উদাহরণস্বরূপ সরাসরি আবিষ্কার করার আগে, আমি নরমাল-নরমাল বায়েশিয়ান ডেটা মডেলের জন্য কিছু গণিত পর্যালোচনা করতে চাই।θ
দ্বারা চিহ্নিত এন ক্রমাগত মানগুলির একটি এলোমেলো নমুনা বিবেচনা করুন । । । , y n । এখানে ভেক্টর Y = ( Y 1 , । । । , Y এন ) টি তথ্য জড়ো প্রতিনিধিত্ব করে। জ্ঞাত বৈকল্পিক এবং স্বতন্ত্র এবং অভিন্নভাবে বিতরণকৃত (আইআইডি) নমুনাগুলির সাথে সাধারণ তথ্যগুলির সম্ভাব্যতা মডেলY1, । । । , yএনY= ( y)1,। । । , yএন)টি
Y1, । । । , yএন| θ~ এন( θ , σ)2)
বা আরও সাধারণত বায়েশিয়ান লিখেছেন,
Y1, । । । , yএন| θ~ এন( θ , τ))
যেখানে ; τ যথার্থ হিসাবে পরিচিতτ= 1 / σ2τ
এই স্বরলিপিটি সহ, জন্য তখন ঘনত্বYআমি
চ( y)আমি| θ,τ) = (√τ2 π) × ই x পি ( - τ ) τ( y)আমি- θ )2/ 2 )
শাস্ত্রীয় পরিসংখ্যান (অর্থাত সর্বোচ্চ সম্ভাবনা) আমাদেরকে একটি অনুমান দেয় θ = ˉ Yθ^= y¯
বায়েশিয়ান দৃষ্টিকোণে আমরা পূর্বের তথ্য সহ সর্বাধিক সম্ভাবনা যুক্ত করি। এটি স্বাভাবিক ডেটা মডেল জন্য গতকাল দেশের সর্বোচ্চ তাপমাত্রা একটি পছন্দ জন্য অন্য সাধারন বন্টন হয় । সাধারণ বিতরণটি সাধারণ বিতরণের সাথে সম্মিলিত ।θ
θ ∼ এন( ক , ১ / খ )
এই সাধারণ-সাধারণ (বহু বীজগণিতের পরে) ডেটা মডেল থেকে আমরা যে পোস্টেরিয়র বিতরণ করি তা হ'ল অন্য সাধারণ বিতরণ।
θ | Y। এন( খ)খ + + ঢ τএকটি + + ঢ τখ + + ঢ τY¯, ঘখ + + ঢ τ)
উত্তরোত্তর নির্ভুলতা এবং গড়টি a এবং ˉ y , b এর মধ্যবর্তী ওজনযুক্ত গড়খ + + ঢ τএকটিY¯ ।খখ + + ঢ τএকটি + + ঢ τখ + + ঢ τY¯
এই বায়েশিয়ান পদ্ধতিটির উপযোগিতাটি আপনি বিতরণ পেয়েছেন তা থেকে আসে y কেবলমাত্র একটি অনুমানের চেয়ে θ একটি স্থির (অজানা) মানের চেয়ে এলোমেলো পরিবর্তনশীল হিসাবে দেখা হয়। তদ্ব্যতীত , এই মডেলটিতে আপনার অনুমান the অনুভূতিক গড় এবং পূর্বের তথ্যের মধ্যে একটি ওজনযুক্ত গড়।θ | Yθθ
এটি বলেছিল, আপনি এখন এটি বর্ণনা করার জন্য যে কোনও সাধারণ-ডেটা পাঠ্যপুস্তকের উদাহরণ ব্যবহার করতে পারেন। আমি airquality
আর এর মধ্যে থাকা ডেটা সেট করব average গড় বায়ুর গতি (এমপিএইচ) অনুমান করার সমস্যাটি বিবেচনা করুন।
> ## New York Air Quality Measurements
>
> help("airquality")
>
> ## Estimating average wind speeds
>
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>
> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
>
>
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
>
> a = 12
> b = 2
>
> ## Your posterior would be N((1/))
>
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
>
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>
> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5% 97.5%
9.958984 10.047404
এই বিশ্লেষণে, গবেষক (আপনি) বলতে পারেন যে প্রদত্ত ডেটা + পূর্বের তথ্য, আপনার 50 শতাংশ পার্সেন্টাইল ব্যবহার করে গড় বাতাসের অনুমান, গতি 10.00324 হওয়া উচিত, যা কেবলমাত্র ডেটা থেকে গড় ব্যবহারের চেয়ে বেশি। আপনি একটি সম্পূর্ণ বিতরণও পাবেন, যা থেকে আপনি 2.5 এবং 97.5 কোয়ান্টাইল ব্যবহার করে 95% বিশ্বাসযোগ্য ব্যবধানটি বের করতে পারেন।
নীচে আমি দুটি উল্লেখ অন্তর্ভুক্ত করছি, আমি কেসেলার সংক্ষিপ্ত কাগজটি উচ্চভাবে পড়ার পরামর্শ দিচ্ছি। এটি বিশেষত বোধগম্য বায়স পদ্ধতিগুলির উদ্দেশ্যে, তবে সাধারণ মডেলগুলির জন্য সাধারণ বায়েশিয়ান পদ্ধতি ব্যাখ্যা করে।
তথ্যসূত্র:
কেসেলা, জি। (1985)। এমিরিকাল বেইস ডেটা অ্যানালাইসিসের পরিচিতি। আমেরিকান পরিসংখ্যানবিদ, 39 (2), 83-87।
গেলম্যান, এ। (2004)। বায়েশিয়ান ডেটা বিশ্লেষণ (২ য় সংস্করণ, পরিসংখ্যান বিজ্ঞানের পাঠ্য)। বোকা রাতন, ফ্লা: চ্যাপম্যান ও হল / সিআরসি।