পূর্ববর্তী এবং সম্ভাবনা থেকে আমি কীভাবে পরবর্তী ঘনত্বের প্রাক্কলন গণনা করতে পারি?


9

আমি কোনও উত্তরোত্তর গণনা করার জন্য বয়েসের উপপাদ্যটি কীভাবে ব্যবহার করব তা বোঝার চেষ্টা করছি তবে গণ্য পদ্ধতির সাথে আটকে যাচ্ছি, উদাহরণস্বরূপ, নিম্নলিখিত ক্ষেত্রে এটি কীভাবে পূর্ব এবং সম্ভাবনার পণ্যটি গ্রহণ করবেন এবং তারপরে গণনা করবেন তা আমার কাছে পরিষ্কার নয় অবর:

এই উদাহরণস্বরূপ, আমি এর উত্তরোত্তর সম্ভাবনা গণনা করতে আগ্রহী μ এবং আমি আগে একটি স্ট্যান্ডার্ড স্বাভাবিক ব্যবহার করি μ পি(μ)~এন(μ=0,σ=1) , তবে আমি কীভাবে পূর্বের থেকে উত্তরোত্তর গণনা করব তা জানতে চাইμ এমসিএমসি চেইন দ্বারা প্রতিনিধিত্ব করতে হয়, তাই আমি 1000 নমুনা ব্যবহার করব আমার সূচনা পয়েন্ট হিসাবে

  • পূর্ব থেকে 1000 নমুনা।

    set.seed(0)
    prior.mu      <- 0
    prior.sigma   <- 1
    prior.samples <- sort(rnorm(1000, prior.mu, prior.sigma))
    
  • কিছু পর্যবেক্ষণ করুন:

    observations <- c(0.4, 0.5, 0.8, 0.1)
    
  • এবং সম্ভাবনা গণনা করুন, যেমন :পি(Y|μ,σ)

    likelihood <- prod(dnorm(observations, mean(prior.samplse), sd(prior.samples)))
    

আমি যা পুরোপুরি বুঝতে পারি না তা হ'ল:

  1. কখন / কীভাবে সম্ভাবনার দ্বারা পূর্বে গুণ করা যায়?
  2. কখন / কীভাবে উত্তর ঘনত্বকে স্বাভাবিক করবেন?

দয়া করে নোট করুন: আমি সাধারণ গণনা সমাধানে আগ্রহী যা কোনও বিশ্লেষণাত্মক সমাধান না করে সাধারণ সমস্যা হতে পারে


1
আপনার উদাহরণে বিভিন্ন বিতরণ কী তা তা পরিষ্কার নয়। আপনার পূর্ববর্তী / শর্তসাপেক্ষ বিতরণ কি তা দয়া করে পরিষ্কার করুন। কারণ এটি হতে পারে যে আপনার কিছু পরিভাষা মিশ্রিত হয়েছে।
নিক সাব্বে

@ নিক আপনি সঠিক আছেন। প্রতিক্রিয়ার জন্য ধন্যবাদ. আমি স্পষ্ট করার চেষ্টা করেছি।
আবে

উত্তর:


8

আপনার বেশ কয়েকটি জিনিস মিশে গেছে। তত্ত্বটি পূর্ব বিতরণ থেকে নমুনাগুলি নয়, পূর্ববর্তী বিতরণ এবং সম্ভাবনাকে গুণিত করার বিষয়ে কথা বলে। এছাড়াও এটি আপনার পূর্ববর্তী কি আছে তা পরিষ্কার নয়, এটি কোনও কিছুর অর্থের পূর্ববর্তী? অথবা অন্য কিছু?

তারপরে আপনার সম্ভাব্যতার বিপরীতে জিনিসগুলি বিপরীত হয়েছে, আপনার পর্যবেক্ষণগুলি পূর্বের অঙ্কনগুলির সাথে x বা হওয়া উচিত এবং গড় এবং মানক বিচ্যুতি হিসাবে ज्ञात স্থির স্থির হওয়া উচিত। এবং তারপরেও এটি আপনার প্রতিটি পর্যবেক্ষণের সাথে এক্স এবং একই গড় এবং মানক বিচ্যুতি হিসাবে ডোনর্ম করার জন্য 4 টি কলগুলির পণ্য হবে।

আপনি যা করার চেষ্টা করছেন তা হ'ল যা পরিষ্কার নয়। আপনার প্রশ্ন কি? আপনি কোন প্যারামিটারে আগ্রহী? এই প্যারামিটারগুলিতে আপনার কী পূর্ব (গুলি) রয়েছে? অন্যান্য পরামিতি আছে? আপনি কি তাদের জন্য প্রিয়ার বা স্থির মান আছে?

আপনি বর্তমানে যেভাবে রয়েছেন সেগুলি সম্পর্কে চেষ্টা করার চেষ্টা কেবল আপনার প্রশ্নকে আরও বিভ্রান্ত করবে যতক্ষণ না আপনি নিজের প্রশ্নটি ঠিক কীভাবে কাজ করেন এবং সেখান থেকে কাজ করেন না।

নীচে মূল প্রশ্নটি সম্পাদনার পরে যুক্ত করা হয়েছে।

আপনি এখনও কিছু টুকরো মিস করছেন, এবং সম্ভবত সমস্ত কিছু বুঝতে পারছেন না, তবে আপনি যেখানে থেকে আছেন আমরা সেখান থেকে শুরু করতে পারি।

আমি মনে করি আপনি কয়েকটি ধারণা গুলিয়ে ফেলছেন। এমন সম্ভাবনা রয়েছে যা ডেটা এবং প্যারামিটারগুলির মধ্যে সম্পর্ককে দেখায়, আপনি সাধারণ ব্যবহার করছেন যা 2 পরামিতি, গড় এবং মান বিচ্যুতি (বা বৈকল্পিকতা, বা নির্ভুলতা) রয়েছে। তারপরে প্যারামিটারগুলিতে পূর্বের বিতরণগুলি রয়েছে, আপনি গড় 0 এবং এসডি 1 দিয়ে একটি সাধারণ পূর্ব নির্ধারণ করেছেন তবে এর অর্থ এবং মানক বিচ্যুতি সম্ভাবনার গড় এবং মানক বিচ্যুতি থেকে সম্পূর্ণ পৃথক। সম্পূর্ণ হওয়ার জন্য আপনাকে হয় সম্ভাবনা এসডিটি জানতে হবে বা সম্ভাবনা এসডির উপর একটি অগ্রাধিকার স্থাপন করতে হবে, সরলতার জন্য (তবে কম বাস্তব) আমি ধরে নেব যে সম্ভাবনা এসডি হ'ল12 (এটি ছাড়া অন্য কোনও ভাল কারণ কাজ করে না এবং এটি 1 এর চেয়ে পৃথক)।

সুতরাং আমরা যা করেছি তার অনুরূপ শুরু করতে এবং পূর্ব থেকে উত্পন্ন করতে পারি:

> obs <- c(0.4, 0.5, 0.8, 0.1)
> pri <- rnorm(10000, 0, 1)

এখন আমাদের সম্ভাবনাগুলি গণনা করা দরকার, এটি গড়ের পূর্বের অঙ্কনগুলি, ডেটা সহ সম্ভাবনা এবং এসডিটির জ্ঞাত মানের উপর ভিত্তি করে। ডোনর্ম ফাংশনটি আমাদের একক পয়েন্টের সম্ভাবনা দেবে, তবে আমাদের প্রতিটি পর্যবেক্ষণের জন্য মানগুলি একসাথে গুনতে হবে, এটি করার জন্য এখানে একটি ফাংশন রয়েছে:

> likfun <- function(theta) {
+ sapply( theta, function(t) prod( dnorm(obs, t, 0.5) ) )
+ }

এখন আমরা প্রতিটি অঙ্কনের সম্ভাব্যতাটি পূর্বের থেকে গড়ের জন্য গণনা করতে পারি

> tmp <- likfun(pri)

এখন উত্তরোত্তর পেতে আমাদের একটি নতুন ধরণের ড্র করতে হবে, প্রত্যাখ্যানের নমুনার অনুরূপ একটি পদ্ধতির পূর্বের গড় থেকে প্রাপ্ত নমুনা প্রতিটি পূর্বের ড্রয়ের সম্ভাবনার সাথে সমানুপাতিক অঙ্কন হয় (এটি আপনি যে গুণকের পদক্ষেপের নিকটতম এটি ছিল সম্পর্কে জিজ্ঞাসা করা):

> post <- sample( pri, 100000, replace=TRUE, prob=tmp )

এখন আমরা পোস্টেরিয়রের অঙ্কনের ফলাফলগুলি দেখতে পারি:

> mean(post)
[1] 0.4205842
> sd(post)
[1] 0.2421079
> 
> hist(post)
> abline(v=mean(post), col='green')

এবং উপরোক্ত ফলাফলগুলি তত্ত্ব থেকে বন্ধ ফর্ম মানের সাথে তুলনা করুন

> (1/1^2*mean(pri) + length(obs)/0.5^2 * mean(obs))/( 1/1^2 + length(obs)/0.5^2 )
[1] 0.4233263
> sqrt(1/(1+4*4))
[1] 0.2425356

কোনও খারাপ অনুমান নয়, তবে উত্তরোত্তর থেকে আঁকতে বিল্ট-ইন ম্যাকএমসি সরঞ্জামটি ব্যবহার করা সম্ভবত আরও ভাল কাজ করবে। এই সরঞ্জামগুলির বেশিরভাগটি একই সময়ে এক পয়েন্টের নমুনা উপরের মতো ব্যাচে করে না।

আরও বাস্তবতার সাথে আমরা সম্ভাবনার এসডি জানি না এবং তার জন্য একটি পূর্বেরও প্রয়োজন (প্রায়শই বৈকল্পিকের আগে একটি হ'ল χ2 বা গামা), তবে তারপরে এটি গণনা করা আরও জটিল (ম্যাকএমসি কাজে আসে) এবং এর সাথে তুলনা করার কোনও বন্ধ রূপ নেই।

সাধারণ সমাধান হ'ল ম্যাকএমসি গণনা যেমন উইনবগস বা ওপেনব্যাগস (আরআর মধ্যে ব্রাগস আর এবং বাগগুলির মধ্যে একটি ইন্টারফেস দেয়) বা আর-তে লার্ন বেইস প্যাকেজগুলির প্যাকেজগুলির জন্য বিদ্যমান সরঞ্জামগুলি ব্যবহার করা solution


এটিকে আরও কিছুটা পরিষ্কার করতে আমাকে সাহায্য করার জন্য আপনাকে ধন্যবাদ। আমি আমার উত্তর আপডেট করেছি, যদিও আমি এখনও পরিষ্কার করছি না। আমার প্রশ্ন 'সবচেয়ে ভাল অনুমান কিμপূর্ব এবং ডেটা দেওয়া আছে? ';; অন্য কোনও পরামিতি নেই।
আবে

আমার জন্য এটি ভাঙ্গার জন্য আপনাকে ধন্যবাদ; আমি একটি কঠিন সময় হয়েছে কিন্তু এটি সাহায্য করে।
আবে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.