আমি কাগজপত্র একটি সেট পর্যালোচনা করেছেন, প্রতিটি রিপোর্ট একটি পরিমাপ পর্যবেক্ষিত গড় এবং এসডি পরিচিত আকারের তার নিজ নিজ নমুনা, । আমি যে নতুন স্টাডিয়াকে ডিজাইন করছি এবং একই অনুমানের মধ্যে কতটা অনিশ্চয়তা রয়েছে তাতে একই পরিমাপের সম্ভাব্য বন্টন সম্পর্কে আমি সর্বোত্তম সম্ভাবনাটি অনুমান করতে চাই। ) ধরে আমি খুশি ।এন এক্স ∼ এন ( μ , σ 2)
আমার প্রথম চিন্তাটি ছিল মেটা-বিশ্লেষণ, তবে মডেলগুলি সাধারণত পয়েন্টের অনুমান এবং সংশ্লিষ্ট আত্মবিশ্বাসের অন্তরগুলিতে মনোনিবেশ করে। যাইহোক, আমি এর সম্পূর্ণ বিতরণ সম্পর্কে কিছু বলতে চাই , যা এই ক্ষেত্রে তারতম্য সম্পর্কে একটি অনুমান করা সহ, । σ 2
আমি পূর্বের জ্ঞানের আলোকে প্রদত্ত বিতরণের পুরো পরামিতিগুলির সম্পূর্ণ সেটটি অনুমান করার সম্ভাব্য বাইয়েসান পদ্ধতির বিষয়ে পড়ছি reading এটি সাধারণত আমার কাছে আরও বোধগম্য হয় তবে বায়েসীয় বিশ্লেষণের সাথে আমার শূন্য অভিজ্ঞতা রয়েছে। এটি আমার দাঁত কাটা একটি সরল, অপেক্ষাকৃত সহজ সমস্যা বলে মনে হচ্ছে।
1) আমার সমস্যাটি দেওয়া, কোন পদ্ধতির সর্বাধিক বোধ হয় এবং কেন? মেটা-বিশ্লেষণ বা একটি বায়সিয়ান পদ্ধতির?
2) আপনি যদি মনে করেন যে বায়েশিয়ান পদ্ধতির পক্ষে সবচেয়ে ভাল, আপনি কি আমাকে এটিকে প্রয়োগ করার উপায়টির দিকে লক্ষ্য করতে পারেন (পছন্দমত আর)?
সম্পাদনাগুলি:
আমি 'সিম্পল' বায়েশিয়ান পদ্ধতিতে যা মনে করি তাতে এটি কার্যকর করার চেষ্টা করছি।
যেমন আমি উপরে বলেছি, আমি পূর্বের তথ্যের আলোকে, যেমন জন্য অনুমিত গড়, , তবে but তেও আগ্রহী নই Iσ 2 পি ( μ , σ 2 | ওয়াই )
আবার আমি বাস্তবে বায়িয়ানিজম সম্পর্কে কিছুই জানি না, তবে অজানা গড় এবং বৈকল্পিকতা সহ একটি সাধারণ বিতরণের পূর্ববর্তীটি স্বাভাবিক-বিপরীত-গামা বিতরণের সাথে কনজুগ্যাসির মাধ্যমে একটি বন্ধ ফর্ম সমাধান রয়েছে তা খুঁজে পেতে খুব বেশি সময় লাগেনি ।
সমস্যাটিকে হিসাবে সংস্কার করা হয়েছে ।
পি ( σ 2 | ওয়াই ) একটি সাধারণ বিতরণ নিয়ে অনুমান করা হয়; একটি বিপরীত-গামা বিতরণ সহ।
এটির মাথা ঘুরিয়ে নিতে আমার কিছুটা সময় লেগেছে, তবে এই লিঙ্কগুলি থেকে ( 1 , 2 ) আমি কীভাবে আর এ এটি করতে পারি তা क्रमবদ্ধ করতে সক্ষম হয়েছি বলে আমি মনে করি।
আমি 33 টি স্টাডি / নমুনার প্রত্যেকের জন্য এক সারি থেকে তৈরি একটি ডেটা ফ্রেম এবং গড়, প্রকরণ এবং নমুনার আকারের জন্য কলামগুলি দিয়ে শুরু করেছি। আমি আমার প্রথম তথ্য হিসাবে প্রথম সারির 1 টি থেকে গড়, বৈকল্পিক এবং নমুনার আকারটি ব্যবহার করেছি। এরপরে আমি পরবর্তী স্টাডি থেকে প্রাপ্ত তথ্য দিয়ে এটি আপডেট করেছি, প্রাসঙ্গিক প্যারামিটারগুলি গণনা করেছি এবং- এবং এর বিতরণ পেতে সাধারণ-বিপরীত গামা থেকে নমুনা পেয়েছি । সমস্ত 33 টি স্টাডি অন্তর্ভুক্ত না করা পর্যন্ত এটি পুনরাবৃত্তি হবে।σ 2
# Loop start values values
i <- 2
k <- 1
# Results go here
muL <- list() # mean of the estimated mean distribution
varL <- list() # variance of the estimated mean distribution
nL <- list() # sample size
eVarL <- list() # mean of the estimated variance distribution
distL <- list() # sampling 10k times from the mean and variance distributions
# Priors, taken from the study in row 1 of the data frame
muPrior <- bayesDf[1, 14] # Starting mean
nPrior <- bayesDf[1, 10] # Starting sample size
varPrior <- bayesDf[1, 16]^2 # Starting variance
for (i in 2:nrow(bayesDf)){
# "New" Data, Sufficient Statistics needed for parameter estimation
muSamp <- bayesDf[i, 14] # mean
nSamp <- bayesDf[i, 10] # sample size
sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1) # sum of squares (variance * (n-1))
# Posteriors
nPost <- nPrior + nSamp
muPost <- (nPrior * muPrior + nSamp * muSamp) / (nPost)
sPost <- (nPrior * varPrior) +
sumSqSamp +
((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
varPost <- sPost/nPost
bPost <- (nPrior * varPrior) +
sumSqSamp +
(nPrior * nSamp / (nPost)) * ((muPrior - muSamp)^2)
# Update
muPrior <- muPost
nPrior <- nPost
varPrior <- varPost
# Store
muL[[i]] <- muPost
varL[[i]] <- varPost
nL[[i]] <- nPost
eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)
# Sample
muDistL <- list()
varDistL <- list()
for (j in 1:10000){
varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
v <- 1/rgamma(1, nPost/2, bPost/2)
muDistL[[j]] <- rnorm(1, muPost, v/nPost)
}
# Store
varDist <- do.call(rbind, varDistL)
muDist <- do.call(rbind, muDistL)
dist <- as.data.frame(cbind(varDist, muDist))
distL[[k]] <- dist
# Advance
k <- k+1
i <- i+1
}
var <- do.call(rbind, varL)
mu <- do.call(rbind, muL)
n <- do.call(rbind, nL)
eVar <- do.call(rbind, eVarL)
normsDf <- as.data.frame(cbind(mu, var, eVar, n))
colnames(seDf) <- c("mu", "var", "evar", "n")
normsDf$order <- c(1:33)
এখানে প্রতিটি পাথ চিত্র যা প্রতিটি নতুন নমুনা যুক্ত হওয়ার সাথে সাথে এবং কীভাবে পরিবর্তন করে তা দেখায় ।ই ( σ 2 )
প্রতিটি আপডেটে গড় এবং বৈচিত্রের জন্য আনুমানিক বিতরণ থেকে স্যাম্পলিংয়ের ভিত্তিতে বর্ণচিহ্নগুলি এখানে রয়েছে।
এটি অন্য কারও পক্ষে সহায়ক হলে আমি এটি যুক্ত করতে চেয়েছিলাম এবং যাতে পরিচিত ব্যক্তিরা আমাকে বলতে পারেন যে এটি বুদ্ধিমান, ত্রুটিযুক্ত ইত্যাদি ছিল whether