শূন্য স্ফীত পোইসন মডেলের সুপ্ত পরিবর্তনশীল গঠনের জন্য এমএলই গণনা করতে আপনি কীভাবে EM অ্যালগরিদম ব্যবহার করবেন?


10

শূন্য স্ফীত পইসন রিগ্রেশন মডেল একটি নমুনা জন্য সংজ্ঞায়িত করা হয় দ্বারা ওয়াই আমি = { 0 সম্ভাব্যতা সঙ্গে পি আমি + + ( 1 - পি আমি ) - λ আমিসঙ্গে সম্ভাব্যতা ( 1 - পি আমি ) e - λ i λ k i / k ! এবং এটি আরও ধরে নেয় যে পরামিতি λ =(y1,,yn)

Yi={0with probability pi+(1pi)eλikwith probability (1pi)eλiλik/k!
এবং পি = ( পি 1 , , পি এন)λ=(λ1,,λn) সন্তুষ্টp=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gγ.

শূন্য-স্ফীত পোইসন রিগ্রেশন মডেলের সংশ্লিষ্ট লগ সম্ভাবনা হ'ল

L(γ,β;y)=yi=0log(eGiγ+exp(eBiβ))+yi>0(yiBiβeBiβ)i=1nlog(1+eGiγ)yi>0log(yi!)

এখানে এবং জি ডিজাইনের ম্যাট্রিক রয়েছে। এই ম্যাট্রিকগুলি একই রকম হতে পারে, দুটি উত্পাদনকারী প্রক্রিয়ার জন্য যে বৈশিষ্ট্যগুলি ব্যবহার করতে ইচ্ছুক তার উপর নির্ভর করে। তবে তাদের কাছে একই সংখ্যক সারি রয়েছে।BG

ধরে নেওয়া যাক আমরা মান্য করতে পারে যে যখন ওয়াই আমি , শূন্য রাষ্ট্র নিখুঁত পক্ষ থেকে হয় এবং জেড আমি = 0 যখনZi=1YiZi=0Yi

L(γ,β;y,z)=i=1nlog(f(zi|γ))+i=1nlog(f(yi|zi,β))

=i=1nzi(Giγlog(1+eGiγ))+i=1n(1zi)log(1+eGiγ)+i=1n(1zi)[yiBiβeBiβlog(yi!)]
zi=0zi=1

Zi=0Zi=1


f

f

উত্তর:


11

বাক্যে আপনি যে সমস্যার মুখোমুখি হচ্ছেন তার মূল:

তারপরে EM অ্যালগরিদম ব্যবহার করে আমরা দ্বিতীয় লগ-সম্ভাবনাটি সর্বোচ্চ করে তুলতে পারি।

zi

kthzi(k1)th পুনরাবৃত্তি (এটি "ই-পদক্ষেপ" হিসাবে পরিচিত,) তারপরে তাদের সম্পূর্ণ ডেটা লগ সম্ভাবনার বিকল্প করুন (আমরা কেন এই ক্ষেত্রে এটি করতে পারি তার জন্য নীচে সম্পাদনা দেখুন) এবং বর্তমান পুনরাবৃত্তির জন্য অনুমানগুলি পাওয়ার জন্য প্যারামিটারগুলির সাথে এটি সর্বাধিক বৃদ্ধি করুন ("এম-স্টেপ"))

λp

# Generate data
# Lambda = 1,  p(zero) = 0.1
x <- rpois(10000,1)
x[1:1000] <- 0

# Sufficient statistic for the ZIP
sum.x <- sum(x)

# (Poor) starting values for parameter estimates
phat <- 0.5
lhat <- 2.0

zhat <- rep(0,length(x))
for (i in 1:100) {
  # zhat[x>0] <- 0 always, so no need to make the assignment at every iteration
  zhat[x==0] <- phat/(phat +  (1-phat)*exp(-lhat))

  lhat <- sum.x/sum(1-zhat) # in effect, removing E(# zeroes due to z=1)
  phat <- mean(zhat)   

  cat("Iteration: ",i, "  lhat: ",lhat, "  phat: ", phat,"\n")
}

Iteration:  1   lhat:  1.443948   phat:  0.3792712 
Iteration:  2   lhat:  1.300164   phat:  0.3106252 
Iteration:  3   lhat:  1.225007   phat:  0.268331 
...
Iteration:  99   lhat:  0.9883329   phat:  0.09311933 
Iteration:  100   lhat:  0.9883194   phat:  0.09310694 

1-zhatβλi

(Ezilogpi+(1Ezi)log(1pi))

GpiEzi=pi/(pi+(1pi)exp(λi))

আপনি যদি অ্যালগোরিদমকে বোঝার বিপরীতে বাস্তব ডেটাগুলির জন্য এটি করতে চান তবে আর প্যাকেজগুলি ইতিমধ্যে বিদ্যমান; এখানে একটি উদাহরণ রয়েছে http://www.ats.ucla.edu/stat/r/dae/zipoisson.htmpscl গ্রন্থাগারটি ব্যবহার করে ।

সম্পাদনা: আমার জোর দেওয়া উচিত যে আমরা যা করছি তা সম্পূর্ণ-ডেটা লগ সম্ভাবনার প্রত্যাশিত মানকে সর্বাধিক করে তোলা, অনুপস্থিত ডেটা / ল্যাটেন্ট ভেরিয়েবলগুলির প্রত্যাশিত মানগুলির সাথে পূর্ণ-ডেটা লগের সম্ভাবনা সর্বাধিক করে তোলা নয় it যেমনটি ঘটে, অনুপস্থিত ডেটাতে সম্পূর্ণ ডেটা লগ হওয়ার সম্ভাবনা লিনিয়ার, যেমন এটি এখানে রয়েছে, দুটি পন্থা একই, তবে অন্যথায় তা নয়।


@ কোকস, আপনার নিজের পরিপূরক উত্তর হিসাবে এই তথ্যটি যুক্ত করা উচিত, কোনও বিদ্যমান উত্তর পরিবর্তন না করে। এই সম্পাদনাটি অনুমোদিত হওয়া উচিত ছিল না।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.