কুলব্যাক two দুটি গামা বিতরণের মধ্যে লেবেলার বিচ্যুতি


15

পিডিএফ জি ( x ; বি , সি ) = 1 দ্বারা গামা বিতরণ প্যারামিটারাইজ করতে বেছে নেওয়া হচ্ছেΓ(b,c)g(x;b,c)=1Γ(c)xc1bcex/b মধ্যে Kullback-Leibler বিকিরণΓ(bq,cq)এবংΓ(bp,cp)দ্বারা [1] হিসাবে দেওয়া হয়

KLGa(bq,cq;bp,cp)=(cq1)Ψ(cq)logbqcqlogΓ(cq)+logΓ(cp)+cplogbp(cp1)(Ψ(cq)+logbq)+bqcqbp

আমি অনুমান করছি যে Ψ(x):=Γ(x)/Γ(x) হ'ল ডিগম্মা ফাংশন

এটি কোনও উপার্জন ছাড়াই দেওয়া হয়। এটি থেকে প্রাপ্ত কোনও রেফারেন্স আমি পাই না cannot কোন সাহায্য? একটি ভাল রেফারেন্স যথেষ্ট হবে। কঠিন অংশটি গামা পিডিএফের বিপরীতে একীভূত করছে logx

[১] ডাব্লুডি পেনি, সাধারণ, গামা, ডিরিচলেট এবং উইশার্টের ঘনত্বের কেএল-ডাইভারজেন্সগুলি , এখানে পাওয়া যায়: www.fil.ion.ucl.ac.uk/~wpenny/publications/densities.ps


2
থেকে সম্মান সঙ্গে পিডিএফ ডেরিভেটিভ গ্রহণ প্রবর্তন এর ফ্যাক্টর ( এক্স ) আপনি খুঁজছেন যে কেন digamma শো আপ করুন। clog(x)
শুক্র

যদি আপনি পিয়েরে বালাদি এবং লরেন্ট ইত্তি (2010) জুড়ে ঘটে থাকেন তবে "বিটস এবং ওয়াওয়ের: মনোযোগের সাথে প্রয়োগের সাথে আশ্চর্য একটি বয়েসিয়ান তত্ত্ব" নিউরাল নেটওয়ার্ক 23: 649-666, আপনি পাবেন সমীকরণ 73 দুটি গামা পিডিএফ-এর মধ্যে কেএল ডাইভারজেন্স দেয়। যত্ন নিন, তবে মনে হচ্ছে এটি সূত্রটি ভুল-মুদ্রিত।
মিঃ ক্লারিনেট

আমি একই সমস্যার একটি সমাধান খুঁজছেন করছি এবং এই খুঁজে এক দরকারী।
ইয়ে ইয়াং

উত্তর:


15

কেএল ডাইভারজেন্স হ'ল ফর্মের ইন্টিগ্রালের একটি পার্থক্য

$$ q এককালাইন {আমি (এ, বি, সি, ডি) এবং = \ ইন্টিটি ^ {\ ইনফটি} \ লগ \ বামে (\ frac {e ^ {- x / a} x ^ {b-1}} {a ^ বি \ গামা (খ)} \ ডান) rac frac {e ^ {- x / c} x ^ {d-1}} {c ^ d \ গামা (ডি)} ডিএক্স \

& = - rac frac {1} {a} \ int_0 ^ \ infty \ frac {x ^ de ^ {- x / c}} {c ^ d \ গামা (ডি)} \, ডিএক্স - \ লগ (এ ^ বি Am গামা (খ)) _0 অন্তত ^ \ \ ইনফটি \ ফ্র্যাক {ই ^ {- এক্স / সি} এক্স ^ {ডি -1} {সি ^ ডি \ গামা (ডি)} \, ডিএক্স \ এবং \ কোয়াড + (বি- 1) \ int_0 ^ \ infty \ log (x) rac frac {e ^ {- x / c} x ^ {d-1} {c ^ d \ Gamma (d)} \, dx \

& = - rac frac {cd} {a} - \ লগ (a ^ b \ গামা (খ)) + (খ -1) \ int_0 ^ \ infty \ লগ (এক্স) \ frac {e ^ {- এক্স / সি } x ^ {d-1} {c ^ d \ গামা (ডি)} \, ডিএক্স} $$

আমাদের কেবল ডান হাতের অবিচ্ছেদ্য কাজ করতে হবে, যা পর্যবেক্ষণ করে প্রাপ্ত হয় by

dΓ(d)=d0ex/cxd1cddx=d0ex/c(x/c)d1cdx=0ex/cxd1cdlogxcdx=0log(x)ex/cxd1cddxlog(c)Γ(d).

কোথা হইতে

b1Γ(d)0log(x)ex/c(x/c)d1dx=(b1)Γ(d)Γ(d)+(b1)log(c).

পূর্ববর্তী ফলন মধ্যে প্লাগ ইন

I(a,b,c,d)=cdalog(abΓ(b))+(b1)Γ(d)Γ(d)+(b1)log(c).

এবং Γ ( , ) এর মধ্যে কেএল ডাইভার্জেন্স সমান I ( c , d , c , d ) - I ( a , b , c , d ) , যা একত্র করার জন্য সোজা।Γ(c,d)Γ(a,b)I(c,d,c,d)I(a,b,c,d)


বাস্তবায়ন বিশদ

গামা ফাংশনগুলি দ্রুত বৃদ্ধি পায়, যাতে ওভারফ্লো এড়াতে গামার গণনা করবেন না এবং এর লোগারিডম গ্রহণ করবেন না: পরিবর্তে লগ-গামা ফাংশনটি ব্যবহার করুন যা কোনও পরিসংখ্যানগত কম্পিউটিং প্ল্যাটফর্মে পাওয়া যাবে (সেই বিষয়ে এক্সেল সহ)।

অনুপাত এর লগারিদমিক ব্যুৎপন্ন হয় Γ , সাধারণত বলা ψ , digamma ফাংশন। যদি এটি আপনার কাছে না পাওয়া যায় তবে উইকিপিডিয়া নিবন্ধে বর্ণিত হিসাবে এটি আনুমানিক করার জন্য তুলনামূলকভাবে সহজ উপায় রয়েছে ।Γ(d)/Γ(d)Γ,ψ,

এখানে, উদাহরণস্বরূপ, আই এরR পরিপ্রেক্ষিতে সূত্রের প্রত্যক্ষ বাস্তবায়ন । এটি বীজগণিতভাবে ফলাফলকে সহজ করার কোনও সুযোগকে কাজে লাগায় না, যা এটি আরও কিছুটা দক্ষ করে তোলে ( ψ এর অনর্থক গণনা দূর করে )।Iψ

#
# `b` and `d` are Gamma shape parameters and
# `a` and `c` are scale parameters.
# (All, therefore, must be positive.)
#
KL.gamma <- function(a,b,c,d) {
  i <- function(a,b,c,d)
    - c * d / a - b * log(a) - lgamma(b) + (b-1)*(psigamma(d) + log(c))
  i(c,d,c,d) - i(a,b,c,d)
}
print(KL.gamma(1/114186.3, 202, 1/119237.3, 195), digits=12)

2
ভাল উত্তর. ধন্যবাদ! আমি বিশ্বাস করি যে চতুর্থ সমতাতে একটি চিহ্ন ত্রুটি আছে। এছাড়াও, আপনার গামা পিডিএফ ডোনামনেটারে 'গ' এর অতিরিক্ত ফ্যাক্টর থাকা উচিত। আপনি কি আমাকে এটি সম্পাদনা করতে চান?
ইয়ান ল্যাংমোর

এক্স/এক্স

2
আমি সংশোধন করেছি।
ইয়ান ল্যাংমোর

10

গামা বিতরণ তাত্পর্যপূর্ণ পরিবারে কারণ এর ঘনত্বটি প্রকাশ করা যেতে পারে:

f(xθ)=exp(η(θ)T(x)g(θ)+h(x))

Looking at the Gamma density function, its log-normalizer is

g(θ)=log(Γ(c))+clog(b)
with natural parameters
θ=[c11b]

All distributions in the exponential family have KL divergence:

KL(q;p)=g(θp)g(θq)(θpθq)g(θq).

There's a really nice proof of that in:

Frank Nielsen, École Polytechnique, and Richard Nock, Entropies and cross-entropies of exponential families.


Didn't know this. Just a quick question - the g(.) function, does it have to be the same for θp as for θq? So for example, would the above formula be valid for KL divergence of normal pdf from gamma pdf?
probabilityislogic

1
Yes, this formula is for two distributions in the same exponential family.
Neil G
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.