আমি ধরে নিয়েছি আপনি একটি সাধারণকরণ ধ্রুবক পর্যন্ত এবং মূল্যায়ন করতে পারেন । বোঝাতে এবং ।fgf(x)=fu(x)/cfg(x)=gu(x)/cg
ব্যবহার করা যেতে পারে এমন একটি ধারাবাহিক অনুমানকারী হ'ল
যেখানে
অনুপাতের জন্য একটি গুরুত্বপূর্ণ নমুনা । আপনি সম্ভবত এখানে ব্যবহারকারীকে এবং জন্য যান্ত্রিক ঘনত্বের হিসাবে এবং যথাক্রমে, এবং unnormalized ঘনত্বের লগ অনুপাত লক্ষ্য।
DKLˆ(f||g)=[n−1∑jfu(xj)/πf(xj)]−11N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]−log(r^)
r^=1/n1/n∑jfu(xj)/πf(xj)∑jgu(yj)/πg(yj).(1)
cf/cgπfπgfuguπr
সুতরাং আসুন , , এবং । (1) এর সংখ্যক তে । ডিনোমিনেটর তে । অনুপাতটি অবিচ্ছিন্ন ম্যাপিং উপপাদনের সাথে সামঞ্জস্যপূর্ণ। অনুপাতের লগটি আবার অবিচ্ছিন্ন ম্যাপিংয়ের সাথে সামঞ্জস্যপূর্ণ।{xi}∼πf{yi}∼πg{zi}∼πrcfcg
অনুমানের অন্যান্য অংশ সম্পর্কে,
বড় সংখ্যক আইন দ্বারা।
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
আমার অনুপ্রেরণা নিম্নলিখিত:
DKL(f||g)=∫∞−∞f(x)log(f(x)g(x))dx=∫∞−∞f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=c−1fEπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
সুতরাং আমি এটিকে কেবল ট্র্যাকটেবল টুকরো টুকরো টুকরো করলাম।
কীভাবে সমপাতের অনুপাত অনুকরণ করতে যায় সে সম্পর্কে আরও ধারণাগুলির জন্য, আমি একটি কাগজ পেয়েছি যার কয়েকটি রয়েছে:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732