মন্টি কার্লো দিয়ে কুলব্যাক লেবেলার (কেএল) বিভাজনের অনুমান করুন


10

আমি দুটি অবিচ্ছিন্ন বিতরণ চ এবং জি এর মধ্যে কেএল বৈচিত্রের অনুমান করতে চাই। তবে, আমি f বা g এর জন্য ঘনত্বটি লিখতে পারি না can't আমি কিছু পদ্ধতি (উদাহরণস্বরূপ, মার্কভ চেইন মন্টি কার্লো) এর মাধ্যমে এফ এবং জি উভয় থেকে নমুনা নিতে পারি।

কেএল থেকে এফ থেকে জি পর্যন্ত বিভক্তির সংজ্ঞা দেওয়া হয়েছে

DKL(f||g)=f(x)log(f(x)g(x))dx

এটি এর সাথে এর প্রত্যাশা যাতে আপনি কিছু মন্টি কার্লো অনুমান করতে পারেনlog(f(x)g(x))

1NiNlog(f(xi)g(xi))

যেখানে আমি সূচীকরণ করি N নমুনাগুলি যেগুলি আই (1, ..., এন) এর জন্য চ (যেমন থেকে অঙ্কিত হয়েছেxif()

তবে, যেহেতু আমি চ () এবং জি () জানি না, তাই আমি এই মন্টি কার্লো অনুমানটিও ব্যবহার করতে পারি না। এই পরিস্থিতিতে কেএল অনুমানের মানক উপায় কী?

সম্পাদনা: আমি f () বা g () এর জন্য অস্বাভাবিক ঘনত্ব জানি না


আপনি কি ecdfs ব্যবহার বিবেচনা করেছেন?
টবি

এটি কাজ করবে তবে এফ এবং জি (ঘনিষ্ঠ বা নিকট লেজ) এর হার্ড পছন্দ করার জন্য এটি নির্বিচারে ধীর হতে পারে। আপনি যদি লেজগুলি থেকে দূরে স্যাম্পলগুলিকে উপেক্ষা করার সিদ্ধান্ত নেন তবে রকের উপরের দিকে আবদ্ধ হওয়ার সাথে আপনার ভাগ্য বেশি।
খ্রিস্টান চ্যাপম্যান

মূলত একটি অনুলিপি: stats.stackexchange.com/questions/211175/…
kjetil b halvorsen

উত্তর:


7

আমি ধরে নিয়েছি আপনি একটি সাধারণকরণ ধ্রুবক পর্যন্ত এবং মূল্যায়ন করতে পারেন । বোঝাতে এবং ।fgf(x)=fu(x)/cfg(x)=gu(x)/cg

ব্যবহার করা যেতে পারে এমন একটি ধারাবাহিক অনুমানকারী হ'ল যেখানে অনুপাতের জন্য একটি গুরুত্বপূর্ণ নমুনা । আপনি সম্ভবত এখানে ব্যবহারকারীকে এবং জন্য যান্ত্রিক ঘনত্বের হিসাবে এবং যথাক্রমে, এবং unnormalized ঘনত্বের লগ অনুপাত লক্ষ্য।

DKL^(f||g)=[n1jfu(xj)/πf(xj)]11NiN[log(fu(zi)gu(zi))fu(zi)πr(zi)]log(r^)
(1)r^=1/n1/njfu(xj)/πf(xj)jgu(yj)/πg(yj).
cf/cgπfπgfuguπr

সুতরাং আসুন , , এবং । (1) এর সংখ্যক তে । ডিনোমিনেটর তে । অনুপাতটি অবিচ্ছিন্ন ম্যাপিং উপপাদনের সাথে সামঞ্জস্যপূর্ণ। অনুপাতের লগটি আবার অবিচ্ছিন্ন ম্যাপিংয়ের সাথে সামঞ্জস্যপূর্ণ।{xi}πf{yi}πg{zi}πrcfcg

অনুমানের অন্যান্য অংশ সম্পর্কে, বড় সংখ্যক আইন দ্বারা।

1NiN[log(fu(zi)gu(zi))fu(zi)πr(zi)]ascfE[log(fu(zi)gu(zi))]

আমার অনুপ্রেরণা নিম্নলিখিত:

DKL(f||g)=f(x)log(f(x)g(x))dx=f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=cf1Eπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
সুতরাং আমি এটিকে কেবল ট্র্যাকটেবল টুকরো টুকরো টুকরো করলাম।

কীভাবে সমপাতের অনুপাত অনুকরণ করতে যায় সে সম্পর্কে আরও ধারণাগুলির জন্য, আমি একটি কাগজ পেয়েছি যার কয়েকটি রয়েছে: https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732


(+1) এখানে লক্ষ্য করার মতো বিষয় যে যদি আপনি যে নমুনাটি সংগ্রহ করছেন এবং / বা মাত্রার সংখ্যাটি মোটামুটি পরিমাণের তুলনায় লক্ষ্য বিতরণে আরও বেশি মোটা লেজ থাকে তবে যদি নমুনা বন্টনটি আরও উচ্চতর বৈকল্পিক (এমনকি অসীম বৈকল্পিক) থাকতে পারে।
ডেভিড জে হ্যারিস

@ ডেভিডজে.হরিস খুব সত্য
টেলর

6

এখানে আমি ধরে নিয়েছি যে আপনি কেবলমাত্র মডেলগুলি থেকে নমুনা নিতে পারেন; একটি অস্বাভাবিক ঘনত্ব ফাংশন উপলভ্য নয়।

আপনি যে লিখুন

DKL(f||g)=f(x)log(f(x)g(x)=:r)dx,

যেখানে আমি সম্ভাব্যতার অনুপাতটিকে বলে সংজ্ঞায়িত করেছি । অ্যালেক্স স্মোলা লিখেছেন, যদিও ভিন্ন প্রসঙ্গে আপনি কেবল শ্রেণিবদ্ধকে প্রশিক্ষণ দিয়ে এই অনুপাতগুলি "সহজেই" অনুমান করতে পারেন। আসুন ধরে নেওয়া যাক আপনি একটি শ্রেণিবদ্ধ , যা আপনাকে সম্ভাব্যতা বলতে পারে যে একটি পর্যবেক্ষণ দ্বারা উত্পাদিত হয়েছে । দ্রষ্টব্য যে । তারপর:rp(f|x)xfp(g|x)=1p(f|x)

r=p(x|f)p(x|g)=p(f|x)p(x)p(g)p(g|x)p(x)p(f)=p(f|x)p(g|x),

যেখানে প্রথম পদক্ষেপটি বেয়েসের কারণে এবং শেষেরটি অনুমানটি থেকে অনুসরণ করে যে ।p(g)=p(f)

এই জাতীয় শ্রেণীবদ্ধকারী পাওয়া দুটি কারণে যথেষ্ট সহজ হতে পারে।

প্রথমত, আপনি স্টোকাস্টিক আপডেট করতে পারেন। এর অর্থ হ'ল আপনি যদি গ্রেডিয়েন্ট-ভিত্তিক অপটিমাইজারটি ব্যবহার করছেন, যেমন লজিস্টিক রিগ্রেশন বা নিউরাল নেটওয়ার্কগুলির জন্য সাধারণ, আপনি কেবল প্রতিটি এবং থেকে একটি নমুনা আঁকতে এবং একটি আপডেট করতে পারেন।fg

দ্বিতীয়ত, যেমন আপনার ভার্চুয়ালি সীমাহীন ডেটা রয়েছে – আপনি কেবলমাত্র এবং মৃত্যুর নমুনা দিতে পারেন over আপনাকে অতিরিক্ত ফিট বা পছন্দগুলি নিয়ে চিন্তা করতে হবে না।fg


0

@ বেয়ারজ দ্বারা উল্লিখিত সম্ভাব্য শ্রেণিবদ্ধ পদ্ধতি ছাড়াও, আপনি [1-2] এ প্রাপ্ত কেএল ডাইভার্জেন্সের নীচের সীমানাটিও ব্যবহার করতে পারেন:

KL[fg]supT{Exf[T(x)]Exg[exp(T(x)1)]},
যেখানে একটি স্বেচ্ছাসেবী ফাংশন। কিছু হালকা অবস্থার অধীনে, বাঁধনগুলি এর জন্য শক্ত: T:XR
T(x)=1+ln[f(x)g(x)]

এবং মধ্যে কেএল বিচ্যুতি অনুমান করার জন্য , আমরা ফাংশনটিতে নিম্ন সীমাবদ্ধ রিটটি সর্বাধিক করি ।fgT(x)

তথ্যসূত্র:

[১] এনগুইন, এক্স।, ওয়েনরাইট, এমজে এবং জর্ডান, এমআই, ২০১০. উত্তোলনের কার্যকারিতা এবং উত্তল ঝুঁকি হ্রাসের দ্বারা সম্ভাবনা অনুপাত অনুমান করা। তথ্য থিয়োরির আইইইই লেনদেন, 56 (11), পিপি 5847-5861।

[২] নওজিন, এস।, সিসেক, বি। এবং টোমোকা, আর।, ২০১. f নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমের অগ্রগতিগুলিতে (পৃষ্ঠা 271-279)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.