কেন কেএল ডাইভারজেন্স অ-নেতিবাচক?


18

কেএল ডাইভারজেন অ-নেতিবাচক কেন?

তথ্য তত্ত্বের দৃষ্টিকোণ থেকে আমার এমন স্বজ্ঞাত জ্ঞান রয়েছে:

দুই ensembles আছে বলুন A এবং B যার দ্বারা লেবেল উপাদানের একই সেট দ্বারা গঠিত xp(x) এবং q(x) হ'ল যথাক্রমে A এবং জুড়ে বিভিন্ন সম্ভাবনা বিতরণ B

তথ্য তত্ত্বের দৃষ্টিকোণ থেকে, log2(P(x)) হ'ল বিটগুলির ন্যূনতম পরিমাণ যা জোড় A এর জন্য কোনও উপাদান রেকর্ড করার জন্য প্রয়োজনীয় । যাতে প্রত্যাশা x e n s e m b l e - p ( x ) ln ( p ( x ) ) এর গড় ব্যাখ্যা করা যেতে পারে যে কমপক্ষে আমাদের বি তে একটি উপাদান রেকর্ড করার জন্য কত বিট দরকার ।xA

Σএক্সএনগুলিমি-পি(এক্স)Ln(পি(এক্স))
একজন

যেহেতু এই সূত্রটি আমাদের গড় বিটগুলির উপরে একটি নিম্ন সীমাবদ্ধ রাখে, যাতে একটি পৃথক পরিবেশন যা পৃথক সম্ভাবনা বন্টন q ( x ) নিয়ে আসে , এটি প্রতিটি উপাদান x এর জন্য দেয় যে আবদ্ধটি অবশ্যই বিট নয় কর্তৃক প্রদত্ত পি ( এক্স ) , যা প্রত্যাশা গ্রহণ মানে, Σ এক্স এন গুলি মি - পি ( এক্স ) Ln ( কুই ( এক্স ) )বিকুই(এক্স)এক্সপি(এক্স)

Σএক্সএনগুলিমি-পি(এক্স)Ln(কুই(এক্স))
এই গড় দৈর্ঘ্যটি অবশ্যই পূর্বেরটির চেয়ে বেশি হবে, যা
আমি করা নাএখানে যেহেতুপি(এক্স)এবংকুই(এক্স)ভিন্ন।
Σএক্সএনগুলিমিপি(এক্স)Ln(পি(এক্স))Ln(কুই(এক্স))>0
পি(এক্স)কুই(এক্স)

এটি আমার স্বজ্ঞাত বোধগম্যতা আছে, কেএল ডাইভারজেন্সকে প্রমাণ করার কোনও গাণিতিক উপায় কি অ-নেতিবাচক? সমস্যাটি হিসাবে বলা যেতে পারে:

প্রদত্ত এবং কিউ ( এক্স ) উভয়ই সত্যিকারের লাইনের চেয়ে ধনাত্মক এবং + - পি ( x ) ডি x = 1 , + - কিউ ( এক্স ) ডি x = 1 । প্রমাণ + + - পি ( এক্স ) Ln পি ( এক্স )পি(এক্স)কুই(এক্স)+p(x)dx=1+q(x)dx=1 অ-নেতিবাচক।

+p(x)lnp(x)q(x)

এটি কীভাবে প্রমাণিত হতে পারে? নাকি অতিরিক্ত শর্ত ছাড়াই প্রমাণ করা যায়?


1
আপনি যদি ফ্যানোর অসমতার প্রমাণ বুঝতে পারেন তবে আপেক্ষিক এনট্রপির ননডেটিভিটি অর্জন করা সহজ ।
লারনার ঝাং

উত্তর:


30

প্রমাণ 1:

Lnএকটিএকটি-1একটি>0

-ডিকেএল(পি||কুই)0ডিকেএল(পি||কুই)0

-ডি(পি||কুই)=-Σএক্সপি(এক্স)Lnপি(এক্স)কুই(এক্স)=Σএক্সপি(এক্স)Lnকুই(এক্স)পি(এক্স)(ক)Σএক্সপি(এক্স)(কুই(এক্স)পি(এক্স)-1)=Σএক্সকুই(এক্স)-Σএক্সপি(এক্স)=1-1=0

Ln

-Σএক্সপি(এক্স)লগ2পি(এক্স)-Σএক্সপি(এক্স)লগ2কুই(এক্স)

xp(x)log2p(x)xp(x)log2q(x)0xp(x)log2p(x)q(x)0

আমি এটিকে পৃথক প্রমাণ হিসাবে অন্তর্ভুক্ত করছি না কারণ হ'ল আপনি যদি আমাকে গিবসের অসমতা প্রমাণ করতে বলতেন তবে আমাকে কেএল ডাইভারজেন্সের নেতিবাচকতা থেকে শুরু করতে হবে এবং শীর্ষস্থান থেকে একই প্রমাণটি করতে হবে।


i=1nailog2aibi(i=1nai)log2i=1naii=1nbi

DKL(p||q)0

D(p||q)=xp(x)log2p(x)q(x)(b)(xp(x))log2xp(x)xq(x)=1log211=0

where we have used the Log sum inequality at (b).


Proof 3:

(Taken from the book "Elements of Information Theory" by Thomas M. Cover and Joy A. Thomas)

D(p||q)=xp(x)log2p(x)q(x)=xp(x)log2q(x)p(x)(c)log2xp(x)q(x)p(x)=log21=0

where at (c) we have used Jensen's inequality and the fact that log is a concave function.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.