কুলব্যাক-লেবলার (কেএল) বিচরণের সর্বোচ্চ মান কী


15

আমি আমার পাইথন কোডে কেএল ডাইভার্জেন্স ব্যবহার করতে যাচ্ছি এবং আমি এই টিউটোরিয়ালটি পেয়েছি

এই টিউটোরিয়ালে, কেএল ডাইভারজেন্স বাস্তবায়ন করা বেশ সহজ।

kl = (model * np.log(model/actual)).sum()

আমি যেমন বুঝতে পারি, এর সম্ভাব্যতা বন্টন হতে হবে modelএবং actual<= 1 হওয়া উচিত।

আমার প্রশ্নটি হল, কে-এর সর্বাধিক সীমাবদ্ধ / সর্বাধিক সম্ভাব্য মান কী? আমার কোডে সীমাবদ্ধ সর্বাধিক সীমাবদ্ধতার জন্য আমার সর্বাধিক সম্ভাব্য মান জানতে হবে।


উত্তর:


19

বা এমনকি একই সমর্থন সহ, যখন একটি বিতরণ অন্যের চেয়ে অনেক বেশি মোটা লেজ থাকে। নিন যখন তারপরে এবং অন্যান্য দূরত্ব রয়েছে যেমন আবদ্ধ থাকে যেমনp ( x ) = কচির ঘনত্ব 1

KL(P||Q)=p(x)log(p(x)q(x))dx
কেএল(পি||প্রশ্নঃ)=1
p(x)=1π11+x2Cauchy densityq(x)=12πexp{x2/2}Normal density
1
KL(P||Q)=1π11+x2logp(x)dx+1π11+x2[log(2π)/2+x2/2]dx
1π11+x2x2/2dx=+
  • দূরত্ব, মোট প্রকরণ দূরত্ব সমতুল্য,L¹
  • ওয়াসারস্টেইন দূরত্ব
  • হেলিংগার দূরত্ব


ধন্যবাদ @ জিয়ান এর অর্থ, উভয় বিতরণের জন্য সমস্ত বিনয়ের যোগফল = 1, কেএল ডাইভার্জেন্সের সর্বাধিক সীমাবদ্ধ নেই? সর্বাধিক সীমাবদ্ধ / স্থির বাউন্ডকে সংজ্ঞায়িত করে দুটি সম্ভাব্যতা বিতরণের জন্য আপনার কাছে অন্য কোনও বিকল্পের দূরত্বের কার্যকারিতা রয়েছে কি?
ব্যবহারকারী 46543

পি কি এক্ষেত্রে Q এর প্রতি শ্রদ্ধা রেখে একেবারে অবিচ্ছিন্ন?
সানগুওং ইউন

কোন ক্ষেত্রে"? আমি বিশ্বাস করি যে একে অপরের ক্রমাগত ক্রমাগত নয় এমন ডিস্ট্রিবিউশনগুলির জন্য কেএলটিকে সংজ্ঞায়িত করা হয়নি।
শি'য়ান

13

যে বিতরণগুলির সমান সমর্থন নেই, তাদের জন্য কেএল ডাইভারজেন্স সীমাবদ্ধ নয়। সংজ্ঞাটি দেখুন:

KL(P||Q)=p(x)ln(p(x)q(x))dx

যদি পি এবং কিউর সমান সমর্থন না থাকে তবে কিছু পয়েন্ট রয়েছে যেখানে এবং , কেএলকে অনন্ততায় যেতে বাধ্য করে। এটি পৃথক বিতরণের ক্ষেত্রেও প্রযোজ্য, এটি আপনার ক্ষেত্রে।xp(x)0q(x)=0

সম্পাদনা: সম্ভবত সম্ভাব্যতা বিতরণের মধ্যে বিভাজন পরিমাপ করার জন্য আরও ভাল পছন্দ হ'ল তথাকথিত ওয়াসারস্টেইন দূরত্ব যা মেট্রিক এবং কেএল ডাইভার্জেন্সের চেয়ে ভাল বৈশিষ্ট্য রয়েছে। গভীর-শিক্ষার ক্ষেত্রে অ্যাপ্লিকেশনগুলির কারণে এটি বেশ জনপ্রিয় হয়ে উঠেছে (ডাব্লুজিএএন নেটওয়ার্ক দেখুন)


ধন্যবাদ @ কার্লোস-ক্যাম্পোস আমার বিতরণ প্রকৃত এবং মডেল উভয়ের একই শর্ত রয়েছে যা সমস্ত বিনয়ের যোগফল = 1। এর অর্থ কি আমার কেএল ডাইভারজেন্সের এখনও সর্বোচ্চ সীমাবদ্ধ নেই? আমি অপ্রয়োজনীয় দূরত্বটি
দেখব

ওয়াসারস্টেইন বা আর্থ মুভার দূরত্বের একটি সর্বাধিক সীমাবদ্ধ? কারণ আমার এটা দরকার
user46543

@ ইউজার ৪6543৩৩ ওয়াসারস্টেইনের দূরত্ব ইনফটি হিসাবে বেশি হতে পারে
মার্ক এল স্টোন

হাই @ মার্কএল.স্টোন তাই স্থিতিশীল সর্বাধিক সীমাবদ্ধ দুটি সম্ভাবনা বিতরণের মধ্যে দূরত্ব গণনা করার জন্য কোনও দূরত্বের ফাংশন নেই? উদাহরণস্বরূপ যখন দুটি সম্ভাব্য বিতরণের যোগফলের সমষ্টি 1 এবং দূরত্বের সর্বাধিক সীমা হবে 1. আমি কি সঠিক?
ব্যবহারকারী46543

4

কার্লোস এবং শি'ানের চমৎকার উত্তরের সাথে যুক্ত করার জন্য , এটিও আকর্ষণীয় যে কেএল ডাইভার্জেন্সকে সীমাবদ্ধ করার জন্য পর্যাপ্ত শর্তটি এলোমেলো ভেরিয়েবল উভয়ের জন্য একই রকমের কমপ্যাক্ট সমর্থন এবং রেফারেন্সের ঘনত্বের সাথে আবদ্ধ হওয়ার জন্য । এই ফলাফলটিও সর্বাধিক কেএল ডাইভার্জেন্সের জন্য অন্তর্নিহিত আবদ্ধ স্থাপন করে (নীচে তত্ত্ব এবং প্রমাণ দেখুন)।


উপপাদ্য: যদি ঘনত্বের এবং এর একই কমপ্যাক্ট সমর্থন থাকে এবং ঘনত্ব সেই সমর্থনে আবদ্ধ হয় (অর্থাত্ একটি সীমাবদ্ধ উপরের আবদ্ধ থাকে) তবে ।কুই এক্স পি কে এল ( পি | | প্রশ্নঃ ) < pqXpKL(P||Q)<

প্রুফ: যেহেতু এর কমপ্যাক্ট সমর্থন রয়েছে অর্থ হল কিছু ইতিবাচক অসীম মান রয়েছে:এক্সqX

q_infxXq(x)>0.

একইভাবে, যেহেতু এর কমপ্যাক্ট সমর্থন রয়েছে অর্থ এখানে কিছু ইতিবাচক সর্বোত্তম মান রয়েছে:pX

p¯supxXp(x)>0.

অধিকন্তু, যেহেতু এগুলি উভয়ই একই সমর্থনের ঘনত্ব এবং পরেরটি আবদ্ধ থাকে, সুতরাং আমাদের । এই যে মানে:0<q_p¯<

supxXln(p(x)q(x))ln(p¯)ln(q_).

এখন, পরে উপরের আবদ্ধ হতে দেওয়া, আমাদের পরিষ্কার তাই যে:L_ln(p¯)ln(q_)0L_<

KL(P||Q)=Xln(p(x)q(x))p(x)dxsupxXln(p(x)q(x))Xp(x)dx(ln(p¯)ln(q_))Xp(x)dx=L_<.

এটি প্রয়োজনীয় উপরের গণ্ডিকে প্রতিষ্ঠিত করে, যা উপপাদ্যকে প্রমাণ করে।


ফলাফলটি সঠিক তবে সীমাবদ্ধতা ভারী: একটি বিটা ঘনত্ব যখন তখন কোনও কমপ্যাক্ট সমর্থন উপভোগ করে না । B(α,β)max(α,β)>1
শি'আন

এটি সত্য: এটি সর্বোপরি কেবল পর্যাপ্ত শর্ত। দুর্বল পর্যাপ্ত শর্ত স্বাগত!
বেন - মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.