ফিশার মেট্রিক এবং আপেক্ষিক এনট্রপির মধ্যে সংযোগ


20

কেউ কি বিশুদ্ধ গাণিতিক কঠোর উপায়ে ফিশার তথ্য মেট্রিক এবং আপেক্ষিক এনট্রপি (বা কেএল ডাইভারজেন্স) এর মধ্যে নিম্নলিখিত সংযোগটি প্রমাণ করতে পারেন ?

D(p(,a+da)p(,a))=12gi,jdaidaj+(O(da3)
যেখানে a=(a1,,an),da=(da1,,dan) ,
gi,j=i(logp(x;a))j(logp(x;a)) p(x;a) dx
বিন্দু, দা ^ n) , জি_ {i, জে} = \ ইনট tial আংশিক_আই (\ লগ পি (এক্স; এ)) \ আংশিক_জে (\ লগ পি (এক্স; এ)) ~ পি (এক্স; এ) ~ ডেক্স এবং আমি,একটিআমিএকটি: =Σআমি,আমি,একটিআমিএকটি হলেন আইনস্টাইন শীর্ষ সম্মেলন।

জন বায়েজের সুন্দর ব্লগে আমি উপরেরটি পেয়েছি যেখানে ভ্যাসিলিওস অ্যানগনোস্টোপলাস মন্তব্যগুলিতে সে সম্পর্কে বলেছেন।


1
প্রিয় কুমারা: নির্মল জন্য, এটি ভাল আপনার স্বরলিপি, নির্দিষ্টভাবে মানে ব্যাখ্যা করতে সাহায্য করবে gi,j । এছাড়াও, আমি মনে করি আপনার অভিব্যক্তিটি ডিসপ্লে সমীকরণের ডান-হাতের প্রথম টার্মের সামনে 1/2 এর একটি ধ্রুবক গুণক অনুপস্থিত । নোট করুন যে কুলব্যাক নিজে ডাইভারজেন্সকে বলেছেন ( J(,) ) কে কে ডাইভারজেন, অর্থাৎ জে (পি, কিউ) = ডি (পি \ | কিউ) + এর সমমিত সংস্করণ বলে ডি (কিউ \ | পি)জে(পি,কুই)=ডি(পিকুই)+ +ডি(কুইপি) । কুলব্যাকের লেখায় কেএল ডাইভারজেন্সকে আমি(,) বোঝানো হয়েছিল। এটি পাশাপাশি 1/2 এর কারণও ব্যাখ্যা করে 1/2। চিয়ার্স।
কার্ডিনাল

উত্তর:


19

1946 সালে, জিওফিজিসিস্ট এবং বায়সিয়ান পরিসংখ্যানবিদ হ্যারল্ড জেফরিস আজকে আমরা কুলব্যাক-লেবলার বিচ্যুতি বলে পরিচয় করিয়ে দিয়েছি এবং আবিষ্কার করেছেন যে দুটি বিতরণের জন্য যা "অসীম কাছাকাছি" রয়েছে (আসুন আশা করা যাক ম্যাথ এসই ছেলেরা এটি দেখতে পাবে না ;-) আমরা লিখতে পারি তাদের কুলব্যাক-লেবেলার বিচ্যুতিটি একটি চতুর্ভুজ রূপ হিসাবে পরিবর্তিত হয়েছে যার গুণাগুণগুলি ফিশার তথ্য ম্যাট্রিক্সের উপাদানগুলি দিয়েছিল। তিনি এই চতুষ্কোণ রূপটি রিমন্নিয়ান বহুগুণ দৈর্ঘ্যের উপাদান হিসাবে ব্যাখ্যা করেছিলেন, ফিশারের তথ্যটি রিমানিয়ান মেট্রিকের ভূমিকা পালন করে। পরিসংখ্যানগত মডেলটির এই জ্যামিতিকরণ থেকে তিনি জেফ্রিয়াসের প্রাকৃতিকভাবে রিমনিয়ান মেট্রিকের দ্বারা উত্পন্ন পদক্ষেপ হিসাবে প্রাপ্ত হন এবং এই পরিমাপটি বহুগুণে একটি স্বতন্ত্র ইউনিফর্ম বিতরণ হিসাবে ব্যাখ্যা করা যায়, যদিও সাধারণভাবে এটি কোনও সীমাবদ্ধ পরিমাপ নয়।

একটি কঠোর প্রমাণ লিখতে, আপনাকে নিয়মিততার সমস্ত শর্তগুলি খুঁজে বের করতে হবে এবং টেলর বিস্তারে ত্রুটি শর্তগুলির ক্রমটি যত্ন সহকারে নিতে হবে। এখানে যুক্তিটির একটি সংক্ষিপ্ত চিত্র

দুটি ঘনত্বের এবং মধ্যে প্রতিসাম্যিক কুলব্যাক-লেবেলার বিভাজনকে সংজ্ঞায়িত করা হয়েছে

ডি[,]=((এক্স)-(এক্স))লগ((এক্স)(এক্স))এক্স

আমাদের যদি ঘনত্বের একটি পরিবার থাকে দ্বারা প্যারামিটারাইজড , তবেθ=(θ1,...,θ)

D[p(θ),p(θ+Δθ)]=(p(x,θ)p(xθ+Δθ))log(p(xθ)p(xθ+Δθ))dx,
যার মধ্যে । স্বরলিপিটি পরিচয় করিয়ে দিচ্ছি কিছু সাধারণ বীজগণিত প্রাকৃতিক লোগারিদমের জন্য টেলর সম্প্রসারণ ব্যবহার করে, আমাদের কাছে রয়েছে Δθ=(Δθ1,...,Δθ)
Δp(xθ)=p(xθ)p(xθ+Δθ),
D[p(θ),p(θ+Δθ)]=Δp(xθ)p(xθ)log(1+Δp(xθ)p(xθ))p(xθ)dx.
log(1+ +Δপি(এক্স|θ)পি(এক্স|θ))Δপি(এক্স|θ)পি(এক্স|θ),
এবং তাই তবে সুতরাং যা
ডি[পি(|θ),পি(|θ+ +Δθ)](Δপি(এক্স|θ)পি(এক্স|θ))2পি(এক্স|θ)এক্স
Δপি(এক্স|θ)পি(এক্স|θ)1পি(এক্স|θ)Σআমি=1পি(এক্স|θ)θআমিΔθআমি=Σআমি=1লগপি(এক্স|θ)θআমিΔθআমি
ডি[পি(|θ),পি(|θ+ +Δθ)]Σআমি,=1আমিΔθআমিΔθ,
আমি=লগপি(এক্স|θ)θআমিলগপি(এক্স|θ)θপি(এক্স|θ)এক্স

এটিই মূল কাগজ:

জেফ্রি, এইচ। (1946) প্রাক্কলন সমস্যাগুলির পূর্ব সম্ভাবনার জন্য একটি আক্রমণকারী ফর্ম। Proc। রয়্যাল সোস লন্ডনের, সিরিজ এ, 186, 453–461।


1
সুন্দর লেখার জন্য আপনাকে অনেক ধন্যবাদ। এটি চমৎকার হবে যদি আপনাকে সহায়তা করতে পারে হবে এই হিসাবে ভাল।
কুমার

হ্যাঁ, আপনি ঠিক বলেছেন। আমাকে অবশ্যই এই "বিমূর্ত ফাঁদ" থেকে বেরিয়ে আসতে হবে।
কুমার

@ জেন আপনি অবিচ্ছেদের অধীনে লোগারিদমের টেলর সম্প্রসারণটি ব্যবহার করছেন, কেন এটি বৈধ?
সুস 20200

1
এটি অত্যন্ত গুরুত্বপূর্ণ বলে মনে হচ্ছে যে আপনি স্ট্যান্ডার্ড কেএল বিচরণের বিপরীতে প্রতিসৃত কেএল ডাইভারজেন্স দিয়ে শুরু করেছিলেন। উইকিপিডিয়া নিবন্ধটি প্রতিসম সংশ্লেষ সম্পর্কে কোনও উল্লেখ করে না, এবং এটি সম্ভবত ভুল হতে পারে। en.wikedia.org/wiki/Kullback%E2%80%93Leibler_diverncy
সার্জিকাল কমান্ডার

11

সাধারণ (অ-প্রতিসাম্য) কেএল ডাইভার্জেন্সের প্রমাণ Pro

জেনের উত্তরটি প্রতিসৃত কেএল ডাইভারজেন্স ব্যবহার করে তবে ফলাফলটি স্বাভাবিক রূপের জন্যও ধারণ করে, কারণ এটি অসীম কাছাকাছি বিতরণের জন্য প্রতিসম হয়ে যায়।

এখানে স্কেলার থিয়েটা দ্বারা প্যারামিটারাইজড বিচ্ছিন্ন বিতরণের জন্য একটি প্রমাণ রয়েছে (কারণ আমি অলস), তবে ক্রমাগত বিতরণ বা পরামিতিগুলির একটি ভেক্টরের জন্য সহজেই আবার লিখিত হতে পারে:θ

ডি(পিθ,পিθ+ +θ)=Σপিθলগপিθ-Σপিθলগপিθ+ +θ 
শেষ শব্দটি টেলর-প্রসারণ: some কিছু নিয়মিততা ধরে নিয়ে আমি দুটি ফলাফল ব্যবহার করেছি:
=Σপিθলগপিθ-Σপিθলগপিθ= 0-θΣপিθθলগপিθ= 0 -12θ2Σপিθ2θ2লগপিθ=-Σপিθ(θলগপিθ)2 + +হে(θ3)=12θ2Σপিθ(θলগপিθ)2ফিশারের তথ্য+ +হে(θ3)
:Σপিθθলগপিθ=Σθপিθ=θΣপিθ=0,

:Σপিθ2θ2লগপিθ=Σপিθθ(1পিθপিθθ)=Σপিθ[1পিθ2পিθθ-(1পিθপিθθ)2]=Σ2পিθθ2-Σপিθ(1পিθপিθθ)2=2θ2Σপিθ= 0-Σপিθ(θলগপিθ)2

4

নিম্নলিখিত কাগজের সমীকরণ (3) এ আপনি একই জাতীয় সম্পর্ক (এক-মাত্রিক পরামিতির জন্য) সন্ধান করতে পারেন

ডি গুও (২০০৯), রিলেটিভ এন্ট্রপি এবং স্কোর ফাংশন: নতুন তথ্য Pr প্রোকের মধ্যে স্বেচ্ছাসেবক অ্যাডেটিভ পার্সটৌথুনির মাধ্যমে অনুমানের সম্পর্ক আইইইই ইন্টারন্যাশনাল সিম্পোজিয়াম ইন ইনফরমেশন থিওরী , 814–818। ( স্থিতিশীল লিঙ্ক )

লেখকরা উল্লেখ করুন

এস। কুলব্যাক, তথ্য তত্ত্ব এবং পরিসংখ্যান । নিউ ইয়র্ক: ডোভার, 1968।

এই ফলাফলের প্রমাণের জন্য।


1
সেই কাগজের সমীকরণের একটি বহু সংস্করণ (3) পৃষ্ঠা 27-28 পৃষ্ঠায় উদ্ধৃত কুলব্যাক পাঠ্যে প্রমাণিত। অবিচ্ছিন্ন মনে হয় ওপির প্রশ্নে হারিয়ে গেছে। :)1/2
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.