আপনি পারবেন না এবং আপনিও পারবেন না। ভাবুন যে আপনার সম্ভাবনা বিতরণের প্রশ্নে এলোমেলো পরিবর্তনশীল প্র। তবে আপনার বন্ধু বব মনে করেন যে ফলাফলটি সম্ভাবনা বন্টন পি থেকে এসেছিল He ফলাফল। তবে, যেহেতু তিনি পি থেকে এনকোডিং তৈরি করেছেন এবং Q থেকে নয়, তাই তার কোডগুলি প্রয়োজনের চেয়ে দীর্ঘ হবে। কেএল-ডাইভারজেন্স পরিমাপ করুন কোডগুলি কত দীর্ঘ হবে।
এখন বলি যে তার একটি মুদ্রা রয়েছে এবং তিনি কী ফলাফলের ক্রমটি আপনাকে বলতে চান tell কারণ মাথা এবং লেজ সমানভাবে সম্ভবত সেগুলি উভয়কেই 1 বিট কোড দেয়। মাথা জন্য 0, লেজ জন্য 1। যদি সে লেজের মাথার লেজ পায় তবে সে 1 1 0 পাঠাতে পারে। এখন, যদি তার মুদ্রা প্রান্তে অবতরণ করে তবে তিনি আপনাকে সম্ভবত বলতে পারবেন না! তিনি আপনাকে যে কোড পাঠায় সে কাজ করবে না। এই মুহুর্তে কেএল-ডাইভারজেন্সটি ভেঙে যায়।
যেহেতু কেএল-ডাইভারজেনটি ভেঙে যায় আপনাকে অন্য কোনও পরিমাপ বা অন্যান্য সম্ভাব্যতা বিতরণ ব্যবহার করতে হবে। আপনার যা করা উচিত তা নির্ভর করে আপনি কী চান on আপনি কেন সম্ভাবনা বিতরণের তুলনা করছেন? আপনার সম্ভাব্যতা বিতরণগুলি কোথা থেকে আসে, সেগুলি ডেটা থেকে অনুমান করা হয়?
আপনি বলছেন যে আপনার সম্ভাব্যতা বিতরণগুলি কোনওভাবে প্রাকৃতিক ভাষার নথি থেকে আসে এবং আপনি জোড়া বিভাগের তুলনা করতে চান।
প্রথমত, আমি একটি প্রতিসম সম্পর্কিত সম্পর্কিত পরিমাপের পরামর্শ দেব। এই অ্যাপ্লিকেশনটির জন্য এটি A এর সাথে B এর সমান বলে মনে হয় যেমন B এর সাথে অনুরূপ A.
আপনি কি কোসাইন অনুরূপতা পরিমাপ চেষ্টা করেছেন? এনএলপিতে এটি বেশ সাধারণ।
আপনি যদি কেএল দিয়ে আটকে থাকতে চান, তবে একটি জিনিস আপনি উভয় নথির থেকে সম্ভাব্যতার ফাংশনটি অনুমান করতে পারেন এবং তারপরে দেখুন কোনও দুটি নথির জন্য আপনার কতটা অতিরিক্ত বিট প্রয়োজন হবে। এটি (পি || (পি + কিউ) / 2 + কিউ || (পি + কিউ) / 2) / 2)