আপনার প্রশ্নের উত্তর দেওয়ার জন্য, আমাদের কেএল ডাইভারজেন্সের সংজ্ঞাটি স্মরণ করা উচিত :
DKL(Y||X)=∑i=1Nln(YiXi)Yi
সবার আগে আপনাকে যা যা করতে হবে তা থেকে সম্ভাব্যতা বিতরণ করতে হবে। এর জন্য আপনার আপনার ডেটা এমনটি স্বাভাবিক করা উচিত যে এটির পরিমাণটি এক:
Xi:=Xi∑Ni=1Xi ; ; Yi:=Yi∑Ni=1YiZi:=Zi∑Ni=1Zi
তারপরে, বিচ্ছিন্ন মূল্যবোধগুলির জন্য আমাদের কাছে একটি অত্যন্ত গুরুত্বপূর্ণ অনুমান রয়েছে যা কেএল-ডাইভারজেন্স মূল্যায়নের জন্য প্রয়োজন এবং এটি প্রায়শই লঙ্ঘিত হয়:
Xi=0 উচিত বোঝানো উচিত ।Yi=0
যদি যখন উভয় এবং , শূন্য সমান হতে শূন্য (সীমা মান হিসাবে) অধিকৃত হয়।XiYiln(Yi/Xi)Yi
আপনার ডেটাসেটে এর অর্থ হ'ল আপনি খুঁজে পেতে পারেন , তবে উদাহরণস্বরূপ নয় (দ্বিতীয় প্রবেশের কারণে)।DKL(X||Y)DKL(Y||X)
আমি ব্যবহারিক দৃষ্টিকোণ থেকে যা পরামর্শ দিতে পারি তা হ'ল:
হয় আপনার ইভেন্টগুলিকে "বৃহত্তর" করুন যাতে আপনার কাছে কম শূন্য থাকে
বা আরও ডেটা অর্জন করুন, যেমন আপনি কমপক্ষে একটি এন্ট্রি দিয়ে এমনকি বিরল ইভেন্টগুলিও কভার করবেন।
আপনি যদি উপরের পরামর্শগুলির মধ্যে দুটিও ব্যবহার করতে না পারেন, তবে সম্ভবত আপনাকে বিতরণগুলির মধ্যে অন্য একটি মেট্রিকের সন্ধান করতে হবে। উদাহরণ স্বরূপ,
পারস্পরিক তথ্য , হিসাবে সংজ্ঞায়িত । যেখানে দুটি ইভেন্টের যৌথ সম্ভাবনা।I(X,Y)=∑Ni=1∑Nj=1p(Xi,Yj)ln(p(Xi,Yj)p(Xi)p(Yj))p(Xi,Yi)
আশা করি এটি সাহায্য করবে।