এন-গ্রাম মডেলের জন্য বিভ্রান্তি এবং ক্রস-এনট্রপি

10

ক্রস-এনট্রপি এবং বিভ্রান্তির মধ্যে সম্পর্ক বোঝার চেষ্টা করা। সাধারণত একটি মডেল এম এর জন্য , Perplexity (M) = 2 ^ এন্ট্রপি (এম) । এই সম্পর্কটি কি সমস্ত বিভিন্ন এন-গ্রাম, অর্থাৎ ইউনিগ্রাম, বিগ্রাম ইত্যাদির জন্য ধারণ করে?

natural-language entropy perplexity

— Margalit
সূত্র

এটাই আসলে বিভ্রান্তির সংজ্ঞা ; জিনিস তা থেকে প্রাপ্ত করা হয়;)

\sqrt[N]{Π_{i = 1}^{N} \frac{1}{P (w_{i} | w_{1}, . . . w_{i - 1})}}

$\sqrt[N]{\Pi^N_{i=1} \frac{1}{P(w_i|w_1, ... w_{i-1})}}$

— WavesWashSands

9

হ্যাঁ, বিভ্রান্তি সর্বদা এনট্রপির ক্ষমতার সমান। আপনার কী ধরণের মডেল, এন-গ্রাম, ইউনিগ্রাম, বা নিউরাল নেটওয়ার্ক তা বিবেচ্য নয়।

ভাষা মডেলিংয়ের লোকেরা কেবল এনট্রপি ব্যবহার না করে বিভ্রান্তির পছন্দ করার কয়েকটি কারণ রয়েছে। একটি হ'ল, ঘটনাকারীর কারণে, এনট্রপির সমতুল্য উন্নতির চেয়ে তারা বিভ্রান্তির "অনুভূতি" উন্নতি করে। আর একটি হ'ল তারা বিভ্রান্তি ব্যবহার শুরু করার আগে একটি ভাষা মডেলের জটিলতাটি সরলবাদী শাখা ফ্যাক্টর পরিমাপ ব্যবহার করে জানানো হয়েছিল যা এনট্রপির চেয়ে বিভ্রান্তির চেয়ে বেশি অনুরূপ।

— হারুন
সূত্র

1

কিছুটা সংশোধন করে @ অ্যারোন উত্তরের সাথে একমত হয়েছেন:

এটি সর্বদা এন্ট্রপির ক্ষমতার সমান নয় equal প্রকৃতপক্ষে, এটি হবে (লগের জন্য ভিত্তি) এন্ট্রপির শক্তি। আপনি যদি ইটিকে আপনার বেস হিসাবে ব্যবহার করেন তবে এটি ই ^ এনট্রপি হবে।

— প্রশান্ত গুপ্ত
সূত্র