তথ্য তত্ত্বের পাঠ্যপুস্তক উপাদানগুলি আমাদের একটি উদাহরণ দেয়:
উদাহরণস্বরূপ, যদি আমরা এলোমেলো ভেরিয়েবলের সত্যিকারের বিতরণ পিটি জানতাম, তবে আমরা গড় বর্ণনার দৈর্ঘ্য এইচ (পি) সহ একটি কোড তৈরি করতে পারি। যদি পরিবর্তে, আমরা একটি বিতরণ q এর কোড ব্যবহার করি তবে এলোমেলো ভেরিয়েবলটি বর্ণনা করার জন্য আমাদের গড়ে গড়ে গড়ে H (p) + D (p || q) বিট লাগবে।
উপরের বিবৃতিটি প্যারাফ্রেস করতে, আমরা বলতে পারি যে আমরা যদি তথ্য বিতরণ পরিবর্তন করি (q থেকে p তে) আমাদের নতুন ডিস্ট্রিবিউশন কোড করার জন্য গড়ে ডি বি (পি || কিউ) অতিরিক্ত বিট প্রয়োজন।
একটি দৃষ্টান্ত
প্রাকৃতিক ভাষা প্রক্রিয়াকরণে এটির একটি প্রয়োগ ব্যবহার করে এটি চিত্রিত করি।
বিবেচনা করুন যে মানুষ বৃহৎ গ্রুপ, লেবেল বি, মধ্যস্থতাকারী এবং তাদের প্রতিটি থেকে একটি বিশেষ্য পছন্দ করে নিন একটি টাস্ক নির্ধারিত হয় turkey
, animal
এবং book
এবং প্রেরণ এটা সি করার জন্য একটি লোক NAME একটি যারা দিতে একটি ইমেইল তাদের প্রতিটি পাঠাতে পারে নেই তাদের কিছু ইঙ্গিত। গ্রুপের কেউ ইমেল না পেলে তারা ভ্রু বাড়াতে পারে এবং সিটির কী প্রয়োজন তা বিবেচনা করে কিছুক্ষণ দ্বিধায় পড়তে পারে। এবং প্রতিটি বিকল্প নির্বাচিত হওয়ার সম্ভাবনাটি 1/3। সামগ্রিকভাবে অভিন্ন বিতরণ (যদি তা না হয় তবে এটি তাদের নিজস্ব পছন্দের সাথে সম্পর্কিত হতে পারে এবং আমরা কেবল এই জাতীয় কেসগুলিকে উপেক্ষা করি)।
তবে যদি তাদের একটি ক্রিয়া দেওয়া হয়, যেমন baste
, তাদের মধ্যে 3/4 টি চয়ন করতে পারে turkey
এবং 3/16 চয়ন করতে পারে animal
এবং 1/16 পছন্দ করে book
। তারপরে ক্রিয়াটি জানার পরে প্রতিটি মধ্যস্থতাকারী প্রতিটি বিটগুলিতে কতটা তথ্য পেয়েছেন? এটাই:
D(p(nouns|baste)||p(nouns))=∑x∈{turkey,animal,book}p(x|baste)log2p(x|baste)p(x)=34∗log23413+316∗log231613+116∗log211613=0.5709 bits
কিন্তু প্রদত্ত ক্রিয়াটি হলে কী হবে read
? আমরা কল্পনা করতে পারি যে book
এগুলি প্রত্যেকে বিনা দ্বিধায় বেছে নেবে, তারপরে ক্রিয়াটি থেকে প্রতিটি মধ্যস্থতার জন্য গড় তথ্য প্রাপ্তি read
হ'ল:
D(p(nouns|read)||p(nouns))=∑x∈{book}p(x|read)log2p(x|read)p(x)=1∗log2113=1.5849 bits
আমরা দেখতে পাচ্ছি যে ক্রিয়াটি read
মধ্যস্থতাকারীদের আরও তথ্য দিতে পারে। এবং এটাই আপেক্ষিক এনট্রপি পরিমাপ করতে পারে।
আমাদের গল্প অবিরত করা যাক। সি যদি সন্দেহ করে যে বিশেষ্যটি ভুল হতে পারে কারণ এ তাকে বলেছিল যে তিনি ভুল ক্রিয়াটি মধ্যস্থতাকারীদের কাছে প্রেরণ করে ভুল করেছেন। তারপরে বিটের মধ্যে এই জাতীয় খারাপ খবরের একটি টুকরো কত তথ্য দিতে পারে?
1) ক দ্বারা প্রদত্ত ক্রিয়াটি হ'ল baste
:
D(p(nouns)||p(nouns|baste))=∑x∈{turkey,animal,book}p(x)log2p(x)p(x|baste)=13∗log21334+13∗log213316+13∗log213116=0.69172 bits
2) তবে ক্রিয়াটি যদি হত read
?
D(p(nouns)||p(nouns|baste))=∑x∈{book,∗,∗}p(x)log2p(x)p(x|baste)=13∗log2131+13∗log2130+13∗log2130=∞ bits
যেহেতু সি কখনই জানেন না যে অন্য দুটি বিশেষ্যটি কী হবে এবং শব্দভাণ্ডারের কোনও শব্দই সম্ভব হবে।
আমরা দেখতে পাচ্ছি যে কেএল ডাইভার্জেন্সটি অসম্পূর্ণ met
আমি আশা করি আমি ঠিক আছি, এবং না হলে মন্তব্য করুন এবং আমাকে সংশোধন করতে সহায়তা করুন। আগাম ধন্যবাদ.