তথ্য তত্ত্বের পাঠ্যপুস্তক উপাদানগুলি আমাদের একটি উদাহরণ দেয়:
উদাহরণস্বরূপ, যদি আমরা এলোমেলো ভেরিয়েবলের সত্যিকারের বিতরণ পিটি জানতাম, তবে আমরা গড় বর্ণনার দৈর্ঘ্য এইচ (পি) সহ একটি কোড তৈরি করতে পারি। যদি পরিবর্তে, আমরা একটি বিতরণ q এর কোড ব্যবহার করি তবে এলোমেলো ভেরিয়েবলটি বর্ণনা করার জন্য আমাদের গড়ে গড়ে গড়ে H (p) + D (p || q) বিট লাগবে।
উপরের বিবৃতিটি প্যারাফ্রেস করতে, আমরা বলতে পারি যে আমরা যদি তথ্য বিতরণ পরিবর্তন করি (q থেকে p তে) আমাদের নতুন ডিস্ট্রিবিউশন কোড করার জন্য গড়ে ডি বি (পি || কিউ) অতিরিক্ত বিট প্রয়োজন।
একটি দৃষ্টান্ত
প্রাকৃতিক ভাষা প্রক্রিয়াকরণে এটির একটি প্রয়োগ ব্যবহার করে এটি চিত্রিত করি।
বিবেচনা করুন যে মানুষ বৃহৎ গ্রুপ, লেবেল বি, মধ্যস্থতাকারী এবং তাদের প্রতিটি থেকে একটি বিশেষ্য পছন্দ করে নিন একটি টাস্ক নির্ধারিত হয় turkey, animalএবং bookএবং প্রেরণ এটা সি করার জন্য একটি লোক NAME একটি যারা দিতে একটি ইমেইল তাদের প্রতিটি পাঠাতে পারে নেই তাদের কিছু ইঙ্গিত। গ্রুপের কেউ ইমেল না পেলে তারা ভ্রু বাড়াতে পারে এবং সিটির কী প্রয়োজন তা বিবেচনা করে কিছুক্ষণ দ্বিধায় পড়তে পারে। এবং প্রতিটি বিকল্প নির্বাচিত হওয়ার সম্ভাবনাটি 1/3। সামগ্রিকভাবে অভিন্ন বিতরণ (যদি তা না হয় তবে এটি তাদের নিজস্ব পছন্দের সাথে সম্পর্কিত হতে পারে এবং আমরা কেবল এই জাতীয় কেসগুলিকে উপেক্ষা করি)।
তবে যদি তাদের একটি ক্রিয়া দেওয়া হয়, যেমন baste, তাদের মধ্যে 3/4 টি চয়ন করতে পারে turkeyএবং 3/16 চয়ন করতে পারে animalএবং 1/16 পছন্দ করে book। তারপরে ক্রিয়াটি জানার পরে প্রতিটি মধ্যস্থতাকারী প্রতিটি বিটগুলিতে কতটা তথ্য পেয়েছেন? এটাই:
D(p(nouns|baste)||p(nouns))=∑x∈{turkey,animal,book}p(x|baste)log2p(x|baste)p(x)=34∗log23413+316∗log231613+116∗log211613=0.5709 bits
কিন্তু প্রদত্ত ক্রিয়াটি হলে কী হবে read? আমরা কল্পনা করতে পারি যে bookএগুলি প্রত্যেকে বিনা দ্বিধায় বেছে নেবে, তারপরে ক্রিয়াটি থেকে প্রতিটি মধ্যস্থতার জন্য গড় তথ্য প্রাপ্তি readহ'ল:
D(p(nouns|read)||p(nouns))=∑x∈{book}p(x|read)log2p(x|read)p(x)=1∗log2113=1.5849 bits
আমরা দেখতে পাচ্ছি যে ক্রিয়াটি readমধ্যস্থতাকারীদের আরও তথ্য দিতে পারে। এবং এটাই আপেক্ষিক এনট্রপি পরিমাপ করতে পারে।
আমাদের গল্প অবিরত করা যাক। সি যদি সন্দেহ করে যে বিশেষ্যটি ভুল হতে পারে কারণ এ তাকে বলেছিল যে তিনি ভুল ক্রিয়াটি মধ্যস্থতাকারীদের কাছে প্রেরণ করে ভুল করেছেন। তারপরে বিটের মধ্যে এই জাতীয় খারাপ খবরের একটি টুকরো কত তথ্য দিতে পারে?
1) ক দ্বারা প্রদত্ত ক্রিয়াটি হ'ল baste:
D(p(nouns)||p(nouns|baste))=∑x∈{turkey,animal,book}p(x)log2p(x)p(x|baste)=13∗log21334+13∗log213316+13∗log213116=0.69172 bits
2) তবে ক্রিয়াটি যদি হত read?
D(p(nouns)||p(nouns|baste))=∑x∈{book,∗,∗}p(x)log2p(x)p(x|baste)=13∗log2131+13∗log2130+13∗log2130=∞ bits
যেহেতু সি কখনই জানেন না যে অন্য দুটি বিশেষ্যটি কী হবে এবং শব্দভাণ্ডারের কোনও শব্দই সম্ভব হবে।
আমরা দেখতে পাচ্ছি যে কেএল ডাইভার্জেন্সটি অসম্পূর্ণ met
আমি আশা করি আমি ঠিক আছি, এবং না হলে মন্তব্য করুন এবং আমাকে সংশোধন করতে সহায়তা করুন। আগাম ধন্যবাদ.