গাছ সম্পূর্ণ হওয়ার কারণে এনকোডিংয়ের প্রয়োজনীয়তা বড় গাছগুলিতে উপসর্গের মুক্ত ফলাফল হতে পারে। এমন কোনও থ্রেশহোল্ড রয়েছে যেখানে স্থির দৈর্ঘ্যের নন-এনকোড করা ডেটা ডেটা এনকোডিংয়ের চেয়ে আরও কার্যকর হবে?
গাছ সম্পূর্ণ হওয়ার কারণে এনকোডিংয়ের প্রয়োজনীয়তা বড় গাছগুলিতে উপসর্গের মুক্ত ফলাফল হতে পারে। এমন কোনও থ্রেশহোল্ড রয়েছে যেখানে স্থির দৈর্ঘ্যের নন-এনকোড করা ডেটা ডেটা এনকোডিংয়ের চেয়ে আরও কার্যকর হবে?
উত্তর:
এনট্রপি H(A)
এই সমস্যা হয় 1.998
। এই সমস্যার জন্য হাফম্যান কোডিং এবং স্থির দৈর্ঘ্যের কোডিং উভয়টির গড় কোডওয়ার্ড দৈর্ঘ্য রয়েছে 2
। এবং এফওয়াইআই হফম্যান এনকোডিং ব্যবহার করে আপনি যে কোডিংটি পেয়েছেন তা ভুল। হাফম্যান এনকোডিংও এই সমস্যার জন্য নির্দিষ্ট দৈর্ঘ্যের মতো কোড তৈরি করে। এটি লোভী পদ্ধতির ব্যবহার করে। সুতরাং a
একটি কোড পেতে না 0
পরিবর্তে এটি পায় 00
। হাফম্যান কোডিং ব্যবহার করে আপনি যে গাছটি উত্পন্ন করেছেন তার উপর পুনরায় কাজ করুন। আপনার যে গাছটি পাওয়া উচিত তা হ'ল:
হাফম্যান কোডিং দুটি সম্ভাবনার ক্ষমতার সাথে জনসংখ্যা বন্টনকে প্রায় অনুমান করে। যদি সত্য বিতরণ দুটি সম্ভাবনার ক্ষমতা নিয়ে থাকে (এবং ইনপুট প্রতীকগুলি সম্পূর্ণ অসংলগ্ন), হাফম্যান কোডিং সর্বোত্তম। যদি তা না হয় তবে আপনি পরিসীমা এনকোডিং দিয়ে আরও ভাল করতে পারবেন। ইনপুটটিতে নির্দিষ্ট চিহ্নগুলিতে বিটের নির্দিষ্ট সেট নির্ধারণ করে এমন সমস্ত এনকোডিংয়ের মধ্যে এটি সর্বোত্তম।
হ্যাঁ, এটি সর্বদা অনুকূল।
না, এমন কোনও প্রান্তিক অঞ্চল নেই যেখানে এটি স্থির দৈর্ঘ্যের নন-এনকোডড ডেটা ব্যবহার করতে কম স্থান ব্যবহার করবে।
ওয়েবে আমি বেশ কয়েকটি প্রমাণ পেয়েছি, তবে উইকিপিডিয়া নিবন্ধে হাফম্যান কোডিংয়ে যথেষ্ট আলোচনা রয়েছে ।
এটি অন্যান্য কৌশলগুলিও কভার করে যা উচ্চতর সংকোচন অর্জন করে (স্থানের বাইরে কাজ করা যার জন্য হাফম্যান কোডটি অনুকূল)।