আপনার মন্তব্য পড়ার পরে, এটি আরও যুক্তিসঙ্গত মনে হয়। আমি ঠিক নিশ্চিত ছিলাম না যে আপনি এই জাতীয় ডেটা মেগাবাইটের এনকোডিং করতে চাইছেন।
অলিভারের পরামর্শ অনুসারে আমি সুপারিশ করব, আপনি বেকনের সিফার থেকে একটি পৃষ্ঠা ধার করে আপনার ডেটা ঘনত্ব বাড়ান , যা কারাগারের দলগুলি প্রায়শই 2 টি ভিন্ন স্ক্রিপ্ট শৈলীতে লেখা মিসাইভে লুকানো বার্তাগুলি এনকোড করতে ব্যবহার করে - সাধারণত হয় উপরের বনাম vs ছোট হাতের অক্ষর বা মুদ্রণ বনাম অভিশাপ অক্ষর, যেমন
Hey mOM, WHAT's FOR diNNeR TODAY? = ABBBA AAAAA BAAAB BAABA AAAAA
= P A S T A
তবে, যেহেতু আপনার লক্ষ্যটি স্টেগনোগ্রাফি নয়, আপনি আপনার গ্লাইফ সেটটি প্রসারণ করতে কেবল এটি ব্যবহার করবেন। এটি করতে, আপনি কেবল ডাবল-চরিত্রের এনকোডিং ব্যবহার করে প্রিন্ট ও ক্রিসিভ বর্ণানুক্রমিক অক্ষর বা 12996 কোড পয়েন্ট ব্যবহার করে 114 টি গ্লাইফ থাকতে পারেন।
যাইহোক, যেহেতু সমস্ত গ্লাইফের সংখ্যা 15 এরও বেশি এবং 256 এর চেয়ে কম বাইনারি তথ্যগুলির সরল সাইফারের জন্য একই রকম (অর্থাত, প্রতিটি বাইট উপস্থাপন করার জন্য আপনার এখনও 2 অক্ষর প্রয়োজন, আপনাকে প্রতি অক্ষরে 4 বিটের ডেটা ঘনত্ব দেয় সমস্ত ক্ষেত্রে), আপনি ত্রুটি সনাক্তকরণ / সংশোধনের জন্য অতিরিক্ত 98 গ্লিফ / 12740 কোড পয়েন্ট ব্যবহার করতে পারেন।
এটি করার উপায়গুলির মধ্যে রয়েছে:
- 256 সর্বাধিক সহজ / পড়ার অক্ষর কম্বোসের একটি সেট চয়ন করুন। যদি অন্য কোনও চরিত্রের কম্বো দেখা দেয় তবে আপনি জানেন যে এটি অনুলিপি করার ত্রুটি।
- সমতা বিট হিসাবে শেষ অক্ষরের দুটি সংস্করণ ব্যবহার করুন।
50 টি বিভিন্ন 16-বর্ণের গ্লাইফ সেট তৈরি করুন। তারপরে আপনি এগুলিকে ত্রুটি সংশোধন ডেটা সিফার করতে এগুলি ব্যবহার করতে পারেন।
উদাহরণস্বরূপ {set 1}{set 1}
, পরবর্তী 3 নীবল সমান 0x000
, {set 1}{set 2}
সমান 0x001
ইত্যাদি means
আপনি এটি 4096 সম্ভাব্য 1.5 বাইট মানগুলির 2500+ উপস্থাপন করতে ব্যবহার করতে পারেন। একইভাবে, আপনি আপনার এনকোডড ডেটার দৈর্ঘ্য না বাড়িয়ে 100% রিডানডেন্সি দিয়ে নীচের বাইটের সমস্ত মান উপস্থাপন করতে মাত্র 16 টি সেট ব্যবহার করতে পারেন।
বিকল্পভাবে, আপনি অতিরিক্ত সংক্ষেপণের জন্য অতিরিক্ত গ্লাইফগুলি ব্যবহার করতে পারেন:
- 98 একক-অক্ষর কোড পয়েন্ট নির্বাচন করে ভেরিয়েবল-প্রস্থের এনকোডিং প্রয়োগ করুন। এটি গড় এনকোডযুক্ত সামগ্রীর আকারকে প্রায় 20% হ্রাস করবে।
- পুনরাবৃত্তিযোগ্য নিবলগুলি / বাইট উপস্থাপনের জন্য বিভিন্ন গ্লাইফ সেট বা গ্লাইফ সেট সংমিশ্রণগুলি ব্যবহার করে রান-লেংথ এনকোডিংয়ের অনুরূপ কিছু বাস্তবায়ন করুন। যেমন
Ab
= aba
; aB
= abab
; AB
= ababab
...
- আপনার ডেটাতে পুনরাবৃত্তি হওয়া "শব্দ" এবং "শব্দগুচ্ছ" উপস্থাপন করতে অতিরিক্ত গ্লাইফ বা কোড পয়েন্ট ব্যবহার করুন। যদিও প্রাক-সংক্ষেপিত ডেটাতে সম্ভবত একটি উচ্চ স্তরের এনট্রপি থাকবে, সুতরাং আমি জানি না এটি কতটা কার্যকর হবে।
অনুলিপি ত্রুটিগুলি আরও কমাতে, আমি গ্রিডলাইনে এনকোডযুক্ত সামগ্রী প্রদর্শন করব এবং গ্রাফিকিং পেপারে অনুলিপি করব। যদি আপনি কাস্টম স্টেশনারি ব্যবহার করতে পারেন যা বিকল্প কলাম / সারি রঙের বা চিসবোর্ড-স্টাইলের চেকার্ড গ্রিডযুক্ত কলামগুলি এবং তাত্ক্ষণিকভাবে সন্ধানের জন্য তাত্ক্ষণিকভাবে সারি করতে পারে তবে এটি অনুলিপিটির সঠিকতা বাড়িয়ে তুলবে।
আপনি ত্রুটি সনাক্তকরণের সহজ ফর্ম হিসাবে বিকল্প চরিত্রের শৈলীর সাথে একটি বিকল্প গ্রিড বিন্যাসও একত্রিত করতে পারেন। উদাহরণস্বরূপ, যদি বিজোড় কলামগুলি সর্বদা মূলধন করা হয়, যদি ট্রান্সক্রাইবার যদি নিজেকে বিজোড় কলামগুলিতে ছোট হাতের অক্ষরগুলি লিখতে দেখায় তবে তারা জানে যে তারা একটি ত্রুটি করেছে এবং এটি কোথায় ঘটেছে তা দেখতে ফিরে ট্র্যাকিং শুরু করতে পারে।
যদিও আপনার প্রধান অগ্রাধিকার যথার্থতা, তবে আমি বাইনারি এনকোডিং +
হামিং কোড ব্যবহার করব । স্ট্যান্ডার্ড গ্রাফিং পেপারে একটি (12, 8) হ্যামিং কোডটি সংক্ষিপ্ত করে ব্যবহার করে আপনি কেবল 187 বাইট ফিট করতে পারেন, কেবলমাত্র 124 বাইটের ডেটা এনকোড করে। তবে এটি খুব দ্রুত প্রতিলিপি করা যেতে পারে (1 এর জন্য একটি স্ল্যাশ, 0 এর জন্য কিছুই নয়) এবং একক ত্রুটি সংশোধন সরবরাহ করে। অতিরিক্ত প্যারিটি বিটের উপর নজর রাখা (১৩, ৮) এসসিডিইডিইডি সরবরাহ করবে (একক ত্রুটি সংশোধন, ডাবল ত্রুটি সনাক্তকরণ)। (15, 11) বা (31, 26) এর মতো একটি স্ট্যান্ডার্ড হামিং কোড ব্যবহার করে আপনি যথাক্রমে 137 এবং 156 বাইট ডাটার ডেটার সাথে আরও ভাল দক্ষতা অর্জন করতে পারেন। এমনকি আপনার ট্রান্সড্রাইবার কী পরিমাণ সঠিক হতে পারে তার উপর নির্ভর করে এমনকি উচ্চতর কোডের হারও অর্জন করা যায়।
একটি বাইনারি এনকোডিং পড়া (জোরে) এবং ওসিআর / ওএমআর পড়া আরও সহজ হবে।