আমি নিশ্চিত না যে কেউ এখনও যাদুকরী সংখ্যাটি ঠিক 1: 2 বলে মনে করছেন এবং না উদাহরণস্বরূপ, 1: 1.1 বা 1:20 বলে ব্যাখ্যা করেছেন কিনা।
একটি কারণ হ'ল অনেক সাধারণ ক্ষেত্রে প্রায় অর্ধেক ডিজিটালাইজড ডেটা গোলমাল এবং শব্দ (সংজ্ঞা অনুসারে) সংকুচিত করা যায় না।
আমি খুব সাধারণ পরীক্ষা করেছিলাম:
আমি একটি ধূসর কার্ড নিয়েছি । একটি মানুষের চোখের কাছে এটি ধূসর কার্ডবোর্ডের সরল, নিরপেক্ষ অংশের মতো দেখাচ্ছে। বিশেষত, কোনও তথ্য নেই ।
এবং তারপরে আমি একটি সাধারণ স্ক্যানার নিয়েছিলাম - ঠিক এমন ধরণের ডিভাইস যা লোকেরা তাদের ফটো ডিজিটালাইজ করতে ব্যবহার করতে পারে।
আমি ধূসর কার্ডটি স্ক্যান করেছি। (প্রকৃতপক্ষে, আমি একটি পোস্টকার্ডের সাথে ধূসর কার্ড একসাথে স্ক্যান করেছি san পোস্টকার্ডটি স্যানিটি-যাচাইয়ের জন্য ছিল যাতে আমি নিশ্চিত করতে পারি যে স্ক্যানার সফ্টওয়্যারটি কোনও অদ্ভুত কিছু না করে, যেমন বৈশিষ্ট্যহীন ধূসর কার্ড দেখলে স্বয়ংক্রিয়ভাবে এর বিপরীতে যুক্ত হয়))
আমি ধূসর কার্ডের 1000x1000 পিক্সেলের অংশটি ক্রপ করেছি এবং এটিকে গ্রেস্কেল (প্রতি পিক্সেল 8 বিট) এ রূপান্তর করেছি।
যখন আপনি এখন স্ক্যান করা কালো ও সাদা ছবির একটি বৈশিষ্ট্যহীন অংশ , উদাহরণস্বরূপ, পরিষ্কার আকাশ অধ্যয়ন করেন তখন কী ঘটে যায় তার একটি মোটামুটি ভাল উদাহরণ হওয়া উচিত । নীতিগতভাবে, দেখার মতো কিছু ঠিক নেই should
তবে, আরও বড় মাপের সাহায্যে এটি দেখতে এ রকম দেখাচ্ছে:
কোনও পরিষ্কারভাবে দৃশ্যমান নিদর্শন নেই তবে এটিতে ধূসর বর্ণের অভিন্ন রঙ নেই। এর বেশিরভাগ অংশ ধূসর কার্ডের অপূর্ণতার কারণে ঘটেছিল তবে আমি ধরে নেব যে এর বেশিরভাগটি কেবল স্ক্যানার দ্বারা উত্পাদিত শব্দ (সেন্সর সেল, অ্যামপ্লিফায়ার, এ / ডি কনভার্টর ইত্যাদি) দ্বারা উত্পাদিত হয়। দেখতে অনেকটা গাউসির আওয়াজের মতো; এখানে হিস্টোগ্রাম ( লোগারিথমিক স্কেল):
এখন যদি আমরা ধরে নিই যে প্রতিটি পিক্সেলটির ছায়া এই বিতরণটি থেকে নেওয়া হয়েছে তবে আমাদের কতটা এনট্রপি থাকবে? আমার পাইথন স্ক্রিপ্টটি আমাকে বলেছিল যে আমাদের কাছে পিক্সেলটিতে ইন্ট্রপিের 3.3 বিট রয়েছে । এবং যে অনেক শব্দ।
যদি সত্যিই এটি হয়, তবে এটি বোঝায় যে আমরা যে কোনও সংক্ষেপণ অ্যালগরিদম ব্যবহার করি না কেন, 1000x1000 পিক্সেল বিটম্যাপটি সর্বোত্তম ক্ষেত্রে 412500-বাইট ফাইলে সংকুচিত করা হবে। এবং অনুশীলনে কী ঘটে: আমি একটি খুব কাছাকাছি একটি 432018 বাইট পিএনজি ফাইল পেয়েছি।
যদি আমরা কিছুটা অতিরিক্ত-সাধারণীকরণ করি তবে মনে হয় যে আমি এই স্ক্যানারটি দিয়ে কালো এবং সাদা ছবিগুলি স্ক্যান করি না কেন, আমি নিম্নলিখিতগুলির যোগফলটি পেয়ে যাব:
- "দরকারী" তথ্য (যদি থাকে),
- প্রায় শব্দ। পিক্সেল 3 বিট।
এখন এমনকি যদি আপনার কম্প্রেশন অ্যালগরিদম দরকারী তথ্যকে << 1 বিট প্রতি পিক্সেল মধ্যে পাতিত করে, তবুও আপনার কাছে পিক্সেল ইনপ্রেসিবল শব্দের হিসাবে কম 3 বিট থাকবে। এবং সঙ্কুচিত সংস্করণটি প্রতি পিক্সেলটিতে 8 বিট b সুতরাং কম্প্রেশন অনুপাত 1: 2 এর বলপার্কে থাকবে, আপনি যা-ই করেন না কেন।
অতিরিক্ত-আদর্শিক অবস্থার সন্ধানের প্রয়াস সহ আরেকটি উদাহরণ:
- একটি আধুনিক ডিএসএলআর ক্যামেরা, সর্বনিম্ন সংবেদনশীলতা সেটিংটি ব্যবহার করে (কম শব্দ) noise
- ধূসর কার্ডের আউট-অফ-ফোকাস শট (ধূসর কার্ডে কিছু দৃশ্যমান তথ্য থাকলেও তা ঝাপসা হয়ে যাবে)।
- কোনও বিপরীতে যুক্ত না করে RAW ফাইলটির একটি 8-বিট গ্রেস্কেল চিত্রে রূপান্তর। আমি বাণিজ্যিক RAW কনভার্টারে টিপিক্যাল সেটিংস ব্যবহার করেছি। রূপান্তরকারী ডিফল্টরূপে শব্দ হ্রাস করার চেষ্টা করে। তদতিরিক্ত, আমরা শেষ ফলাফলটি একটি 8-বিট ফাইল হিসাবে সংরক্ষণ করছি - আমরা প্রকৃতপক্ষে, কাঁচা সেন্সর রিডিংয়ের সর্বনিম্ন-ক্রম বিটগুলি ফেলে দিচ্ছি!
এবং শেষ ফলাফল কি ছিল? স্ক্যানারের কাছ থেকে আমি যা পেয়েছি তার থেকে এটি অনেক ভাল দেখাচ্ছে; গোলমাল কম উচ্চারণ করা হয়, এবং ঠিক দেখার মতো কিছুই নেই। তবুও গাউসির আওয়াজ আছে:
আর এন্ট্রপি? প্রতি পিক্সেল 2.7 বিট । অনুশীলনে ফাইলের আকার? 1 এম পিক্সেলের জন্য 344923 বাইট। সত্যিকারের সেরা ক্ষেত্রে, কিছু প্রতারণার সাথে আমরা সংক্ষেপণের অনুপাতটিকে 1: 3 এ ঠেলে দিয়েছি।
অবশ্যই এইগুলির সকলের টিসিএস গবেষণার সাথে ঠিক কোনও সম্পর্ক নেই, তবে আমি মনে করি যে সত্যিকারের ডিজিটালাইজড উপাত্তগুলির সংকোচনে কী সত্যই সীমাবদ্ধ করে তা মনে রাখা ভাল । ফ্যানসিয়ার কম্প্রেশন অ্যালগোরিদম এবং কাঁচা সিপিইউ পাওয়ারের নকশায় অগ্রগতিগুলি সাহায্য করবে না; আপনি যদি সমস্ত শব্দটি ক্ষতিহীনভাবে সংরক্ষণ করতে চান তবে আপনি 1: 2 এর চেয়ে বেশি কিছু করতে পারবেন না।