একটি ব্লুম ফিল্টার বাস্তবায়নের ক্ষেত্রে, traditionalতিহ্যবাহী পদ্ধতির একাধিক স্বতন্ত্র হ্যাশ ফাংশনগুলির জন্য কল করা হয়। কির্শ এবং মিতজেনমাচার দেখিয়েছে যে আপনার আসলে দুটি মাত্র দরকার এবং এর বাকিগুলি রৈখিক সংমিশ্রণ হিসাবে তৈরি করতে পারেন।
আমার প্রশ্ন: সত্যই, দুটি হ্যাশ ফাংশন এবং দ্বিগুণ এনট্রপির সাথে একটির মধ্যে পার্থক্য কী?
এটি আপনার হ্যাশ ফাংশনগুলির আউটপুট নিয়ে আপনি আসলে কী করছেন তা দেখে আসে: আপনি আপনার (বলুন) 64-বিট হ্যাশ মানটি নিয়ে যাবেন এবং এটি আপনার বিট ভেক্টরের আকারে স্কেল করতে যা যা সম্ভবত 2 এর চেয়ে উল্লেখযোগ্য পরিমাণে ছোট 64 । এটি স্পষ্টতই একটি এনট্রপি-হারাতে যাওয়া রূপান্তর (বিরল ক্ষেত্রে আপনার হ্যাশের আকার এবং ফিল্টারের ক্ষমতা হুবহু মিল except আমার ফিল্টারের 2 32 এরও কম এন্ট্রি রয়েছে বলে ধরে নিলে আমার 64৪ -বিট হ্যাশ মানটিকে দুটি 32-বিট হ্যাশে বিভক্ত করা এবং সেগুলির রৈখিক সংমিশ্রণ গ্রহণ থেকে আমাকে বাধা দেওয়ার কী আছে? বা এটি একটি পিআরএনজি বীজ করতে ব্যবহার করছেন?
অন্য কথায়, স্ট্যান্ডার্ড মিথ্যা পজিটিভ রেটটি নিশ্চিত করার জন্য আমি একটি ব্লুম ফিল্টারটিতে eachোকানো প্রতিটি উপাদান সম্পর্কে আসলে আমার কতটা তথ্য জানতে হবে? বা আরও সাধারণভাবে, আমি উপাদানগুলিকে কতটা আলাদা করতে পারি (সেগুলি বর্ণনা করতে আমি কতগুলি বিট ব্যবহার করি) এবং কীভাবে আমার ব্লুম ফিল্টারটি সম্পাদন করে তার মধ্যে সম্পর্ক কী?