অনুসন্ধান ইঞ্জিনগুলি ক্রমবর্ধমান তথ্য দারোয়ান হিসাবে নির্ভর করা হচ্ছে, তবুও ফলাফলগুলি র্যাঙ্ক করতে অনুসন্ধান ইঞ্জিনগুলি ব্যবহার করা মানদণ্ডটি ব্যবহারকারীদের কাছে অস্বচ্ছ। কীভাবে ব্যবহারকারীরা নিশ্চিত হতে পারেন যে ফলাফল ফলাফল পক্ষপাতদুষ্ট বা কোনওভাবে ছড়িয়ে দেওয়া নয় অনুসন্ধানের ফলাফলের গুণগত মান ব্যয় করে কিছু আগ্রহের জন্য?
সরকারগুলি নিয়মিত দাবি করে যে অনুসন্ধান প্রদানকারীরা রাজনৈতিকভাবে অবাঞ্ছিত বলে মনে করা ওয়েবসাইটগুলির র্যাংকিং সরিয়ে বা কম করে। ব্যবসাগুলি অন্যদের উপার্জন বাড়ানোর জন্য নির্দিষ্ট ফলাফলগুলি বাড়ানোর জন্য সরবরাহকারীদের অর্থ প্রদান করতে পারে। ফায়ারওয়ালগুলি ব্যবহারকারীদের কাছে ফেরত পাঠানোর আগে ফলাফলের সাথে হস্তক্ষেপ করতে পারে।
এমনকি র্যাঙ্কিং অ্যালগরিদমগুলিতে আপাতদৃষ্টিতে নিরীহ পরিবর্তনগুলি যে পৃষ্ঠতলে নাও থাকতে পারে তা পক্ষপাতদুষ্ট বলে মনে হচ্ছে, প্রকৃতপক্ষে কিছু সাধারণ বৈশিষ্ট্য ভাগ করে নেওয়ার ওয়েবসাইটগুলিকে ক্ষতি করার জন্য চূড়ান্তভাবে ডিজাইন করা যেতে পারে (প্রকৃত মানের সাথে সম্পর্কিত নয়)।
ওয়েবসাইটের র্যাঙ্কিংয়ের পরিবর্তনের জন্য কিছু "গোপন ভেরিয়েবল" (সম্ভবত কোনও রাজনৈতিক অধিভুক্তি) কোনও চালকের কারণ কিনা তা নির্ণয় করে অনুসন্ধানের ইঞ্জিনের পক্ষপাতিত্ব সনাক্ত করা সম্ভব?
একজন গোপনীয় সরবরাহকারী ধীরে ধীরে সময়ের সাথে লক্ষ্যযুক্ত ওয়েবসাইটগুলির র্যাঙ্কিং কমিয়ে দিতে পারে (এবং সম্ভবত এলোমেলো ওয়েবসাইটের পাশাপাশি ব্যবহারকারীদেরকে বিভ্রান্ত করতে)। কোনও সরবরাহকারী সনাক্ত না করে কতটা পক্ষপাতিত্ব পরিচয় করিয়ে দিতে পারে তার সীমাবদ্ধতাগুলি কী? অথবা ঘটনাক্রমে উদ্দেশ্যমূলক ফলাফল ("ডেটা স্নোপিং" এর মাধ্যমে) উত্থাপিতভাবে ওজনযুক্ত র্যাঙ্কিংয়ের মানদণ্ডটি চূড়ান্তভাবে নির্বাচন করে এই জাতীয় হস্তক্ষেপটি সর্বদা গোপন করা সম্ভব?
যদি র্যাঙ্কিংয়ের মানদণ্ডটি জনসম্মুখে করা হয় তবে এর কি কোনও পরিবর্তন হবে? অনুসন্ধানের ইঞ্জিনগুলি কী কী মানদণ্ড ব্যবহার করে তা আমাদের ওপেন-সোর্স দরকার?
এটি আমাকে ফলাফলের কথা মনে করিয়ে দেয় যে কোনও জটিল আর্থিক উপকরণ যেমন সিডিওর মাধ্যমে বিক্রেতার সাথে छेলা-ফেলা হয়েছে কিনা তা সনাক্ত করা ঘন-সাবগ্রাফিক সমস্যা সমাধানের সমতুল্য:
http://www.cs.princeton.edu/~rongge/derivative.pdf
ধন্যবাদ!