আমি স্ট্যাকএক্সচেঞ্জ সাইটগুলির জন্য ডেটা মাইনিং প্যাকেজ একসাথে রাখার চেষ্টা করছি এবং বিশেষত আমি "সবচেয়ে আকর্ষণীয়" প্রশ্নগুলি নির্ধারণের চেষ্টাতে আটকে আছি। আমি প্রশ্ন স্কোরটি ব্যবহার করতে চাই, তবে ভিউ সংখ্যার কারণে পক্ষপাতটি সরিয়ে ফেলব, তবে কীভাবে এটি কঠোরভাবে পৌঁছাতে হবে তা আমি জানি না।
আদর্শ বিশ্বে, আমি গণনা করে প্রশ্নগুলি বাছাই করতে পারতাম , যেখানে মোট ভোট এবং হল সংখ্যার সংখ্যা। সর্বোপরি এটি প্রশ্নটির উপরে উঠে আসা লোকদের শতাংশের পরিমাপ করবে, জনগণের শতকরা শতাংশের তুলনায় প্রশ্নটি নীচে নামবে। vn
দুর্ভাগ্যক্রমে, ভোটদানের ধরণটি আরও জটিল। ভোটগুলি একটি নির্দিষ্ট স্তরে "মালভূমি" বাড়ে এবং এর ফলে বন্য জনপ্রিয় প্রশ্নগুলিকে মারাত্মকভাবে অবমূল্যায়নের প্রভাব পড়ে। অনুশীলনে, 1 টি ভিউ এবং 1 আপভোটের সাথে একটি প্রশ্ন অবশ্যই স্কোর করবে এবং 10,000 টি ভিউ সহ অন্য যে কোনও প্রশ্নের চেয়ে উচ্চতর বাছাই করা হবে তবে 10,000 ভোটের কম হবে।
আমি বর্তমানে an একটি অভিজ্ঞতা অভিজ্ঞতা হিসাবে ব্যবহার করছি, তবে আমি সুনির্দিষ্ট হতে চাই। গাণিতিক কঠোরতার সাথে আমি কীভাবে এই সমস্যার কাছে যেতে পারি?
কিছু মন্তব্যে সম্বোধন করার জন্য, আমি আরও ভালভাবে সমস্যাটি পুনরায় পুনরুদ্ধার করার চেষ্টা করব:
আসুন আমি একটা প্রশ্ন আছে সঙ্গে ভোট সম্পূর্ণ এবং মতামত। আমি অনুমান করার জন্য কি মোট ভোট পাবে চাই যখন মতামত পৌঁছাতে সবচেয়ে সম্ভাবনা রয়েছে ।n 0 v 1 n 1
এভাবে আমি কেবল একটি নামমাত্র মূল্য চয়ন করতে পারেন ও প্রত্যাশিত অনুযায়ী সব প্রশ্নের ক্রম মোট।ভি 1
আমি কথা বলছি তার আরও ভাল প্রভাব দেখানোর জন্য আমি এসও ডাটাডাম্পে দুটি প্রশ্ন তৈরি করেছি:
ফলাফল:
ভিউ দ্বারা গড় স্কোর (100-দর্শন বালতি)
ফলাফল:
ফলাফল, স্ট্রেটার ভাল কিনা তা নিশ্চিত নয়: ( নীল মধ্যে n ,v লাল)