স্ট্যাক এক্সচেঞ্জ প্রশ্নের জন্য "আকর্ষণীয়তা" ফাংশন


20

আমি স্ট্যাকএক্সচেঞ্জ সাইটগুলির জন্য ডেটা মাইনিং প্যাকেজ একসাথে রাখার চেষ্টা করছি এবং বিশেষত আমি "সবচেয়ে আকর্ষণীয়" প্রশ্নগুলি নির্ধারণের চেষ্টাতে আটকে আছি। আমি প্রশ্ন স্কোরটি ব্যবহার করতে চাই, তবে ভিউ সংখ্যার কারণে পক্ষপাতটি সরিয়ে ফেলব, তবে কীভাবে এটি কঠোরভাবে পৌঁছাতে হবে তা আমি জানি না।

আদর্শ বিশ্বে, আমি গণনা করে প্রশ্নগুলি বাছাই করতে পারতাম , যেখানে মোট ভোট এবং হল সংখ্যার সংখ্যা। সর্বোপরি এটি প্রশ্নটির উপরে উঠে আসা লোকদের শতাংশের পরিমাপ করবে, জনগণের শতকরা শতাংশের তুলনায় প্রশ্নটি নীচে নামবে। vnvnvn

দুর্ভাগ্যক্রমে, ভোটদানের ধরণটি আরও জটিল। ভোটগুলি একটি নির্দিষ্ট স্তরে "মালভূমি" বাড়ে এবং এর ফলে বন্য জনপ্রিয় প্রশ্নগুলিকে মারাত্মকভাবে অবমূল্যায়নের প্রভাব পড়ে। অনুশীলনে, 1 টি ভিউ এবং 1 আপভোটের সাথে একটি প্রশ্ন অবশ্যই স্কোর করবে এবং 10,000 টি ভিউ সহ অন্য যে কোনও প্রশ্নের চেয়ে উচ্চতর বাছাই করা হবে তবে 10,000 ভোটের কম হবে।

আমি বর্তমানে an একটি অভিজ্ঞতা অভিজ্ঞতা হিসাবে ব্যবহার করছি, তবে আমি সুনির্দিষ্ট হতে চাই। গাণিতিক কঠোরতার সাথে আমি কীভাবে এই সমস্যার কাছে যেতে পারি?vlogn+1

কিছু মন্তব্যে সম্বোধন করার জন্য, আমি আরও ভালভাবে সমস্যাটি পুনরায় পুনরুদ্ধার করার চেষ্টা করব:

আসুন আমি একটা প্রশ্ন আছে সঙ্গে ভোট সম্পূর্ণ এবং মতামত। আমি অনুমান করার জন্য কি মোট ভোট পাবে চাই যখন মতামত পৌঁছাতে সবচেয়ে সম্ভাবনা রয়েছে ।n 0 v 1 n 1v0n0v1n1

এভাবে আমি কেবল একটি নামমাত্র মূল্য চয়ন করতে পারেন ও প্রত্যাশিত অনুযায়ী সব প্রশ্নের ক্রম মোট।ভি 1n1v1


আমি কথা বলছি তার আরও ভাল প্রভাব দেখানোর জন্য আমি এসও ডাটাডাম্পে দুটি প্রশ্ন তৈরি করেছি:

স্কোর দ্বারা গড় দর্শন

ফলাফল:

স্কোর অনুসারে দর্শন

ভিউ দ্বারা গড় স্কোর (100-দর্শন বালতি)

ফলাফল:

দর্শন দ্বারা স্কোর


দুটি সূত্র তুলনা করা

ফলাফল, স্ট্রেটার ভাল কিনা তা নিশ্চিত নয়: ( নীল মধ্যে n ,vvn লাল)বনামএন+ +1

সূত্র


এটি অবশ্যই একটি আকর্ষণীয় প্রশ্ন, তবে আমি মনে করি আপনি স্ট্যাটাসে এটি জিজ্ঞাসা করা ভাল হতে পারে। এসই।

@ আপনি সত্যিই ঠিক থাকতে পারেন। মোডগুলিকে মাইগ্রেশন করার জন্য পতাকা দিচ্ছি যদি তারা মনে করে যে এটি সর্বোত্তম।

1
কেন দর্শনগুলি আকর্ষণীয়-নেসে অবদান রাখবে না? (তবে আরও খারাপ, কেন তারা নেতিবাচক অবদান রাখবে?) আরও আকর্ষণীয় বিষয়গুলি প্রায়শই দেখা যায় ... এখানে মূল সমস্যাটি কী আকর্ষণীয় এমনকি এর অর্থ কী? এর অর্থ কী সাধারণ আগ্রহ বা প্রশ্নগুলি যা আরও নির্দিষ্ট উচ্চ স্তরের দর্শকদের আগ্রহী? "গাণিতিক কঠোরতা" দিয়ে এই প্রশ্নের উত্তর দেওয়ার জন্য কারও পক্ষে প্রথমে কঠোরভাবে প্রশ্ন করা দরকার।

মতামতগুলি প্রশ্নগুলির পক্ষপাতিত্ব করে কারণ একটি প্রশ্ন হতে পারে, বলতে পারে কোনও ভাল সাইটের লিঙ্ক হতে পারে এবং প্রচুর ভিউ গ্রহণ করতে পারে - আপনি যদি শীর্ষ রেটেড প্রশ্নগুলি দেখেন তবে এগুলি সমস্ত উচ্চ দৃষ্টিভঙ্গির প্রশ্ন; আকর্ষণীয় দ্বারা আমি সেই প্রশ্নগুলি বোঝাই যা সাইটের ব্যবহারকারীদের দ্বারা আরও বেশি মূল্যবান হিসাবে বিবেচিত। যাই হোক না কেন, প্রশ্নটি এখনও দাঁড়িয়ে আছে: মানের সেরা ভবিষ্যদ্বাণী পাওয়ার জন্য মতামত এবং ভোটের সংমিশ্রণের সঠিক উপায় কী?

2
গণিতের লোকেরা ভাল প্রশ্ন করেছিলেন। এই প্রশ্নের যুক্তিটি বিজ্ঞপ্তিযুক্ত বলে মনে হচ্ছে: এটি আমাদের কাছে একটি এসই প্রশ্নের "গুণমান" পরিমাপের জন্য একটি সূত্র চেয়েছে বলে মনে হচ্ছে তবে এটি "গুণ" অর্থ "অপ্রচালিত প্রতিশব্দ" ব্যবহারকারীর দ্বারা উপলব্ধ হিসাবে মূল্য হিসাবে দেওয়া ব্যতীত কোনটি নির্দিষ্ট করে না doesn't সাইটের। " আপনি কিছুই জন্য কিছু পেতে পারে না!
whuber

উত্তর:


3

যে কোনও একটি আকর্ষণীয় প্রশ্নকে সংজ্ঞায়িত করতে পারে যে তুলনামূলকভাবে অনেক সংখ্যা পেয়েছে মতামতের সংখ্যা দিয়ে। এই লক্ষ্যে, আপনি একটি বেসলাইন বক্ররেখা তৈরি করতে পারেন যা মতামত প্রদত্ত ভোটের প্রত্যাশিত সংখ্যাকে প্রতিফলিত করে। বক্ররেখার চেয়ে অনেক বেশি ভোট আকর্ষণকারী রেখাচিত্রগুলি বিশেষ আকর্ষণীয় বলে বিবেচিত হয়েছিল।

বেসলাইনটি তৈরি করতে, আপনি প্রতি 100-ভিউ বিনের মধ্যবর্তী সংখ্যার ভোট গণনা করতে চাইতে পারেন। এছাড়াও, আপনি প্রতি বিন স্ট্যান্ডার্ড বিচ্যুতির জন্য শক্তিশালী পরিমাপ হিসাবে মিডিয়ান পরম বিচ্যুতি (এমএডি) গণনা করতে পারেন could তারপরে, "আকর্ষণীয়তা" হিসাবে গণনা করা যেতে পারে

interestingness(votes,views) = (votes-baselineVotes(views))/baselineMAD(views) 

1

এটি আমার তত্ত্ব। আমার মনে হয় এখানে দুটি ধরণের প্রশ্ন রয়েছে: সেগুলি বেশিরভাগ এসই এর মধ্যেই থাকে (যাদের সাধারণত দেখা খুব কম থাকে), এবং যেগুলি বাইরের লোকেরা দেখেন কারণ এটি অন্য কোথাও থেকে যুক্ত ছিল (সাধারণত আরও দৃষ্টিভঙ্গি থাকে)।

বেশিরভাগ এসই এর মধ্যে থাকা প্রশ্নগুলির জন্য, ভোটগুলি আকর্ষণীয় প্রশ্নের একটি ভাল পরিমাপ। এটা ভোটের পয়েন্ট।

কোনও প্রশ্নের সাইটের বাইরের সাথে লিঙ্ক করা হলে ভোট যতটা অর্থ বন্ধ করে দেয়। কিছু লিঙ্কিং সাইটগুলিতে খুব কম এসই সদস্য থাকতে পারে, অন্যের বেশি থাকতে পারে। এই প্রশ্নের জন্য ভোটের সংখ্যার বৈচিত্র সম্ভবত সম্ভবত উচ্চ (আপনার স্কোর বনাম ভিউ প্লট দ্বারা প্রমাণিত, যেখানে বক্ররের ডান দিকটি প্রস্ফুটিত হয়)। এই প্রশ্নগুলির আরও মতামত থাকবে, এবং দর্শনগুলি মজাদার প্রশ্নের আরও ভাল সূচক হতে পারে। অথবা আরও বড় আকর্ষণীয় হওয়ার জন্য বৃহত্তর সম্প্রদায়গুলির এমন প্রশ্নগুলি। এই পরিস্থিতিতে অনেক পরিবর্তনশীল রয়েছে, এবং আমি মনে করি যে এই কেসগুলি পৃথক করতে আরও তথ্যের সন্ধান করা উপযুক্ত হবে। এসই রেফারেল তথ্য প্রচার করে?


এসই রেফারেল তথ্য প্রচার করে? আমি কেবল উর্ধ্বগতি, মন্তব্য ইত্যাদির চেয়ে পোস্টগুলি দেখার ধরণটি জানতে আগ্রহী
d_a_c321
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.