রেটিংয়ের জন্য আস্থা অন্তর কীভাবে সন্ধান করবেন?


32

ইভান মিলারের "অ্যাওভারেজ রেটিংয়ের মাধ্যমে কীভাবে বাছাই করা যায়" রেটযুক্ত আইটেমগুলির জন্য বুদ্ধিমান সমষ্টিগত "স্কোর" পেতে আত্মবিশ্বাসের ব্যবধানের নীচের গণ্ডিকে ব্যবহার করার প্রস্তাব দেয়। তবে এটি বার্নোল্লি মডেলটির সাথে কাজ করছে: রেটিংগুলি হয় থাম্বস আপ বা থাম্বস ডাউন।

কোনও আইটেমের রেটিংয়ের সংখ্যা কম হতে পারে বলে ধরে নিয়ে কোনও রেটিং মডেলের জন্য থেকে তারকেন্দ্রের একটি পৃথক স্কোর নির্ধারণ করে এমন একটি যুক্তিসঙ্গত আত্মবিশ্বাসের ব্যবধান কী ?1k

আমি মনে করি যে আমি কীভাবে উইলসন এবং অ্যাগ্রেস্টি-কলের অন্তরগুলির কেন্দ্রটি রূপান্তর করতে পারি তা দেখতে পাচ্ছি

p~=i=1nxi+zα/22p0n+zα/22

যেখানে হয় বা (সম্ভবত আরও ভাল) এটি সমস্ত আইটেমের চেয়ে গড় রেটিং। তবে, আমি নিশ্চিত না যে কীভাবে অন্তরটির প্রস্থকে মানিয়ে নেওয়া যায়। আমার (সংশোধিত) সেরা অনুমান হবেp0=k+12

p~±zα/2n~i=1n(xip~)2+zα/2(p0p~)2n~

সঙ্গে , কিন্তু আমি আরো তুলনায় এটি Agresti-Coull একজন উপমা হিসেবে হাতে waving, যেমন যে গ্রহণ সঙ্গে ন্যায্যতা না করতেn~=n+zα/22

Estimate(X¯)±zα/2n~Estimate(Var(X))

প্রমিত আত্মবিশ্বাসের অন্তর রয়েছে যা প্রযোজ্য? (নোট করুন যে কোনও জার্নালে আমার সাবস্ক্রিপশন নেই বা কোনও বিশ্ববিদ্যালয়ের লাইব্রেরিতে সহজে অ্যাক্সেস নেই; যথাযথ রেফারেন্স দিন, তবে দয়া করে আসল ফলাফলটি পরিপূরক করুন!)


4
যেহেতু বর্তমান জবাবগুলি (সম্ভবত ভদ্রতার বাইরে) এই সমস্যাটি ঘটিয়েছে, আমি উল্লেখ করতে চাই যে এই অ্যাপ্লিকেশনটি আত্মবিশ্বাসের সীমাবদ্ধতার একটি ভয়াবহ অপব্যবহার। এলসিএলকে র‌্যাঙ্ক করার জন্য ব্যবহার করার কোনও তাত্ত্বিক সমর্থন নেই (এবং এলসিএল প্রকৃতপক্ষে র‌্যাঙ্কিংয়ের উদ্দেশ্যে গড়ের চেয়ে নিজেকে আরও খারাপ করার কারণ প্রচুর কারণ রয়েছে)। সুতরাং এই প্রশ্নটি একটি খারাপভাবে ত্রুটিযুক্ত পদ্ধতির উপর পূর্বাভাস দেওয়া হয়েছে, যার কারণেই এটি তুলনামূলকভাবে সামান্য দৃষ্টি আকর্ষণ করেছে।
হোবার

2
এই নির্দিষ্ট প্রশ্নের একটি দুর্দান্ত বৈশিষ্ট্য হ'ল এতে প্রকৃত প্রশ্নটিকে উপেক্ষা করার জন্য এবং আরও গুরুত্বপূর্ণ অন্তর্নিহিত কোনটি বলে মনে হয়েছিল তা ফোকাস করার পক্ষে আমাদের যথেষ্ট প্রসঙ্গ রয়েছে।
কার্ল

1
আমি আনন্দিত আপনি পরিবর্তিত শিরোনামটি আপনার পছন্দ অনুসারে পরিবর্তন করেছেন পিটার। আমার আসল সম্পাদনাটি স্ব-পরিবেশনার জন্য নয়, শিরোনামটি প্রশ্নের পাঠ্যকে প্রতিফলিত করে তোলে। আপনি যা বলতে চাইছেন তা আপনি চূড়ান্ত সালিশী।
হোবার

উত্তর:


23

কার্ল ব্রোম্যান যেমনটি তার উত্তরে বলেছিলেন, আধ্যাত্মিক ব্যবস্থাগুলি ব্যবহারের চেয়ে বায়েশিয়ান পদ্ধতি সম্ভবত অনেক ভাল হবে।

আত্মবিশ্বাসের ব্যবধানগুলির সাথে সমস্যা

আত্মবিশ্বাসের ব্যবধানগুলি কেন খুব ভাল কাজ করে না? একটি কারণ হ'ল যদি আপনার কাছে কোনও আইটেমের জন্য অনেকগুলি রেটিং না থাকে তবে আপনার আত্মবিশ্বাসের ব্যবধানটি খুব প্রশস্ত হতে চলেছে, তাই আত্মবিশ্বাসের ব্যবধানের নীচের সীমাটি ছোট হবে। সুতরাং, অনেক রেটিং ছাড়াই থাকা আইটেমগুলি আপনার তালিকার নীচে শেষ হবে।

স্বজ্ঞাতভাবে, তবে আপনি সম্ভবত অনেকগুলি রেটিং ছাড়াই আইটেমগুলি গড় আইটেমের কাছাকাছি থাকতে চান, তাই আপনি আইটেমটির আনুমানিক রেটিংটি সমস্ত আইটেমের তুলনায় গড় রেটিংয়ের দিকে চালিয়ে যেতে চান (যেমন, আপনি আপনার আনুমানিক রেটিংটিকে পূর্বের দিকে ঠেলে দিতে চান ) । এটি একটি বায়েশিয়ান পদ্ধতির ঠিক তাই করে।

বায়েশিয়ান পদ্ধতির আই: রেটিংগুলির উপর সাধারণ বিতরণ

কার্লের উত্তরে যেমন অনুমানের রেটিংটি পূর্বের দিকে চালিত করার একটি উপায় হ'ল ফর্মের একটি অনুমান ব্যবহার করুন :wR+(1w)C

  • R আইটেমগুলির রেটিংয়ের চেয়ে বেশি গড়।
  • C হ'ল সমস্ত আইটেমের গড় (বা আপনি যা করতে চান তার রেটিংটি সঙ্কুচিত করতে চান তার আগে)।
  • মনে রাখবেন যে সূত্রটি ও এর একটি ভারী সমন্বয় ।RC
  • w=vv+m নির্ধারিত ওজন , যেখানে বিয়ারের জন্য পর্যালোচনার সংখ্যা এবং এক ধরণের ধ্রুবক "প্রান্তিক" পরামিতি।Rvm
  • মনে রাখবেন যে যখন খুব বড়, অর্থাত, যখন আমরা বর্তমান আইটেমের জন্য রেটিং অনেক আছে, তারপর খুব 1 বন্ধ, তাই আমাদের আনুমানিক রেটিং খুব কাছাকাছি আমরা পূর্বে সামান্য মনোযোগ দিতে । যখন ছোট হয় তবে খুব কাছাকাছি হয় তাই আনুমানিক রেটিং পূর্বের উপর অনেক বেশি ওজন রাখে ।vwRCvwC

এই রেটিকেশনটিকে বাস্তবে, কোনও রেটিং তার মানে কেন্দ্রিক কোনও সাধারণ বিতরণ থেকে যখন আসে তখন আইটেমটির গড় রেটিংয়ের উত্তরোত্তর অনুমান হিসাবে একটি বায়সিয়ান ব্যাখ্যা দেওয়া যেতে পারে।

তবে ধরে নিই যে রেটিংগুলি সাধারণ বিতরণ থেকে আসে দুটি সমস্যা আছে:

  • একটি সাধারণ বিতরণ অবিচ্ছিন্ন , তবে রেটিংগুলি পৃথক
  • কোনও আইটেমের রেটিং অবিবাহিতভাবে গাওসিয়ান আকার অনুসরণ করে না। উদাহরণস্বরূপ, হতে পারে আপনার আইটেমটি খুব মেরুকরণ করছে, তাই লোকেরা এটিকে খুব উচ্চতর রেটিং দেয় বা একে খুব কম রেটিং দেয়।

বায়েশিয়ান পদ্ধতির দ্বিতীয়: রেটিংয়ের উপর বহুজাতিক বিতরণ

সুতরাং রেটিংগুলির জন্য সাধারণ বিতরণ অনুমান করার পরিবর্তে আসুন একটি বহুজাতিক বিতরণ ধরে নেওয়া যাক । অর্থাৎ কিছু নির্দিষ্ট আইটেম দেওয়া, একটি সম্ভাবনা যে একটি র্যান্ডম ব্যবহারকারী এটিকে 1 টি তারা, একটি সম্ভাব্যতা দেব যে একটি র্যান্ডম ব্যবহারকারী এটিকে 2 তারা, ইত্যাদি দিতে হবে।p1p2

অবশ্যই, এই সম্ভাবনাগুলি কী তা আমাদের কোনও ধারণা নেই। যেহেতু আমরা এই আইটেমটির জন্য আরও বেশি রেটিং পেয়েছি, আমরা অনুমান করতে পারি যে close এর কাছাকাছি , যেখানে এমন ব্যবহারকারী সংখ্যা যারা তাকে 1 তারা দিয়েছেন এবং মোট ব্যবহারকারীদের সংখ্যা যারা রেট করেছেন আইটেমটি, কিন্তু যখন আমরা প্রথম শুরু করি তখন আমাদের কিছুই থাকে না। সুতরাং আমরা এই সম্ভাবনার উপর একটি ডিরিচলেট পূর্বেp1n1nn1n Dir(α1,,αk)

এই ডিরিচলেট আগে কি? আমরা একে মনে করতে পারেন সংখ্যা সময়ের কিছু ভার্চুয়াল ব্যক্তি আইটেমটি দিয়েছেন একটি "ভার্চুয়াল গণনা" হচ্ছে পরামিতি বড়। উদাহরণস্বরূপ, যদি , এবং অন্যান্য সমস্ত 0 এর সমান হয়, তবে আমরা এটিকে বলতে পারি যে দুটি ভার্চুয়াল লোক আইটেমটিকে 1 তারা দিয়েছে এবং একটি ভার্চুয়াল ব্যক্তি আইটেম 2 দিয়েছিল বড়। সুতরাং আমরা এমনকি কোনও প্রকৃত ব্যবহারকারী পাওয়ার আগে, আমরা এই ভার্চুয়াল বিতরণটি আইটেমের রেটিংয়ের একটি অনুমান সরবরাহ করতে ব্যবহার করতে পারি।αiiα1=2α2=1αi

[ প্যারামিটারগুলি বেছে নেওয়ার একটি উপায় তারকাদের ভোটের সামগ্রিক অনুপাতের সমান সেট করা । (দ্রষ্টব্য যে পরামিতিগুলি প্রয়োজনীয়ভাবে পূর্ণসংখ্যার হয় না))]α i i α iαiαiiαi

তারপরে, একবার প্রকৃত রেটিংগুলি আসার পরে কেবল তাদের ডিরিচলেট এর ভার্চুয়াল গণনায় কেবল তাদের গণনা যুক্ত করুন। আপনি যখনই আপনার আইটেমটির রেটিংটি অনুমান করতে চান, কেবলমাত্র আইটেমের সমস্ত রেটিং (তার ভার্চুয়াল রেটিং এবং এর প্রকৃত রেটিং উভয়) এর চেয়ে বেশি গড় নিন।


1
অ্যাপ্রোচ 2 1 টির কাছে পৌঁছানোর অনুরূপ হিসাবে কাজ করে, তাই না তবে এটি একটি ভিন্ন ন্যায্যতা সহ?
পিটার টেলর

2
@ পিটার: ওহ, সত্য! আপনি এটি উল্লেখ না করা অবধি বুঝতে পারেননি =)। (আপনি যদি যা করতে চান তা যদি পশ্চাতটির গড় ধরে নেওয়া হয় তবে তারা অভিন্ন I আমার ধারণা, আপনি যদি কোনও ভিন্ন ধরণের স্কোর গণনা করতে চান তবে একটি ডিরিচলেট পোস্টারিয়াল কার্যকর হতে পারে though একরকম বিরল হতে পারে))
রায়গেটিন

1
পদ্ধতির 1 এ, আপনি সাধারণত বেছে ? m
জেসন সি 0

15

এই পরিস্থিতি একটি বায়েশিয়ান পদ্ধতির জন্য চিৎকার করে। সেখানে Bayesian রেটিং স্থান জন্য সহজ পন্থা আছে এখানে (যা আকর্ষণীয় বেতন মন্তব্য বিশেষ করে,) এবং এখানে , এবং তারপর এইসব আরও ভাষ্য এখানে । এই লিঙ্কগুলির প্রথমটির একটি মন্তব্যে যেমন উল্লেখ করা হয়েছে:

বিয়ার অ্যাডভোকট (বিএ) সেরা ... একটি বায়সিয়ান অনুমান ব্যবহার করে:

ওজনযুক্ত র‌্যাঙ্ক (ডাব্লুআর) = (ভি / (ভি + এম)) + আর + (এম / (ভি + এম)) × সে

যেখানে:
বিয়ারের জন্য আর = রিভিউ গড়, বিয়ারের জন্য পর্যালোচনার
সংখ্যা
এম = ন্যূনতম পর্যালোচনাগুলি তালিকাবদ্ধ হতে হবে (বর্তমানে 10)
সি = তালিকা জুড়ে গড় (বর্তমানে 2.5)


2
বিয়ার অ্যাডভোকেট পদ্ধতির একটি অসুবিধা হ'ল এটি পরিবর্তনশীলতার বিষয়টি বিবেচনা করে না। তবুও, আমি নীচের সংমিশ্রণ সীমা ধারণার চেয়ে চিন্তাভাবনার এই লাইনটি পছন্দ করি।
কার্ল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.