কম লোকের দ্বারা আইটেমের চেয়ে বেশি রেট দেওয়া আইটেমের চেয়ে বেশি ব্যক্তি দ্বারা আইটেমকে উচ্চতর মূল্যায়ন করার জন্য কি কোনও রেটিং সিস্টেমের ওজন আছে?


9

আমার সাথে কথা বলার জন্য আগাম ধন্যবাদ, আমি কোনও ধরণের পরিসংখ্যানবিদ নই এবং আমি কী কল্পনা করছি তা বর্ণনা করতে জানি না, তাই গুগল এখানে আমাকে সহায়তা করছে না ...

আমি যে ওয়েব অ্যাপ্লিকেশনটিতে কাজ করছি তাতে একটি রেটিং সিস্টেম অন্তর্ভুক্ত করছি। প্রতিটি ব্যবহারকারী প্রতিটি আইটেম ঠিক একবার রেট করতে পারে।

আমি 4 টি মান সহ একটি স্কেল কল্পনা করছিলাম: "দৃ strongly়ভাবে অপছন্দ", "অপছন্দ", "পছন্দ", এবং "দৃ strongly়ভাবে পছন্দ" এবং আমি যথাক্রমে -5, -2, +2, এবং +5 এর মানগুলি নির্ধারণের পরিকল্পনা নিয়েছিলাম ।

এখন, যদি প্রতিটি আইটেমের একই সংখ্যার রেটিং থাকত, তবে আমি এই স্কোরিং সিস্টেমটি সর্বাধিক পছন্দ করা এবং কমপক্ষে পছন্দ করা আইটেমগুলিকে স্পষ্টভাবে পৃথক করে তুললে বেশ স্বাচ্ছন্দ্য বোধ করি। তবে আইটেমগুলিতে একই সংখ্যার রেটিং থাকবে না এবং বিভিন্ন ফটোতে ভোটের সংখ্যার মধ্যে বৈষম্যটি বেশ নাটকীয় হতে পারে।

সেক্ষেত্রে দুটি আইটেমের সাথে সংখ্যাসূচক স্কোরের তুলনা করার অর্থ হ'ল প্রচুর মধ্যম রেটিং সহ একটি পুরানো আইটেমটি অনেক কম ভোট সহ ব্যতিক্রমী নতুন আইটেমের তুলনায় অনেক বেশি স্কোর অর্জন করতে চলেছে।

সুতরাং, প্রথম স্পষ্টতই আমি আমাদের গড় হিসাবে নিয়ে যাওয়ার কথা ভেবেছিলাম ... তবে এখন যদি কোনও আইটেমের "+5" মাত্র একটি রেটিং থাকে তবে তার আইটেমের তুলনায় এটির তুলনায় ভাল গড় যে 99 "+5" রেটিং আছে? এবং 1 "+2" রেটিং। স্বজ্ঞাতভাবে এটি কোনও আইটেমের জনপ্রিয়তার সঠিক উপস্থাপনা নয়।

আমি ধারণা করি যে এই সমস্যাটি সাধারণ এবং আপনারা আরও বেশি উদাহরণ দিয়ে এটিকে শত্রু করে তোলার দরকার নেই, তাই আমি এই মুহুর্তে থামব এবং প্রয়োজনে মন্তব্যে আরও বিস্তারিত জানাব।

আমার প্রশ্নগুলি হ'ল:

  1. এই ধরণের সমস্যাটিকে কী বলা হয় এবং এটি সমাধানের জন্য ব্যবহৃত কৌশলগুলির জন্য একটি শব্দ রয়েছে? আমি এটি জানতে চাই যাতে আমি এটি পড়তে পারি।
  2. আপনি যদি বিষয়টিতে কোনও লে-বান্ধব সংস্থান সম্পর্কে জানতে চান তবে আমি একটি লিঙ্কটির খুব প্রশংসা করব।
  3. অবশেষে, এই জাতীয় ডেটা কীভাবে কার্যকরভাবে সংগ্রহ এবং বিশ্লেষণ করা যায় সে সম্পর্কে আমি অন্য কোনও পরামর্শের প্রশংসা করব।

উত্তর:


14

আপনি যেভাবে লড়াই করতে পারবেন তার এক উপায় হ'ল প্রতিটি বিভাগে অনুপাত ব্যবহার করা, যার জন্য আপনাকে প্রতিটি বিভাগের জন্য সংখ্যা স্থাপন করা প্রয়োজন হয় না (আপনি এটি "দৃ strongly় পছন্দ হিসাবে" হিসাবে নির্ধারিত 80% হিসাবে রেখে যেতে পারেন)। তবে অনুপাত কম পরিমাণে রেটিং ইস্যুতে ভুগছে । এটি আপনার উদাহরণে দেখায় যে 1 +5 রেটিং সহ ছবিটি 99 +5 এবং 1 +2 রেটিং সহ একের চেয়ে উচ্চতর গড় স্কোর (এবং অনুপাত) পাবে। এটি আমার অন্তর্দৃষ্টি দিয়ে ভাল মানায় না (এবং আমি বেশিরভাগ লোককে সন্দেহ করি)।

এই ছোট্ট নমুনা আকারের ইস্যুটি ঘুরে দেখার একটি উপায় হ'ল " ল্যাপ্লেসের উত্তরসূরীর নিয়ম " নামে পরিচিত বায়েশিয়ান কৌশলটি ব্যবহার করা (এই শব্দটি অনুসন্ধান করা কার্যকর হতে পারে)। সম্ভাব্যতা গণনা করার আগে এটি প্রতিটি বিভাগে কেবল 1 "পর্যবেক্ষণ" যুক্ত করে। যদি আপনি একটি সংখ্যাসূচক মানের জন্য গড় নিতে চান, তবে আমি একটি ওজনযুক্ত গড়ের প্রস্তাব দেব যেখানে উত্তরদণ্ডের বিধি দ্বারা গণনা করা সম্ভাবনাগুলি prob

গাণিতিক ফর্মের জন্য, respectively যথাক্রমে " strongly় অপছন্দ", "অপছন্দ", "লাইক", এবং "দৃ strongly় মত" এর প্রতিক্রিয়ার সংখ্যা বোঝায় (দুটি উদাহরণে, এবং )। তারপরে আপনি দৃ strongly়ভাবে পছন্দ করার জন্য সম্ভাবনা (বা ওজন) গণনা করুনnsd,nd,nl,nslnsl=1,nsd=nd=nl=0nsl=99,nl=1,nsd=nd=0

Pr("Strongly Like")=nsl+1nsd+nd+nl+nsl+4

আপনার দেওয়া দুটি উদাহরণের জন্য, তারা "দৃ strongly " এর সম্ভাব্যতাগুলি এবং যা আমি "সাধারণ জ্ঞান" এর সাথে আরও ঘনিষ্ঠভাবে সম্মত বলে মনে করি। যুক্ত হওয়া ধ্রুবকগুলি সরিয়ে outcome এবং give দেয় যা প্রথম ফলাফলটিকে তার চেয়ে কম মনে হয় (কমপক্ষে যাই হোক আমার কাছে)।1+11+0+0+0+4=2599+199+1+0+0+4=1001041199100

সম্পর্কিত স্কোরগুলি কেবল ওজনযুক্ত গড় দ্বারা দেওয়া হয়েছে, যা আমি নীচে লিখেছি:

Score=5nsl+1nsd+nd+nl+nsl+4+2nl+1nsd+nd+nl+nsl+42nd+1nsd+nd+nl+nsl+45nsd+1nsd+nd+nl+nsl+4

বা আরও সংক্ষিপ্ত হিসাবে

Score=5nsl+2nl2nd5nsdnsd+nd+nl+nsl+4

যা এবং এর দুটি উদাহরণে স্কোর দেয় । আমি মনে করি এটি দুটি ক্ষেত্রে একটি উপযুক্ত পার্থক্য দেখায়।55=14971044.8

এটি কিছুটা "গণিত" হতে পারে তাই আপনার আরও ব্যাখ্যা প্রয়োজন হলে আমাকে জানান know


এটি আমার জন্য কিছুটা "গণিত" ছিল এবং প্রাথমিকভাবে আমি সূত্রটি বুঝতে পারি নি, তবে আমি এটি প্রায় তিনবার মনোযোগ সহকারে পড়েছি এবং এটি ক্লিক করেছে! এই ঠিক আমি যা খুঁজছেন হয়, এবং আপনার ব্যাখ্যা এমনকি কেউ এ সব না একজন গণিতবিদ বা পরিসংখ্যানবিদ জন্য খুব পরিষ্কার ছিল। আপনাকে অনেক ধন্যবাদ!
অ্যান্ড্রু

2
খুব সুন্দর অ-প্রযুক্তিগত উত্তর, এবং এমন একটি উপায় যা আমি নিজের সম্পর্কে ভাবি না। আমি কেবল এটি যুক্ত করব যে অ-পূর্ণসংখ্যার সংখ্যা সহ 1 এর পরিবর্তে প্রতিটি বিভাগে যেকোন সংখ্যক জাল 'পর্যবেক্ষণ' যুক্ত করা সম্ভব। এটি আপনাকে কয়েকটি ভোটের সাহায্যে স্কোরের আইটেমের শূন্যের দিকে 'সঙ্কুচিত' করতে কতটা সিদ্ধান্ত নিতে নমনীয়তা দেয়। এবং যদি আপনি এই পদ্ধতির কোনও প্রযুক্তিগত-শব্দদায়ক বর্ণনা চান, তবে আপনি বলতে পারেন যে আপনি বহু আগে থেকে একটি প্রতিসামগ্রী ডিরিচলেট ব্যবহার করে বহু-জাতীয় বিতরণ থেকে ডেটার একটি বায়সিয়ান বিশ্লেষণ করছেন।
onestop

1
তারা "জাল" পর্যবেক্ষণের মতো বলে মনে হলেও এটি যখন +1 হয় তখন তাদের সঠিক সংজ্ঞায়িত অর্থ হয় (যা +2 বা উচ্চতর বিপরীতে থাকে, যা সত্যই "নকল" সংখ্যা বা পূর্ববর্তী তথ্য সংগ্রহের সংখ্যা)। এটি মূলত জ্ঞানের একটি অবস্থা বর্ণনা করে যে কোনও তথ্য পর্যবেক্ষণ করার আগে প্রতিটি বিভাগের পক্ষে ভোট দেওয়া সম্ভব । এটি (এন -1) সিমপ্লেক্সের ফ্ল্যাটটি পূর্বে যা করে তা স্পষ্টভাবে।
সম্ভাব্যতাব্লোগিক

এই পোস্টটি খুঁজে পাওয়া ভবিষ্যতের লোকদের জন্য আরও একটি পর্যবেক্ষণ: আমার মডেলটিতে এটি প্রয়োগ করার সময় আমি চূড়ান্ত স্কোর নিয়েছি এবং এটি 20 দ্বারা গুণিত করেছি, যা সবচেয়ে খারাপ সম্ভাব্য স্কোর থেকে -100 থেকে 100 রেঞ্জ দেয় (যদিও আমি মনে করি প্রযুক্তিগতভাবে এমন সীমাবদ্ধতা যা আপনি কখনও পৌঁছাতে পারবেন না তবে আপনি ধারণাটি পাবেন)। এটি আমার অ্যাপ্লিকেশন ব্যবহারকারীদের জন্য আউটপুট খুব স্বজ্ঞাত করে তোলে!
অ্যান্ড্রু

@ প্রোব্যাবিলিটিস্লোগিক: ডিরিচলেট আগে অবশ্যই কোনও কঠোর ইতিবাচক পরামিতি বর্ণনা করে যে সমস্ত সম্ভাবনাগুলি কঠোরভাবে 0 এবং 1 এর মধ্যে রয়েছে? : আর এই যুক্তি 2 / মি, যেখানে মি শ্রেণীর নম্বর, বদলে 1 তাদের সেটিং পরামর্শ en.wikipedia.org/wiki/...
onestop

2

আমি একটি গ্রাফিকাল পদ্ধতির গ্রহণ করব। এক্স-অক্ষটি গড় রেটিং হতে পারে এবং y রেটিংয়ের সংখ্যা হতে পারে। প্রবীণ তারকাদের সাথে তরুণ ফিনোমের অবদানের তুলনা করার জন্য আমি স্পোর্টসের পরিসংখ্যানগুলির সাথে এটি করতাম। নিকটতম একটি বিন্দু উপরের ডান কোণে, আদর্শের কাছাকাছি। অবশ্যই, "সেরা" আইটেমটি সিদ্ধান্ত নেওয়া এখনও একটি বিষয়গত সিদ্ধান্ত হতে পারে, তবে এটি কিছু কাঠামো সরবরাহ করবে।

আপনি যদি অন্য ভেরিয়েবলের বিপরীতে গড় রেটিং প্লট করতে চান, তবে আপনি বুদ্বুদ আকারে বুদ্বুদ আকার হিসাবে তৃতীয় ভেরিয়েবল হিসাবে রেটিং সংখ্যা নির্ধারণ করতে পারেন - যেমন এক্সএল বা এসএএস এ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.