কেন এফ-মেজারার সুরেলা এবং পুনরুদ্ধারের ব্যবস্থাগুলির গাণিতিক গড় নয়?


88

আমরা যখন যথার্থ এবং পুনরুদ্ধার উভয় বিবেচনা করে এফ-মেজার গণনা করি, তখন আমরা একটি সাধারণ গাণিতিক গড়ের পরিবর্তে দুটি ব্যবস্থার সুরেলা গড় গ্রহণ করি।

সহজ গড় নয় হারমোনিক মানে নেওয়ার পিছনে স্বজ্ঞাত কারণ কী?


4
অন্তর্দৃষ্টিটি যথার্থতা এবং পুনরায় স্মরণ করা (সাধারণত সর্বোত্তম পরিমাপ, তবে কোনও ক্ষেত্রে আপনি সর্বাধিক বা সঠিকভাবে স্মরণ করতে চান যা একটি ভিন্ন গল্প)। যে কোনও একটি খুব কম হলে আপনি উচ্চ এফ-স্কোর পেতে পারবেন না।
সবুজ সবুজ

4
cse.unsw.edu.au/~teachadmin/info/harmonic3.html এইচএম বোঝার জন্য এটি একটি ভাল উত্স
সুদীপ ভান্ডারী

4
উপরের লিঙ্কটি ঠিক করুন: di.unipi.it/~bozzo/The%20Harmonic%20Mean.htm বা আসল @ আর্কাইভ.আর
স্টোন

উত্তর:


16

এখানে ইতিমধ্যে আমাদের কয়েকটি বিস্তৃত উত্তর রয়েছে তবে আমি ভেবেছিলাম যে এটি সম্পর্কে আরও কিছু তথ্য গভীরভাবে উদ্বেগ করতে চায় এমন কিছু ছেলের জন্য সহায়ক হবে (বিশেষত কেন এফ পরিমাপ)।

পরিমাপের তত্ত্ব অনুসারে যৌগিক পরিমাপের নিম্নলিখিত 6 সংজ্ঞাটি পূরণ করতে হবে:

  1. সংযুক্তি (দুটি জোড়া অর্ডার করা যেতে পারে) এবং ট্রানজিটিভিটি (যদি e1> = e2 এবং e2> = e3 তবে e1> = ই3)
  2. স্বাধীনতা: দুটি উপাদান কার্যকরভাবে কার্যকরভাবে তাদের প্রভাবগুলিকে অবদান রাখে।
  3. থমসন শর্ত: একটি ধ্রুবক পুনর্বিবেচনা (যথার্থতা) দেওয়া সত্ত্বেও আমরা যথাযথতার দুটি মূল্য (পুনরুদ্ধার) জন্য কার্যকারিতার মধ্যে একটি পার্থক্য খুঁজে পাই তবে ধ্রুবক মান পরিবর্তন করে এই পার্থক্যটি সরানো বা বিপরীত করা যাবে না।
  4. সীমাবদ্ধ দ্রাব্যতা।
  5. প্রতিটি উপাদান অপরিহার্য: অন্যটিতে ধ্রুবক রেখে যাওয়ার সময় একের মধ্যে পার্থক্য কার্যকারিতাটিতে একটি ভিন্নতা দেয়।
  6. প্রতিটি উপাদান জন্য আর্কিমিডিয়ান সম্পত্তি। এটি কেবল নিশ্চিত করে যে কোনও উপাদানগুলির অন্তরগুলি তুলনীয়।

তারপরে আমরা কার্যকারিতাটির কার্য সম্পাদন করতে এবং তা পেতে পারি : এখানে চিত্র বর্ণনা লিখুন

এবং সাধারণত আমরা কার্যকারিতাটি ব্যবহার করি না তবে খুব বেশি সহজ এফ স্কোর কারণ :
এখানে চিত্র বর্ণনা লিখুন

এখন আমাদের কাছে F পরিমাপের সাধারণ সূত্র রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

যেখানে আমরা বিটা সেট করে স্মরণে বা নির্ভুলতার উপর আরও বেশি গুরুত্ব দিতে পারি, কারণ বিটাটি নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

যদি আমরা ওজনটি যথার্থতার চেয়ে বেশি স্মরণ করি (সমস্ত প্রাসঙ্গিক নির্বাচিত) আমরা বিটা 2 হিসাবে সেট করতে পারি এবং আমরা F2 পরিমাপ পাই। এবং যদি আমরা স্মরণকারের চেয়ে বিপরীত ও ওজন নির্ভুলতা বেশি করি (যেমন নির্বাচিত উপাদানগুলি যথাসম্ভব প্রাসঙ্গিক, উদাহরণস্বরূপ কিছু ব্যাকরণ ত্রুটি সংশোধন পরিস্থিতিতে যেমন কোএনএলএল ) আমরা কেবল বিটা সেট করি 0.5 এবং F0.5 পরিমাপটি পাই। এবং স্পষ্টতই আমরা সর্বাধিক ব্যবহৃত F1 পরিমাপ (নির্ভুলতা এবং পুনরুদ্ধারের সুরেলা গড়) পেতে বিটা 1 হিসাবে সেট করতে পারি।

আমি মনে করি কিছু পরিমাণে আমি ইতিমধ্যে উত্তর দিয়েছি কেন আমরা গাণিতিক গড়টি ব্যবহার করি না।

তথ্যসূত্র:

  1. https://en.wikedia.org/wiki/F1_score
  2. এফ-মাপের সত্যতা
  3. তথ্য পুনরুদ্ধার

100

ব্যাখ্যা করার জন্য, উদাহরণস্বরূপ বিবেচনা করুন, 30mph এবং 40mph এর গড় কত? আপনি যদি প্রতিটি গতিতে 1 ঘন্টা গাড়ি চালান তবে 2 ঘন্টা ধরে গড় গতি হ'ল প্রকৃতপক্ষে পাটিগণিত গড়, 35 এমপিএফ।

তবে আপনি যদি প্রতিটি গতিতে একই দূরত্বে গাড়ি চালান - 10 মাইল বলুন - তবে 20 মাইলের বেশি গতি হ'ল 30 এবং 40 এর সুরেলা গড়, প্রায় 34.3 এমপিএফ।

কারণটি হ'ল গড় বৈধ হওয়ার জন্য আপনার একই মানদণ্ডের ইউনিটগুলিতে মান হওয়া দরকার। প্রতি ঘন্টা মাইলকে একই সংখ্যক ঘন্টার সাথে তুলনা করা প্রয়োজন; পরিবর্তে আপনার প্রতি মাইল প্রতি ঘন্টা মাইলের একই সংখ্যার তুলনা করতে, যা সুরেলা মানে ঠিক তাই করে।

যথার্থতা এবং পুনরুদ্ধার উভয়েরই সংখ্যার এবং বিভিন্ন বিভাজনের ক্ষেত্রে সত্য ধনাত্মক থাকে have তাদের গড়তে এটি কেবলমাত্র তাদের পারস্পরিক ক্রিয়াকলাপ গড়ে গড়ে তোলার জন্য বোধগম্য হয়, এইভাবে সুরেলা মানে।


7
ধন্যবাদ, এটি কেন তত্ত্ব থেকে সমর্থিত তা সম্পর্কে একটি ভাল যুক্তি; আমার উত্তরটি ব্যবহারিক দিক থেকে বেশি ছিল।
কিউইট আছে - অ্যানি-মউসে

78

কারণ এটি চরম মানকে আরও শাস্তি দেয়।

একটি তুচ্ছ পদ্ধতি বিবেচনা করুন (যেমন সর্বদা ক্লাস এ ফিরে আসা)। বি শ্রেণীর অসীম ডেটা উপাদান এবং ক্লাস এ এর ​​একক উপাদান রয়েছে:

Precision: 0.0
Recall:    1.0

গাণিতিক গড় গ্রহণ করার সময়, এটি 50% সঠিক হবে। সবচেয়ে খারাপ ফলাফল হওয়া সত্ত্বেও ! সুরেলা গড় দিয়ে, F1- পরিমাপ 0 হয়।

Arithmetic mean: 0.5
Harmonic mean:   0.0

অন্য কথায়, উচ্চ এফ 1 পাওয়ার জন্য আপনার উভয়কেই উচ্চতর নির্ভুলতা এবং পুনরুদ্ধার করতে হবে।


যখন रिकেল 0.0 হয় তখন যথার্থতা 0.0 এর চেয়ে বেশি হতে হবে? তবে আমি আপনার উদাহরণে পয়েন্টটি পেয়েছি। সুন্দরভাবে ব্যাখ্যা করা হয়েছে - ধন্যবাদ।
লন্ডনের লোক

4
আপনার উদাহরণে, ক্লাস A এর যথার্থতা 0 এর পরিবর্তে 0.5 এবং ক্লাস এ এর ​​পুনর্বিবেচনা 1; ক্লাস বি এর যথার্থতা 0 এবং ক্লাস বি এর পুনরায় কল 0 হিসাবে আমরা করব is আমি ধরে নিলাম আপনার সুষম শ্রেণীর অর্থ আসল লেবেলগুলি এ এবং বি; প্রতিটি ডেটা 50% প্রযোজ্য।
সবুজ সবুজ

আসুন বি বি শ্রেণীর অসীম উপাদানগুলি এবং ক্লাস এ এর ​​একটি একক উপাদান এফ 1 এর পিছনে গণিতকে পরিবর্তন করে না।
কিট আছে - অ্যানি-মৌসে

4
আরও ভারসাম্য নির্বাচন করা কেবল এক তাত্পর্যপূর্ণ বিষয় নয়। এই অনুপাতের একককে বোঝার একমাত্র উপায় হরমোনিক গড় মানে। গড়ের তুলনা করে কোনও অর্থ হবে না
শন ওউন

এটি কোথায় "হিউরিস্টিক" বলে এবং আপনার মন্তব্যটি আমার উত্তর থেকে আলাদা কোথায়? কিন্তু: এফ পরিমাপ হয় এটা স্পষ্টতা অনুমান এবং রিকল সমানভাবে গুরুত্বপূর্ণ যে একটি অনুসন্ধানমূলক প্রক্রিয়া। এজন্যই বিটা শব্দটি বেছে নেওয়া দরকার - তাত্ত্বিকভাবে, কেউ সাধারণত বিটা = 1 ব্যবহার করে।
কিট আছে - অ্যানি-মউসে

30

উপরের উত্তরগুলি ভালভাবে ব্যাখ্যা করা হয়েছে। এটি কেবল গণিতের গড়ের প্রকৃতি এবং প্লটগুলির সাথে সুরেলা মানে বোঝার জন্য দ্রুত রেফারেন্সের জন্য। আপনি প্লটটি থেকে দেখতে পাচ্ছেন, এক্স অক্ষ এবং ওয়াই অক্ষটি যথার্থ হিসাবে বিবেচনা করুন এবং প্রত্যাহার করুন এবং জেড অক্ষটি এফ 1 স্কোর হিসাবে বিবেচনা করুন। সুতরাং, সুরেলা গড়ের প্লট থেকে, যথার্থতা এবং পুনরুদ্ধার উভয়ই পাটিগণিত গড়ের বিপরীতে F1 স্কোরের জন্য সমানভাবে অবদান রাখতে হবে।

এটি পাটিগণিত গড়ের জন্য।

এখানে চিত্র বর্ণনা লিখুন

এটি হারমোনিক গড়ের জন্য।

এখানে চিত্র বর্ণনা লিখুন


আপনার উত্তরটি সঠিকভাবে সম্পাদনা করতে এবং ফর্ম্যাট করতে ফর্ম্যাটিং সরঞ্জামগুলি ব্যবহার করুন। চিত্রটি এখানে প্রদর্শিত হবে, এটি হাইপারলিংক নয়।
মোর্স

26

হারমোনিক গড় হ'ল পাটিগণিত গড়ের সমান যা পরিমানের পারস্পরিক ক্রিয়াকলাপগুলির জন্য গড় গণিতের গড় দ্বারা গড় হওয়া উচিত। আরও স্পষ্টভাবে, সুরেলা মানে দিয়ে, আপনি আপনার সমস্ত সংখ্যাকে "গড়নযোগ্য" ফর্মে রূপান্তর করেছেন (পারস্পরিক গ্রহণ করে), আপনি তাদের পাটিগণিত গড় নেন এবং তারপরে ফলাফলটিকে মূল উপস্থাপনায় ফিরিয়ে দেন (পুনরায় পারস্পরিক গ্রহণ করে)।

যথার্থতা এবং পুনরুদ্ধার হ'ল "স্বাভাবিকভাবেই" প্রত্যাহার কারণ তাদের সংখ্যাটি একই এবং তাদের ডিনোমিনিটরগুলি পৃথক। ভগ্নাংশগুলি গাণিতিক গড় দ্বারা গড়ের চেয়ে আরও বোধগম্য হয় যখন তাদের ডিনামিনেটর একই থাকে।

আরও স্বজ্ঞাততার জন্য, মনে করুন যে আমরা সত্যিকারের ইতিবাচক আইটেমের সংখ্যা স্থির রেখেছি। তারপরে যথাযথতা এবং পুনর্বিবেচনার সুরেলা উপায় গ্রহণ করে আপনি স্পষ্টতই মিথ্যা ধনাত্মক এবং ভ্রান্ত নেতিবাচকগুলির গাণিতিক গড়টি গ্রহণ করেন। মূলত এর অর্থ হ'ল মিথ্যা ধনাত্মক এবং মিথ্যা নেতিবাচকতা আপনার জন্যও সমান গুরুত্বপূর্ণ যখন সত্য ধনাত্মকতা একই থাকে। যদি একটি অ্যালগরিদমের কাছে আরও বেশি মিথ্যা ধনাত্মক আইটেম থাকে তবে এন কম মিথ্যা sণাত্মক থাকে (একই সত্য ধনাত্মক হওয়ার পরে), এফ-পরিমাপ একই থাকে।

অন্য কথায়, এফ-পরিমাপটি উপযুক্ত যখন:

  1. ভুলগুলি সমানভাবে খারাপ, সেগুলি মিথ্যা ধনাত্মক বা মিথ্যা নেতিবাচক হোক
  2. সত্যের ধনাত্মক সংখ্যার তুলনায় ভুলের সংখ্যা পরিমাপ করা হয়
  3. সত্য নেতিবাচক উদ্দীপনা

পয়েন্ট 1 সত্য হতে পারে বা নাও হতে পারে, এফ-পরিমাপের ওজনযুক্ত রূপগুলি রয়েছে যা এই অনুমানটি সত্য না হলে ব্যবহার করা যেতে পারে। পয়েন্ট 2 বেশ স্বাভাবিক কারণ আমরা আরও বেশি পয়েন্টগুলিকে শ্রেণিবদ্ধ করা হলে ফলাফলগুলি স্কেল হওয়ার আশা করতে পারি। আপেক্ষিক সংখ্যা একই থাকবে should

পয়েন্ট 3 বেশ আকর্ষণীয়। অনেক অ্যাপ্লিকেশনগুলিতে নেতিবাচক প্রাকৃতিক ডিফল্ট হয় এবং সত্যিকারের নেতিবাচক হিসাবে আসলে কী গণনা করা যায় তা নির্দিষ্ট করা এমনকি শক্ত বা স্বেচ্ছাচারিতা হতে পারে। উদাহরণস্বরূপ, আগুনের অ্যালার্মের প্রতি সেকেন্ডে প্রতিটি ন্যানোসেকেন্ডে প্রতিটি সময় সত্যিকারের নেতিবাচক ঘটনা ঘটে চলেছে every

বা কোনও মুখ সনাক্তকরণের ক্ষেত্রে, বেশিরভাগ সময় আপনি চিত্রের কোটি কোটি সম্ভাব্য ক্ষেত্রকে " সঠিকভাবে ফিরিয়ে দেন না " তবে এটি আকর্ষণীয় নয়। আকর্ষণীয় মামলা হয় যখন আপনি কি প্রস্তাবিত সনাক্তকরণ ফিরে বা যখন আপনি উচিত এটা ফিরে।

বিপরীতে শ্রেণিবদ্ধকরণ নির্ভুলতা সত্য ধনাত্মক এবং সত্য নেতিবাচক সম্পর্কে সমানভাবে যত্নশীল এবং নমুনার মোট সংখ্যা (শ্রেণিবিন্যাস ইভেন্ট) ভাল-সংজ্ঞায়িত এবং বরং ছোট হলে আরও উপযুক্ত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.