আমরা যখন যথার্থ এবং পুনরুদ্ধার উভয় বিবেচনা করে এফ-মেজার গণনা করি, তখন আমরা একটি সাধারণ গাণিতিক গড়ের পরিবর্তে দুটি ব্যবস্থার সুরেলা গড় গ্রহণ করি।
সহজ গড় নয় হারমোনিক মানে নেওয়ার পিছনে স্বজ্ঞাত কারণ কী?
আমরা যখন যথার্থ এবং পুনরুদ্ধার উভয় বিবেচনা করে এফ-মেজার গণনা করি, তখন আমরা একটি সাধারণ গাণিতিক গড়ের পরিবর্তে দুটি ব্যবস্থার সুরেলা গড় গ্রহণ করি।
সহজ গড় নয় হারমোনিক মানে নেওয়ার পিছনে স্বজ্ঞাত কারণ কী?
উত্তর:
এখানে ইতিমধ্যে আমাদের কয়েকটি বিস্তৃত উত্তর রয়েছে তবে আমি ভেবেছিলাম যে এটি সম্পর্কে আরও কিছু তথ্য গভীরভাবে উদ্বেগ করতে চায় এমন কিছু ছেলের জন্য সহায়ক হবে (বিশেষত কেন এফ পরিমাপ)।
পরিমাপের তত্ত্ব অনুসারে যৌগিক পরিমাপের নিম্নলিখিত 6 সংজ্ঞাটি পূরণ করতে হবে:
তারপরে আমরা কার্যকারিতাটির কার্য সম্পাদন করতে এবং তা পেতে পারি :
এবং সাধারণত আমরা কার্যকারিতাটি ব্যবহার করি না তবে খুব বেশি সহজ এফ স্কোর কারণ :
এখন আমাদের কাছে F পরিমাপের সাধারণ সূত্র রয়েছে:
যেখানে আমরা বিটা সেট করে স্মরণে বা নির্ভুলতার উপর আরও বেশি গুরুত্ব দিতে পারি, কারণ বিটাটি নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়েছে:
যদি আমরা ওজনটি যথার্থতার চেয়ে বেশি স্মরণ করি (সমস্ত প্রাসঙ্গিক নির্বাচিত) আমরা বিটা 2 হিসাবে সেট করতে পারি এবং আমরা F2 পরিমাপ পাই। এবং যদি আমরা স্মরণকারের চেয়ে বিপরীত ও ওজন নির্ভুলতা বেশি করি (যেমন নির্বাচিত উপাদানগুলি যথাসম্ভব প্রাসঙ্গিক, উদাহরণস্বরূপ কিছু ব্যাকরণ ত্রুটি সংশোধন পরিস্থিতিতে যেমন কোএনএলএল ) আমরা কেবল বিটা সেট করি 0.5 এবং F0.5 পরিমাপটি পাই। এবং স্পষ্টতই আমরা সর্বাধিক ব্যবহৃত F1 পরিমাপ (নির্ভুলতা এবং পুনরুদ্ধারের সুরেলা গড়) পেতে বিটা 1 হিসাবে সেট করতে পারি।
আমি মনে করি কিছু পরিমাণে আমি ইতিমধ্যে উত্তর দিয়েছি কেন আমরা গাণিতিক গড়টি ব্যবহার করি না।
তথ্যসূত্র:
ব্যাখ্যা করার জন্য, উদাহরণস্বরূপ বিবেচনা করুন, 30mph এবং 40mph এর গড় কত? আপনি যদি প্রতিটি গতিতে 1 ঘন্টা গাড়ি চালান তবে 2 ঘন্টা ধরে গড় গতি হ'ল প্রকৃতপক্ষে পাটিগণিত গড়, 35 এমপিএফ।
তবে আপনি যদি প্রতিটি গতিতে একই দূরত্বে গাড়ি চালান - 10 মাইল বলুন - তবে 20 মাইলের বেশি গতি হ'ল 30 এবং 40 এর সুরেলা গড়, প্রায় 34.3 এমপিএফ।
কারণটি হ'ল গড় বৈধ হওয়ার জন্য আপনার একই মানদণ্ডের ইউনিটগুলিতে মান হওয়া দরকার। প্রতি ঘন্টা মাইলকে একই সংখ্যক ঘন্টার সাথে তুলনা করা প্রয়োজন; পরিবর্তে আপনার প্রতি মাইল প্রতি ঘন্টা মাইলের একই সংখ্যার তুলনা করতে, যা সুরেলা মানে ঠিক তাই করে।
যথার্থতা এবং পুনরুদ্ধার উভয়েরই সংখ্যার এবং বিভিন্ন বিভাজনের ক্ষেত্রে সত্য ধনাত্মক থাকে have তাদের গড়তে এটি কেবলমাত্র তাদের পারস্পরিক ক্রিয়াকলাপ গড়ে গড়ে তোলার জন্য বোধগম্য হয়, এইভাবে সুরেলা মানে।
কারণ এটি চরম মানকে আরও শাস্তি দেয়।
একটি তুচ্ছ পদ্ধতি বিবেচনা করুন (যেমন সর্বদা ক্লাস এ ফিরে আসা)। বি শ্রেণীর অসীম ডেটা উপাদান এবং ক্লাস এ এর একক উপাদান রয়েছে:
Precision: 0.0
Recall: 1.0
গাণিতিক গড় গ্রহণ করার সময়, এটি 50% সঠিক হবে। সবচেয়ে খারাপ ফলাফল হওয়া সত্ত্বেও ! সুরেলা গড় দিয়ে, F1- পরিমাপ 0 হয়।
Arithmetic mean: 0.5
Harmonic mean: 0.0
অন্য কথায়, উচ্চ এফ 1 পাওয়ার জন্য আপনার উভয়কেই উচ্চতর নির্ভুলতা এবং পুনরুদ্ধার করতে হবে।
উপরের উত্তরগুলি ভালভাবে ব্যাখ্যা করা হয়েছে। এটি কেবল গণিতের গড়ের প্রকৃতি এবং প্লটগুলির সাথে সুরেলা মানে বোঝার জন্য দ্রুত রেফারেন্সের জন্য। আপনি প্লটটি থেকে দেখতে পাচ্ছেন, এক্স অক্ষ এবং ওয়াই অক্ষটি যথার্থ হিসাবে বিবেচনা করুন এবং প্রত্যাহার করুন এবং জেড অক্ষটি এফ 1 স্কোর হিসাবে বিবেচনা করুন। সুতরাং, সুরেলা গড়ের প্লট থেকে, যথার্থতা এবং পুনরুদ্ধার উভয়ই পাটিগণিত গড়ের বিপরীতে F1 স্কোরের জন্য সমানভাবে অবদান রাখতে হবে।
এটি পাটিগণিত গড়ের জন্য।
এটি হারমোনিক গড়ের জন্য।
হারমোনিক গড় হ'ল পাটিগণিত গড়ের সমান যা পরিমানের পারস্পরিক ক্রিয়াকলাপগুলির জন্য গড় গণিতের গড় দ্বারা গড় হওয়া উচিত। আরও স্পষ্টভাবে, সুরেলা মানে দিয়ে, আপনি আপনার সমস্ত সংখ্যাকে "গড়নযোগ্য" ফর্মে রূপান্তর করেছেন (পারস্পরিক গ্রহণ করে), আপনি তাদের পাটিগণিত গড় নেন এবং তারপরে ফলাফলটিকে মূল উপস্থাপনায় ফিরিয়ে দেন (পুনরায় পারস্পরিক গ্রহণ করে)।
যথার্থতা এবং পুনরুদ্ধার হ'ল "স্বাভাবিকভাবেই" প্রত্যাহার কারণ তাদের সংখ্যাটি একই এবং তাদের ডিনোমিনিটরগুলি পৃথক। ভগ্নাংশগুলি গাণিতিক গড় দ্বারা গড়ের চেয়ে আরও বোধগম্য হয় যখন তাদের ডিনামিনেটর একই থাকে।
আরও স্বজ্ঞাততার জন্য, মনে করুন যে আমরা সত্যিকারের ইতিবাচক আইটেমের সংখ্যা স্থির রেখেছি। তারপরে যথাযথতা এবং পুনর্বিবেচনার সুরেলা উপায় গ্রহণ করে আপনি স্পষ্টতই মিথ্যা ধনাত্মক এবং ভ্রান্ত নেতিবাচকগুলির গাণিতিক গড়টি গ্রহণ করেন। মূলত এর অর্থ হ'ল মিথ্যা ধনাত্মক এবং মিথ্যা নেতিবাচকতা আপনার জন্যও সমান গুরুত্বপূর্ণ যখন সত্য ধনাত্মকতা একই থাকে। যদি একটি অ্যালগরিদমের কাছে আরও বেশি মিথ্যা ধনাত্মক আইটেম থাকে তবে এন কম মিথ্যা sণাত্মক থাকে (একই সত্য ধনাত্মক হওয়ার পরে), এফ-পরিমাপ একই থাকে।
অন্য কথায়, এফ-পরিমাপটি উপযুক্ত যখন:
পয়েন্ট 1 সত্য হতে পারে বা নাও হতে পারে, এফ-পরিমাপের ওজনযুক্ত রূপগুলি রয়েছে যা এই অনুমানটি সত্য না হলে ব্যবহার করা যেতে পারে। পয়েন্ট 2 বেশ স্বাভাবিক কারণ আমরা আরও বেশি পয়েন্টগুলিকে শ্রেণিবদ্ধ করা হলে ফলাফলগুলি স্কেল হওয়ার আশা করতে পারি। আপেক্ষিক সংখ্যা একই থাকবে should
পয়েন্ট 3 বেশ আকর্ষণীয়। অনেক অ্যাপ্লিকেশনগুলিতে নেতিবাচক প্রাকৃতিক ডিফল্ট হয় এবং সত্যিকারের নেতিবাচক হিসাবে আসলে কী গণনা করা যায় তা নির্দিষ্ট করা এমনকি শক্ত বা স্বেচ্ছাচারিতা হতে পারে। উদাহরণস্বরূপ, আগুনের অ্যালার্মের প্রতি সেকেন্ডে প্রতিটি ন্যানোসেকেন্ডে প্রতিটি সময় সত্যিকারের নেতিবাচক ঘটনা ঘটে চলেছে every
বা কোনও মুখ সনাক্তকরণের ক্ষেত্রে, বেশিরভাগ সময় আপনি চিত্রের কোটি কোটি সম্ভাব্য ক্ষেত্রকে " সঠিকভাবে ফিরিয়ে দেন না " তবে এটি আকর্ষণীয় নয়। আকর্ষণীয় মামলা হয় যখন আপনি কি প্রস্তাবিত সনাক্তকরণ ফিরে বা যখন আপনি উচিত এটা ফিরে।
বিপরীতে শ্রেণিবদ্ধকরণ নির্ভুলতা সত্য ধনাত্মক এবং সত্য নেতিবাচক সম্পর্কে সমানভাবে যত্নশীল এবং নমুনার মোট সংখ্যা (শ্রেণিবিন্যাস ইভেন্ট) ভাল-সংজ্ঞায়িত এবং বরং ছোট হলে আরও উপযুক্ত।