শ্রেণিবিন্যাসে প্রত্যাহার এবং যথার্থতা


40

আমি প্রত্যাহার এবং নির্ভুলতার কয়েকটি সংজ্ঞা পড়েছি, যদিও তথ্য পুনরুদ্ধারের প্রসঙ্গে এটি প্রতিটি সময়। আমি ভাবছিলাম যদি কেউ শ্রেণিবিন্যাসের প্রসঙ্গে এটি আরও কিছুটা ব্যাখ্যা করতে পারে এবং সম্ভবত কিছু উদাহরণ বর্ণনা করতে পারে। উদাহরণস্বরূপ বলুন আমার কাছে একটি বাইনারি শ্রেণিবদ্ধ রয়েছে যা আমাকে 60০% এর যথার্থতা দেয় এবং ৯৯% এর পুনরুদ্ধার দেয়, এটি কি ভাল শ্রেণিবদ্ধ?

হতে পারে আমার লক্ষ্যটিকে আরও কিছুটা সহায়তা করার জন্য, আপনার মতে সেরা শ্রেণিবদ্ধী কোনটি? (ডেটাসেট ভারসাম্যহীন Major সংখ্যাগুরু শ্রেণীর সংখ্যালঘু শ্রেণির উদাহরণের দ্বিগুণ)

রিসিভার অপারেটর বক্ররেখার ক্ষেত্রফলের কারণে আমি ব্যক্তিগতভাবে 5 বলব ।

(যেমন আপনি এখানে দেখতে পাচ্ছেন মডেল 8 এর স্বল্প নির্ভুলতা রয়েছে, খুব উচ্চ রিক্যাল, তবে একটি নিম্নতম এউসি_আরসি, এটি কি এটি একটি ভাল মডেল হিসাবে তৈরি করে? বা একটি খারাপ?)

এখানে চিত্র বর্ণনা লিখুন


সম্পাদনা:

আমার কাছে আরও তথ্যের সাথে একটি এক্সেল ফাইল রয়েছে: https://www.rodbox.com/s/6hq7ew5qpztwbo8/comparissoninbalance.xlsx

এই দস্তাবেজে রিসিভার অপারেটর কার্ভের আওতাধীন অঞ্চল এবং নির্ভুলতা প্রত্যাহার বক্ররেখার অধীনে অঞ্চলটি পাওয়া যাবে। একসাথে প্লট সঙ্গে।


6
নেতিবাচক ভোট কেন? এটি একটি আকর্ষণীয় প্রশ্নের মতো মনে হচ্ছে (অবশ্যই একাধিক লোক উত্তর দেওয়া সম্ভব বলে মনে করেছিল)।
গালা

পারফরম্যান্সের পদক্ষেপ গণনা করার জন্য কতটি পরীক্ষার কেস জড়িত ছিল? এছাড়াও, যদি আপনি একই ডেটা সেটে বেশ কয়েকটি শ্রেণিবদ্ধকে তুলনা করেন তবে আপনি একটি যুক্ত নকশা ব্যবহার করতে পারেন (শ্রেণিবদ্ধ তুলনা নিয়ে সিভিতে বিভিন্ন প্রশ্ন ও উত্তর রয়েছে)।
ক্যাবলাইটগুলি মনিকা

আমার কাছে 799 টি নমুনা রয়েছে (যদি এটি পরীক্ষার ক্ষেত্রে বোঝানো হয় তবে)। প্রতিবার আমি 10 টি উপসেটে ডেটা বিভক্ত করি। ক্লাসিফায়ারদের পরীক্ষার জন্য 1 টি সাবসেট এবং বাকী শ্রেণিবদ্ধদের প্রশিক্ষণের জন্য (যা ক্লাসিফায়ারগুলির সাথে তুলনা করা হয় একই ডেটাতে প্রশিক্ষিত হয়)।
অলিভিয়ার_এস_জে

শ্রেণিবদ্ধরা কি বাইনারি মান আউটপুট দেয়, বা তারা একটি আসল মান আউটপুট দেয় এবং তারপরে এটি বাইনারি তৈরি করতে একটি থ্রেশহোল্ড ব্যবহার করে?
গ্যালাথ

তারা বাইনারি আউটপুট আউটপুট।
অলিভিয়ার_এস_জে

উত্তর:


40

শ্রেণিবদ্ধকারী "ভাল" কিনা তা নির্ভর করে

  1. আপনার বিশেষ সমস্যার জন্য আর কী পাওয়া যায়। স্পষ্টতই, আপনি চান যে একটি শ্রেণিবদ্ধকারী এলোমেলো বা নিষ্পাপ অনুমানের চেয়ে ভাল (যেমন, সবকিছুকে সাধারণ শ্রেণীর অন্তর্ভুক্ত হিসাবে শ্রেণীবদ্ধ করা) তবে কিছু জিনিস অন্যদের তুলনায় শ্রেণিবদ্ধ করা সহজ।
  2. বিভিন্ন ভুলের মূল্য (ভুয়া অ্যালার্ম বনাম মিথ্যা নেতিবাচক) এবং বেসের হার। অনুশীলনে সম্পূর্ণরূপে অকেজো (খুব ভাল নির্ভুলতার (কিছু পরীক্ষার নমুনায় সঠিক শ্রেণিবদ্ধকরণ) সহ শ্রেণিবদ্ধার পাওয়া সম্ভব বলে দু'টি আলাদা করা এবং ফলাফলগুলি কার্যকর করা খুব গুরুত্বপূর্ণ) (বলুন যে আপনি কোনও বিরল রোগ বা কিছু সনাক্ত করার চেষ্টা করছেন) অস্বাভাবিক দুষ্টু আচরণ এবং সনাক্তকরণের পরে কিছু পদক্ষেপ গ্রহণের পরিকল্পনা; বড় আকারের পরীক্ষার জন্য কিছু ব্যয় হয় এবং প্রতিকারমূলক ক্রিয়া / চিকিত্সাও সাধারণত উল্লেখযোগ্য ঝুঁকি / ব্যয়কে জড়িত করে তাই বিবেচনা করে যে বেশিরভাগ হিট মিথ্যা ইতিবাচক হতে চলেছে, ব্যয় / উপকারের দিক থেকে এটি কিছুই না করাই ভাল)।

একদিকে পুনরুদ্ধার / যথার্থতা এবং অন্যদিকে সংবেদনশীলতা / নির্দিষ্টতার মধ্যে থাকা লিঙ্কটি বুঝতে, একটি বিভ্রান্তির ম্যাট্রিক্সে ফিরে আসা দরকারী:

                      Condition: A             Not A

  Test says “A”       True positive (TP)   |   False positive (FP)
                      ----------------------------------
  Test says “Not A”   False negative (FN)  |    True negative (TN)

প্রত্যাহারটি হ'ল টিপি / (টিপি + এফএন) যেখানে যথার্থতা টিপি / (টিপি + এফপি)। এটি সমস্যার প্রকৃতি প্রতিফলিত করে: তথ্য পুনরুদ্ধারে আপনি যতগুলি প্রাসঙ্গিক ডকুমেন্ট সনাক্ত করতে চান (এটি প্রত্যাহারযোগ্য) এবং জাঙ্কের মাধ্যমে বাছাই করা এড়ানো (এটি যথার্থতা)।

একই টেবিলটি ব্যবহার করে, traditionalতিহ্যবাহী শ্রেণিবদ্ধকরণের মেট্রিকগুলি হ'ল (1) সংবেদনশীলতা টিপি / (টিপি + এফএন) এবং (2) নির্দিষ্টকরণ টিএন / (এফপি + টিএন) হিসাবে সংজ্ঞায়িত। সুতরাং প্রত্যাহার এবং সংবেদনশীলতা কেবল সমার্থক তবে যথার্থতা এবং স্পষ্টতা আলাদাভাবে সংজ্ঞায়িত হয় (যেমন প্রত্যাহার এবং সংবেদনশীলতার মতো, নির্দিষ্টকরণটি কলামের মোটের সাথে সংজ্ঞায়িত করা হয় তবে স্পষ্টতাটি সারির মোটকে বোঝায়)। যথার্থতাকে কখনও কখনও "ইতিবাচক ভবিষ্যদ্বাণীমূলক মান" বা খুব কমই "মিথ্যা পজিটিভ রেট" বলা হয় (তবে মিথ্যা পজিটিভের এই সংজ্ঞাটিকে ঘিরে বিভ্রান্তি সম্পর্কিত সত্য ধনাত্মক, মিথ্যা ধনাত্মক, মিথ্যা নেতিবাচক এবং সত্য নেতিবাচক মধ্যে আমার সম্পর্ক দেখুন) হার)।

মজার বিষয় হল তথ্য পুনরুদ্ধার মেট্রিক্স "সত্য নেতিবাচক" গণনা জড়িত না। এই জ্ঞান করে তোলে: তথ্য আহরণ, আপনি সম্পর্কে সঠিকভাবে যত্ন না নেতিবাচক দৃষ্টান্ত classifying SE প্রতি , আপনি শুধু তাদের আপনার ফলাফল দূষণ অনেক চাই না (এছাড়াও দেখুন কেন অ্যাকাউন্ট সত্য নেগেটিভ নিতে প্রত্যাহার না? )।

এই পার্থক্যের কারণে, অতিরিক্ত তথ্য, যথাযথ নেতিবাচক সংখ্যা বা বিকল্প হিসাবে, ইতিবাচক এবং নেতিবাচক কেসগুলির সামগ্রিক অনুপাত ছাড়া নির্দিষ্টতা থেকে নির্ভুলতা বা অন্যভাবে অন্যদিকে যাওয়া সম্ভব নয়। তবে একই কর্পস / পরীক্ষার সেটগুলির জন্য, উচ্চতর নির্দিষ্টকরণের অর্থ সর্বদা আরও ভাল নির্ভুলতা থাকে তাই তারা নিবিড়ভাবে সম্পর্কিত।

তথ্য পুনরুদ্ধার প্রসঙ্গে, লক্ষ্যটি সাধারণত প্রচুর পরিমাণে নথি থেকে সংখ্যক মিল খুঁজে পাওয়া। এই অসমত্বের কারণে সংবেদনশীলতা / স্মরণকে অবিচ্ছিন্ন রাখার ক্ষেত্রে একটি ভাল নির্দিষ্টতার চেয়ে ভাল নির্ভুলতা পাওয়াটা আসলে আরও বেশি কঠিন। যেহেতু বেশিরভাগ নথি অপ্রাসঙ্গিক, আপনার কাছে সত্য ধনাত্মকগুলির চেয়ে মিথ্যা অ্যালার্মের জন্য আরও অনেক উপলক্ষ রয়েছে এবং শ্রেণিবদ্ধের একটি ভারসাম্য পরীক্ষার সেটটিতে চিত্তাকর্ষক নির্ভুলতা থাকলেও এই ফলাফলগুলি সঠিকভাবে জলাবদ্ধ করতে পারে (এটি আসলে ঘটনাস্থলের আইনে কী চলছে) false উপরে আমার 2 পয়েন্টে উল্লিখিত)। ফলস্বরূপ, আপনার সত্যিকারের নির্ভুলতা নির্দিষ্ট করতে হবে এবং কেবলমাত্র নির্দিষ্ট সুনির্দিষ্টতা নিশ্চিত করার জন্য নয় কারণ 99% বা তার বেশি এর মতো চিত্তাকর্ষক-দর্শনীয় হারগুলিও কখনও কখনও অসংখ্য মিথ্যা অ্যালার্মগুলি এড়াতে পর্যাপ্ত হয় না।

সংবেদনশীলতা এবং নির্দিষ্টতার মধ্যে সাধারণত বাণিজ্য হয় (বা প্রত্যাহার এবং যথার্থতা)। স্বজ্ঞাতভাবে, আপনি যদি আরও বিস্তৃত নেট জাল করেন তবে আপনি আরও প্রাসঙ্গিক নথি / ইতিবাচক কেসগুলি (উচ্চ সংবেদনশীলতা / স্মরণ পুনরায়) সনাক্ত করতে পারবেন তবে আপনি আরও ভুয়া অ্যালার্ম পাবেন (নিম্ন সুনির্দিষ্টতা এবং নিম্ন নির্ভুলতা)। আপনি যদি ইতিবাচক বিভাগে সবকিছুকে শ্রেণিবদ্ধ করেন তবে আপনার 100% স্মরণ / সংবেদনশীলতা, একটি খারাপ নির্ভুলতা এবং বেশিরভাগ অকেজো শ্রেণিবদ্ধকারী ("বেশিরভাগ ক্ষেত্রে" কারণ আপনার কাছে অন্য কোনও তথ্য না থাকলে, এটি এটি যাচ্ছে না বলে ধরে নেওয়া পুরোপুরি যুক্তিসঙ্গত কোনও মরুভূমিতে বৃষ্টিপাত এবং সেই অনুসারে কাজ করার জন্য সম্ভবত আউটপুটটি সর্বোপরি অকেজো নয়; অবশ্যই, এর জন্য আপনার একটি পরিশীলিত মডেলের প্রয়োজন নেই)।

এই সমস্ত বিষয় বিবেচনা করে, 60% নির্ভুলতা এবং 95% পুনরুদ্ধার খুব খারাপ শোনাচ্ছে না তবে, এটি সত্যিই ডোমেন এবং এই শ্রেণিবদ্ধের সাথে আপনি কী করতে চান তার উপর নির্ভর করে।


সর্বশেষ মন্তব্য / সম্পাদনা সম্পর্কিত কিছু অতিরিক্ত তথ্য:

আবার, আপনি যে পারফরম্যান্সের আশা করতে পারেন তা সুনির্দিষ্টতার উপর নির্ভর করে (এই প্রসঙ্গে এটি প্রশিক্ষণের সেটে উপস্থিত আবেগের সঠিক সেট, চিত্র / ভিডিওর মানের, আলোকিতি, অবসারণ, মাথা নড়াচড়া, অভিনয় বা স্বতঃস্ফূর্ত ভিডিওগুলির মতো জিনিসগুলি হবে) ব্যক্তি-নির্ভর বা ব্যক্তি-স্বাধীন মডেল ইত্যাদি) তবে খুব ভাল মডেলগুলি কিছু ডেটা সেটগুলিতে আরও ভাল করতে পারে এমনকী এই ধরণের অ্যাপ্লিকেশনগুলির জন্য F1 ওভার ভাল লাগে [ভালস্টার, এমএফ, মেহু, এম, জিয়াং, বি।, প্যান্টিক, এম, এবং স্কেরার, কে। (2012)। প্রথম মুখের প্রকাশের স্বীকৃতি চ্যালেঞ্জের মেটা-বিশ্লেষণ। সিস্টেম, ম্যান এবং সাইবারনেটিক্স সম্পর্কিত আইইইই লেনদেন, পার্ট বি: সাইবারনেটিক্স, 42 (4), 966-979]]

এই জাতীয় মডেলটি অনুশীলনে কার্যকর কিনা তা সম্পূর্ণ আলাদা প্রশ্ন এবং স্পষ্টতই এটি প্রয়োগের উপর নির্ভর করে। নোট করুন যে ফেসিয়াল "এক্সপ্রেশন" নিজেই একটি জটিল বিষয় এবং একটি আদর্শ প্রশিক্ষণের সেট (পোজ করা এক্সপ্রেশন) থেকে কোনও বাস্তব জীবনের পরিস্থিতিতে যাওয়া সহজ নয়। এটি বরং এই ফোরামে অফ-টপিক তবে এটি যে কোনও ব্যবহারিক প্রয়োগের জন্য আপনি ভাবেন তার গুরুতর পরিণতি হবে।

শেষ অবধি, মডেলগুলির মধ্যে মাথা থেকে মাথা তুলনা করা আরও একটি প্রশ্ন। আপনি যে সংখ্যাগুলি উপস্থাপন করেছেন তা গ্রহণ করা হ'ল মডেলগুলির মধ্যে কোনও নাটকীয় পার্থক্য নেই (যদি আপনি উপরে বর্ণিত কাগজটি উল্লেখ করেন তবে এই অঞ্চলে সুপরিচিত মডেলগুলির জন্য এফ 1 স্কোরের পরিধি আরও বিস্তৃত)। অনুশীলনে, প্রযুক্তিগত দিকগুলি (স্ট্যান্ডার্ড লাইব্রেরির সহজলভ্যতা / বিভিন্ন প্রযুক্তির গতি ইত্যাদি) সম্ভবত কোন মডেলটি বাস্তবায়িত হবে তা সিদ্ধান্ত নেবে, ব্যয় হলে / ব্যয় এবং সামগ্রিক হার আপনাকে দৃ strongly়তার সাথে যথাযথতা বা পুনর্বিবেচনার পক্ষে করে তোলে।


আমার শ্রেণিবদ্ধ মুখগুলি ইতিবাচক বা নেতিবাচক আবেগে শ্রেণিবদ্ধ করে। আমি 10 গুণ ক্রস বৈধকরণ সহ কয়েকটি শ্রেণিবদ্ধকরণ অ্যালগরিদম চালিয়েছিলাম এবং মাঝে মাঝে 100% স্মরণও পাই, যদিও যথার্থতা প্রায় সমস্ত শ্রেণিবদ্ধদের জন্য (প্রায় 65%)। আমি ভারসাম্যহীন ডেটাসেট নিয়ে কাজ করি (সংখ্যাগরিষ্ঠ শ্রেণিতে সংখ্যালঘু শ্রেণির নমুনার দ্বিগুণ পরিমাণ থাকে)। তাই আমি ভেবেছিলাম এটির অর্থ সম্ভবত আমার মডেলগুলি প্যাটার্নটি শিখেনি।
অলিভিয়ার_স_জে

1
@ গালা: 'মিথ্যা অ্যালার্ম' এবং 'মিথ্যা নেতিবাচক' এর মধ্যে পার্থক্য কী? আপনার অর্থ কি কোনও 'মিথ্যা বিপদাশঙ্কা' এবং একটি 'মিথ্যা পজিটিভ'?
ম্যাট ওব্রায়ান

@ ম্যাটোব্রায়ান একটি মিথ্যা অ্যালার্মটি একটি মিথ্যা পজিটিভ (যেমন সিস্টেম বলেছে "সাবধান!" বা "কিছু খুঁজে পেয়েছি!" তবে কিছু করার দরকার নেই এবং কাজ করার দরকার নেই, তাই "ভুয়া অ্যালার্ম")। হতে পারে পরিভাষাটি কিছুটা বিভ্রান্তিকর, আমি পরে উত্তরটি পর্যালোচনা করব।
গালা

@ অজটিউভিস্ট যদি ইতিবাচকটির পূর্ব সম্ভাবনা% 67% থাকে তবে আপনি সমস্ত কিছুকে ইতিবাচক হিসাবে পূর্বাভাস দিয়ে ১০০% স্মরণ এবং% 67% নির্ভুলতা পেতে পারেন।
চিহ্নিত করুন

21

বাইনারি শ্রেণিবিন্যাসের প্রসঙ্গে উদাহরণগুলি ইতিবাচক বা নেতিবাচক।

  • প্রত্যাহারটি প্রশ্নটিকে সম্বোধন করে: "একটি ইতিবাচক উদাহরণ দেওয়া হয়েছে, শ্রেণিবদ্ধ এটি কি এটি সনাক্ত করবে?"
  • নির্ভুলতা প্রশ্নটিকে সম্বোধন করে: "শ্রেণিবদ্ধের কাছ থেকে একটি ইতিবাচক ভবিষ্যদ্বাণী দেওয়া হয়েছে, এটি সঠিক হওয়ার সম্ভাবনা কতটা?"

সুতরাং এটি নির্ভর করে যদি ফোকাসটি ইতিবাচক উদাহরণগুলিতে বা ইতিবাচক ভবিষ্যদ্বাণীগুলিতে থাকে।

কেউ বলতে পারে "কমপক্ষে 90% রিকোলে, সর্বোচ্চ নির্ভুলতার সাথে শ্রেণিবদ্ধকারী 4" কমপক্ষে %০% নির্ভুলতা সহ শ্রেণিবদ্ধদের মধ্যে যদি ভবিষ্যদ্বাণীগুলির গুণমানটি গুরুত্বপূর্ণ তবে সর্বাধিক প্রত্যাহার অর্জনকারীটি 6।


6

ক্রমাগত পূর্বাভাস থেকে সরানো, যেমন আরওসি অঞ্চল (একত্রীকরণ সম্ভাবনা; সি-সূচক) কম্পিউটিংয়ে ব্যবহৃত হয় একটি বিচ্ছিন্ন অনুচিত স্কোরিং নিয়মে (বাধ্যতামূলক-পছন্দ শ্রেণিবদ্ধকরণ নির্ভুলতা) যাবতীয় ধরণের অসঙ্গতিগুলির ফলাফল করে এবং বিশ্লেষককে ভুল ভবিষ্যদ্বাণীকারী বাছাই করার জন্য বিভ্রান্ত করবে এবং / বা ভুল মডেল। যথাযথ স্কোরিং নিয়মের ভিত্তিতে সিদ্ধান্ত নেওয়া আরও ভাল (যেমন লগ-সম্ভাবনা / বিচ্যুতি / লোগারিথমিক সম্ভাব্যতা স্কোরিং নিয়ম; বারিয়ার স্কোর (চতুর্ভুজ সম্ভাবনার যথার্থতা স্কোর))। এই ধরণের পদ্ধতির অনেকগুলি সুবিধার মধ্যে রয়েছে এমন পর্যবেক্ষণগুলি সনাক্তকরণ যার জন্য মধ্য-পরিসরের সম্ভাবনার কারণে অনিশ্চয়তার কারণে শ্রেণিবিন্যাস আপনার স্বাস্থ্যের পক্ষে বিপজ্জনক।


মডেল যখন সম্ভাব্য আউটপুট দেয় কেবল তখনই এই স্কোরিং নিয়মগুলি প্রযোজ্য নয়?
অলিভিয়ের_স_জে

3
আপনি আরওসি এউসি উল্লেখ করেছেন যার জন্য সম্ভাব্য আউটপুটগুলির প্রয়োজন (বা এমন কিছু যা এর একেশ্বরীয় ফাংশন)। সেরা ভবিষ্যদ্বাণীমূলক পদ্ধতিগুলির হুডের নীচে সম্ভাবনা রয়েছে।
ফ্র্যাঙ্ক হ্যারেল

DxyY

আরওসি এবং অ "বাধ্যতামূলক-পছন্দ" শ্রেণিবদ্ধকরণের নির্ভুলতার ব্যবস্থা ব্যবহারের ক্ষেত্রে সমস্যাটি হ'ল তারা প্রয়োগের প্রসঙ্গে এমন কোনও অর্থ বোঝায় না যেখানে ব্যবসায়ের ক্ষেত্রে অনুসারে একজনকে অবশ্যই একটি প্রান্তিক নির্বাচন করতে হবে। উদাহরণস্বরূপ, বিনিয়োগ ব্যাংকিংয়ের জন্য আর্থিক অপরাধ শনাক্তকরণ পণ্যটিতে কোনও ব্যবসায় কেবল বছরে 100 শ্রেণিবিন্যাস তদন্ত করার জন্য মানবসম্পদ থাকতে পারে, এটি একটি নির্দিষ্ট প্রান্তিক প্রান্তকে প্ররোচিত করে যা এর বিরুদ্ধে অনুকূলিত হওয়া উচিত। গিনি, আরওসি অঞ্চল ইত্যাদি আপনাকে এই দোরগোড়ায় মডেলটি কতটা ভাল তা বলবে না। ...
সামতিবেস্ট

2
তদন্তের সংখ্যার উপর বাজেটের সীমা থাকা খুব যুক্তিসঙ্গত। এর জন্য কোনও প্রান্তিকতা, নতুন অনুকূলকরণ, কোনও শ্রেণিবিন্যাস এবং কোনও আরওসি বিশ্লেষণের প্রয়োজন নেই। একজন কেবল পূর্বাভাসিত ঝুঁকির ক্রমবর্ধমান ক্রমে পর্যবেক্ষণগুলি সাজান এবং তদন্তের জন্য প্রথম 100 টি পর্যবেক্ষণ চয়ন করেন। এটি বিপণনে ব্যবহৃত একটি লিফট কার্ভের সাথে সম্পর্কিত।
ফ্রাঙ্ক হ্যারেল

5

আমরাও স্পষ্টতা কিংবা রিকল পূর্ণ কাহিনী বলুন, এবং এটি সঙ্গে, বলে predictor 85% স্পষ্টতা এবং 65% রিকল সঙ্গে, বলে predictor 90% রিকল এবং 60% স্পষ্টতা তুলনা কঠিন - যদি না, অবশ্যই, আপনি কনফিউশন ম্যাট্রিক্সে 4 টি কোষের প্রতিটি (টিপি / এফপি / টিএন / এফএন) এর সাথে যুক্ত ব্যয় / সুবিধা ।

শ্রেণিবদ্ধ কর্মক্ষমতা বর্ণনা করে একটি একক সংখ্যা ( দক্ষতা , ওরফে অনিশ্চয়তা সহগ ) পাওয়ার একটি আকর্ষণীয় উপায় হ'ল তথ্য তত্ত্বটি ব্যবহার করা :

proficiency = I(predicted,actual) / H(actual)

অর্থাৎ, এটি আপনাকে জানায় যে প্রকৃত উপাত্তে উপস্থিত তথ্যের কোন ভগ্নাংশটি শ্রেণিবদ্ধ দ্বারা পুনরুদ্ধার করেছিল। নির্ভুলতা বা পুনর্বিবেচনা 0 হয় তবে 0 হয় এবং যথার্থতা এবং রিকাল উভয়ই 100% হলে এটি 100% হয়। এটি এফ 1 স্কোরের অনুরূপ , তবে দক্ষতার একটি সুস্পষ্ট তথ্য-তাত্ত্বিক অর্থ রয়েছে যখন F1 কেবল একটি অর্থ সহ দুটি সংখ্যার সুরেলা গড়।

দক্ষতা মেট্রিক গণনা করতে আপনি কাগজ, উপস্থাপনা এবং কোড (পাইথন) পেতে পারেন: https://github.com/Magnetic/proficiency-metric


মজাদার! আপনি কীভাবে দক্ষতার গণনা করবেন তার একটি উদাহরণ দিতে পারেন? সূত্রটি আমার কাছে অদ্ভুত দেখাচ্ছে কারণ।
নিঃসঙ্গ

দয়া করে দেখুন github.com/Magnetic/proficiency-metric
এসডিএস

মন্তব্যগুলি বর্ধিত আলোচনার জন্য নয়; এই কথোপকথন চ্যাটে সরানো হয়েছে ।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.