কীভাবে এফ-পরিমাপের মূল্যবোধ ব্যাখ্যা করবেন?


41

আমি জানতে চাই কীভাবে চ-পরিমাপের মানগুলির একটি পার্থক্য ব্যাখ্যা করতে হয়। আমি জানি যে চ-পরিমাপটি নির্ভুলতা এবং পুনর্বিবেচনার মধ্যে একটি ভারসাম্যপূর্ণ গড়, তবে আমি এফ-ব্যবস্থাগুলির পার্থক্যের ব্যবহারিক অর্থ সম্পর্কে জিজ্ঞাসা করছি।

উদাহরণস্বরূপ, যদি শ্রেণিবদ্ধ সি 1 এর 0,4 এবং অন্য শ্রেণিবদ্ধ সি 2 এর যথার্থতা 0.8 থাকে তবে আমরা বলতে পারি যে সি 2 সি পরীক্ষার উদাহরণগুলির দ্বিগুণকে সঠিকভাবে শ্রেণিবদ্ধ করেছে। তবে, যদি কোনও শ্রেণিবদ্ধ সি 1 এর একটি নির্দিষ্ট শ্রেণির জন্য 0.4 এর এফ-পরিমাপ থাকে এবং অন্য শ্রেণিবদ্ধ সি 2 এর 0.8 এর একটি এফ-পরিমাপ থাকে, তবে 2 শ্রেণিবদ্ধের পারফরম্যান্সের পার্থক্য সম্পর্কে আমরা কী বলতে পারি? আমরা কি বলতে পারি যে সি 2 আরও বেশি উদাহরণের সি 1 শ্রেণীবদ্ধ করেছে?


2
আমি নিশ্চিত নই যে আপনি এফ-পরিমাপ যথার্থতা এবং পুনর্বিবেচনা উভয়েরই কার্যকারিতা: এন.ইউইউইকিপিডিয়া.আর / উইকি / এফ 1_স্কোর । আপনি যদিও গণিত করতে পারেন এবং একটি (যথার্থতা বা স্মরণ করুন) ধ্রুবক ধরে রাখতে এবং অন্যটির সম্পর্কে কিছু বলতে পারেন।
নিক 16

উত্তর:


41

আমি এফ পরিমাপের একটি স্বজ্ঞাত অর্থ সম্পর্কে ভাবতে পারি না, কারণ এটি কেবল একটি সম্মিলিত মেট্রিক। এফ-ম্যাসুরের চেয়ে বেশি স্বজ্ঞাত কী, অবশ্যই এটি যথার্থ এবং স্মরণযোগ্য rec

তবে দুটি মান ব্যবহার করে আমরা প্রায়শই নির্ধারণ করতে পারি না যে একটি অ্যালগরিদম অন্যটির চেয়ে উচ্চতর কিনা। উদাহরণস্বরূপ, যদি একটি অ্যালগরিদমের উচ্চতর নির্ভুলতা থাকে তবে অন্যের তুলনায় কম স্মৃতি থাকে তবে আপনি কীভাবে বলতে পারেন কোনটি অ্যালগরিদম ভাল?

আপনার মনে যদি একটি নির্দিষ্ট লক্ষ্য থাকে তবে 'যথার্থ রাজা। আমি স্মরণ করিয়ে দেওয়ার বিষয়ে খুব একটা পাত্তা দিই না, তারপরে কোনও সমস্যা নেই। উচ্চতর নির্ভুলতা আরও ভাল। তবে আপনার যদি এইরকম শক্ত লক্ষ্য না থাকে তবে আপনি একটি সম্মিলিত মেট্রিক চাইবেন। এফ-পরিমাপ। এটি ব্যবহার করে, আপনি কিছু নির্ভুলতা এবং কিছু পুনর্বিবেচনার সাথে তুলনা করবেন।

আরওসি বক্ররেখাকে প্রায়শই এফ-পরিমাপ করে অঙ্কিত হয়। আপনি এই নিবন্ধটি আকর্ষণীয় মনে করতে পারেন কারণ এতে আরওসি বক্ররেখাসহ কয়েকটি ব্যবস্থা সম্পর্কে ব্যাখ্যা রয়েছে: http://binf.gmu.edu/mmasso/ROC101.pdf


23

এফ 1 স্কোরটির গুরুত্ব পরিস্থিতি অনুসারে আলাদা। লক্ষ্য ভেরিয়েবলটি বাইনারি লেবেল হিসাবে ধরে নিই।

  • ভারসাম্যযুক্ত শ্রেণি: এই পরিস্থিতিতে, F1 স্কোর কার্যকরভাবে উপেক্ষা করা যেতে পারে, ভুল-শ্রেণিবিন্যাসের হারটি মূল।
  • ভারসাম্যহীন শ্রেণি, তবে উভয় শ্রেণিই গুরুত্বপূর্ণ: শ্রেণি বিতরণটি যদি উচ্চতর স্কুড হয় (যেমন ৮০:২০ বা ৯০:১০), তবে শ্রেণিবদ্ধকারী কেবল সংখ্যাগরিষ্ঠ শ্রেণি বাছাই করে কম ভুল শ্রেণিবিন্যাসের হার পেতে পারেন। এমন পরিস্থিতিতে, আমি এমন শ্রেণিবদ্ধ বেছে নেব যা উভয় শ্রেণিতে উচ্চ F1 স্কোর অর্জন করবে, পাশাপাশি কম মিস-শ্রেণিবদ্ধকরণের হার। এমন শ্রেণিবদ্ধকারী যা কম এফ 1-স্কোর পেয়ে যায় তা উপেক্ষা করা উচিত।
  • ভারসাম্যহীন বর্গ, তবে একটি শ্রেণি যদি আরও গুরুত্বপূর্ণ হয় যে অন্যটি। উদাহরণস্বরূপ জালিয়াতি শনাক্তকরণের ক্ষেত্রে, কোনও উদাহরণকে প্রতারণামূলক হিসাবে সঠিকভাবে লেবেল করা আরও জরুরী, যেমনটি জালিয়াতিহীন কোনও লেবেল লাগানোর বিপরীতে। এই ক্ষেত্রে, আমি কেবলমাত্র গুরুত্বপূর্ণ ক্লাসে একটি ভাল এফ 1 স্কোর রয়েছে এমন শ্রেণিবদ্ধ বেছে নেব । প্রত্যাহার করুন যে এফ 1-স্কোর প্রতি ক্লাসে উপলব্ধ।

9

এফ-পরিমাপের স্বজ্ঞাত অর্থ রয়েছে। এটি আপনাকে জানায় যে আপনার শ্রেণিবদ্ধকারী কতটা নির্ভুল (কতগুলি উদাহরণ এটি সঠিকভাবে শ্রেণিবদ্ধ করে) পাশাপাশি এটি কতটা শক্তিশালী (এটি উদাহরণের একটি উল্লেখযোগ্য সংখ্যাকে মিস করে না)।

উচ্চ নির্ভুলতা কিন্তু কম প্রত্যাহার সহ, আপনি শ্রেণিবদ্ধকারী অত্যন্ত নির্ভুল, তবে এটি উল্লেখযোগ্য সংখ্যক উদাহরণগুলি মিস করে যা শ্রেণিবদ্ধ করা কঠিন। এটি খুব দরকারী নয়।

এই হিস্টোগ্রামটি একবার দেখুন। এখানে চিত্র বর্ণনা লিখুনএর আসল উদ্দেশ্যটি উপেক্ষা করুন।

ডানদিকে, আপনি উচ্চ নির্ভুলতা পাবেন তবে কম স্মরণ। যদি আমি কেবল ০.৯ এর উপরে স্কোর দিয়ে উদাহরণগুলি বেছে নিই তবে আমার শ্রেণিবদ্ধ উদাহরণগুলি খুব সুনির্দিষ্ট হবে তবে আমি উল্লেখযোগ্য সংখ্যার উদাহরণটি মিস করব। পরীক্ষাগুলি সূচিত করে যে এখানকার মিষ্টি স্পটটি প্রায় 0.76 এর কাছাকাছি, যেখানে এফ-পরিমাপটি 0.87।


5

এফ-পরিমাপটি আপনার যথার্থতা এবং পুনর্বিবেচনার সুরেলা মাধ্যম। বেশিরভাগ পরিস্থিতিতে আপনার যথার্থতা এবং পুনর্বিবেচনার মধ্যে একটি বাণিজ্য বন্ধ রয়েছে। আপনি যদি একজনকে বাড়িয়ে তুলতে এবং অন্যটিকে পছন্দ না করে আপনার শ্রেণিবদ্ধকারীটিকে অনুকূলিত করেন, সুরেলা গড় দ্রুত হ্রাস পায়। যথার্থতা এবং রিকাল উভয়ই সমান হলে এটি সর্বাধিক।

আপনার শ্রেণিবদ্ধদের জন্য 0.4 এবং 0.8 এর F- ব্যবস্থা দেওয়া, আপনি আশা করতে পারেন যে এইগুলি যেখানে রিকলের বিপরীতে নির্ভুলতার বাইরে ওজন করার সময় সর্বোচ্চ মান অর্জন করেছিল।

ভিজ্যুয়াল রেফারেন্সের জন্য উইকিপিডিয়া থেকে এই চিত্রটি একবার দেখুন :

এখানে চিত্র বর্ণনা লিখুন

এফ পরিমাপ এইচ , একজন এবং বি রিকল এবং স্পষ্টতা হয়। আপনি একটি বৃদ্ধি করতে পারেন, কিন্তু তারপরে অন্যটি হ্রাস পায়।


আমি "ক্রসড মই" ভিজ্যুয়ালাইজেশনটিকে কিছুটা সহজবোধ্য বলে মনে করেছি - আমার কাছে এটি A = B এর সমতা তৈরি করে যার ফলে সবচেয়ে বড় এইচ আরও স্বজ্ঞাত
Coruscate5

3

এফ-মাপার সূত্রটি (বিটা = 1 সহ এফ 1) সূত্রের সাথে একই পদার্থ যেমন পদার্থবিদ্যায় সমান্তরালে রাখা দুটি প্রতিরোধের সমন্বিত সমতুল্য প্রতিরোধকে প্রদান করে (2 ফ্যাক্টরটি ভুলে যায়)।

এটি আপনাকে একটি সম্ভাব্য ব্যাখ্যা দিতে পারে এবং আপনি উভয় বৈদ্যুতিন বা তাপীয় প্রতিরোধের সম্পর্কে ভাবতে পারেন। এই সাদৃশ্যটি সমান্তরালভাবে সংবেদনশীলতা এবং নির্ভুলতা দ্বারা গঠিত সমতুল্য প্রতিরোধের হিসাবে এফ-পরিমাপকে সংজ্ঞায়িত করবে।

এফ-পরিমাপের জন্য, সর্বাধিক সম্ভব 1 এবং আপনি তার প্রতিরোধের সাথে সাথে তার দু'জনের মধ্যে প্রতিরোধকে হারিয়ে ফেলেন (এটি খুব বেশি বলে, 1 এর নীচে একটি মান পান)। আপনি যদি এই পরিমাণ এবং এর গতিশীল আরও ভালভাবে বুঝতে চান তবে শারীরিক ঘটনা সম্পর্কে চিন্তা করুন। উদাহরণস্বরূপ, এটি উপস্থিত হয় যে এফ-পরিমাপ <= সর্বোচ্চ (সংবেদনশীলতা, নির্ভুলতা)।


3

Fβ1/β2

P=TPTP+FP
R=TPTP+FN
α
α1RR+1PP.
αFββ2

1

Fβ=1/((β2/(β2+1))1/r+(1/(β2+1))1/p)
β2<1pFβ

0

F1- স্কোর এর নিকটতম স্বজ্ঞাত অর্থ রিকল এবং তার যথার্থতার মাধ্যম হিসাবে অনুধাবন করা হচ্ছে। আসুন আপনার জন্য এটি সাফ করুন:

শ্রেণিবদ্ধকরণের কার্যক্রমে আপনি উচ্চ নির্ভুলতা এবং পুনর্বিবেচনা সহ একটি শ্রেণিবদ্ধ তৈরি করার পরিকল্পনা করতে পারেন । উদাহরণস্বরূপ, একটি শ্রেণিবদ্ধকারী যা বলে যে কোনও ব্যক্তি সৎ কিনা।

যথাযথতার জন্য, আপনি সাধারণত কোনও নির্দিষ্ট গ্রুপে কতটা সৎ লোক আছেন তা সঠিকভাবে বলতে সক্ষম হন। এই ক্ষেত্রে, উচ্চ নির্ভুলতার পরিচর্যা করার সময়, আপনি ধরে নেন যে আপনি মিথ্যাবাদী ব্যক্তিকে সৎ হিসাবে চিহ্নিত করতে পারেন তবে প্রায়শই নয়। অন্য কথায়, এখানে আপনি সম্পূর্ণ গোষ্ঠী হিসাবে সৎ থেকে মিথ্যাবাদী সনাক্ত করার চেষ্টা করছেন।

তবে, স্মরণ করার জন্য, আপনি যদি মিথ্যাবাদী ব্যক্তিকে সৎ বলে মনে করেন তবে আপনি সত্যিই উদ্বিগ্ন। আপনার জন্য, এটি একটি বড় ক্ষতি এবং একটি বড় ভুল হবে এবং আপনি এটি আর করতে চান না। এছাড়াও, যদি আপনি সত্যবাদী কাউকে মিথ্যাবাদী হিসাবে শ্রেণীবদ্ধ করেন তবে আপনার মডেলটি কখনও মিথ্যাবাদী ব্যক্তিকে সৎ হিসাবে দাবি করতে (বা বেশিরভাগভাবে না করা) উচিত নয়। অন্য কথায়, এখানে আপনি একটি নির্দিষ্ট শ্রেণিতে মনোনিবেশ করছেন এবং আপনি এটি সম্পর্কে কোনও ভুল না করার চেষ্টা করছেন।

এখন, আপনি যেখানে আপনার মডেলটি চান তা সেই ক্ষেত্রে নেওয়া যাক (1) একটি মিথ্যাবাদী (নির্ভুলতা) (2) থেকে যথাযথভাবে সৎকে চিহ্নিত করতে (2) উভয় শ্রেণির প্রতিটি ব্যক্তিকে চিহ্নিত করুন (প্রত্যাহার)। যার অর্থ আপনি যে মডেলটি উভয় মেট্রিকের উপর ভাল পারফরম্যান্স করবেন তা নির্বাচন করবেন।

আপনি মডেল নির্বাচনের সিদ্ধান্তটি দুটি মেট্রিকের গড়ের ভিত্তিতে প্রতিটি মডেলকে মূল্যায়নের চেষ্টা করবে try এফ-স্কোর সেরা এটি যা বর্ণনা করতে পারে। সূত্রটি একবার দেখে নেওয়া যাক:

প্রত্যাহার করুন: পি = টিপি / (টিপি + এফপি)

পুনরুদ্ধার: আর = টিপি / (টিপি + এফএন)

এফ-স্কোর: fscore = 2 / (1 / আর + 1 / পি)

আপনি যেমন দেখেন, উচ্চতর স্মরণ এবং নির্ভুলতা, তত বেশি এফ-স্কোর।


0

এফ 1 স্কোরটি নির্ভুলতা এবং পুনরুদ্ধারের সুরেলা মাধ্যম তা জেনেও নীচে সেগুলি সম্পর্কে কিছুটা সংক্ষেপে বলা হয়েছে।

আমি বলব রিকলটি মিথ্যা নেতিবাচক সম্পর্কে আরও বেশি .ie, একটি উচ্চতর রিকাল থাকার অর্থ মিথ্যা নেতিবাচক কম রয়েছে ।

Recall=tptp+fn

যতটা কম এফএন বা জিরো এফএন এর অর্থ কম, আপনার মডেলের পূর্বাভাসটি সত্যিই ভাল।

Precision=tptp+fp

এখানেও একই, কম বা জিরো ফলস পজিটিভ মানে মডেলের ভবিষ্যদ্বাণীটি সত্যই ভাল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.