শ্রেণিবদ্ধকারী "ভাল" কিনা তা নির্ভর করে
- আপনার বিশেষ সমস্যার জন্য আর কী পাওয়া যায়। স্পষ্টতই, আপনি চান যে একটি শ্রেণিবদ্ধকারী এলোমেলো বা নিষ্পাপ অনুমানের চেয়ে ভাল (যেমন, সবকিছুকে সাধারণ শ্রেণীর অন্তর্ভুক্ত হিসাবে শ্রেণীবদ্ধ করা) তবে কিছু জিনিস অন্যদের তুলনায় শ্রেণিবদ্ধ করা সহজ।
- বিভিন্ন ভুলের মূল্য (ভুয়া অ্যালার্ম বনাম মিথ্যা নেতিবাচক) এবং বেসের হার। অনুশীলনে সম্পূর্ণরূপে অকেজো (খুব ভাল নির্ভুলতার (কিছু পরীক্ষার নমুনায় সঠিক শ্রেণিবদ্ধকরণ) সহ শ্রেণিবদ্ধার পাওয়া সম্ভব বলে দু'টি আলাদা করা এবং ফলাফলগুলি কার্যকর করা খুব গুরুত্বপূর্ণ) (বলুন যে আপনি কোনও বিরল রোগ বা কিছু সনাক্ত করার চেষ্টা করছেন) অস্বাভাবিক দুষ্টু আচরণ এবং সনাক্তকরণের পরে কিছু পদক্ষেপ গ্রহণের পরিকল্পনা; বড় আকারের পরীক্ষার জন্য কিছু ব্যয় হয় এবং প্রতিকারমূলক ক্রিয়া / চিকিত্সাও সাধারণত উল্লেখযোগ্য ঝুঁকি / ব্যয়কে জড়িত করে তাই বিবেচনা করে যে বেশিরভাগ হিট মিথ্যা ইতিবাচক হতে চলেছে, ব্যয় / উপকারের দিক থেকে এটি কিছুই না করাই ভাল)।
একদিকে পুনরুদ্ধার / যথার্থতা এবং অন্যদিকে সংবেদনশীলতা / নির্দিষ্টতার মধ্যে থাকা লিঙ্কটি বুঝতে, একটি বিভ্রান্তির ম্যাট্রিক্সে ফিরে আসা দরকারী:
Condition: A Not A
Test says “A” True positive (TP) | False positive (FP)
----------------------------------
Test says “Not A” False negative (FN) | True negative (TN)
প্রত্যাহারটি হ'ল টিপি / (টিপি + এফএন) যেখানে যথার্থতা টিপি / (টিপি + এফপি)। এটি সমস্যার প্রকৃতি প্রতিফলিত করে: তথ্য পুনরুদ্ধারে আপনি যতগুলি প্রাসঙ্গিক ডকুমেন্ট সনাক্ত করতে চান (এটি প্রত্যাহারযোগ্য) এবং জাঙ্কের মাধ্যমে বাছাই করা এড়ানো (এটি যথার্থতা)।
একই টেবিলটি ব্যবহার করে, traditionalতিহ্যবাহী শ্রেণিবদ্ধকরণের মেট্রিকগুলি হ'ল (1) সংবেদনশীলতা টিপি / (টিপি + এফএন) এবং (2) নির্দিষ্টকরণ টিএন / (এফপি + টিএন) হিসাবে সংজ্ঞায়িত। সুতরাং প্রত্যাহার এবং সংবেদনশীলতা কেবল সমার্থক তবে যথার্থতা এবং স্পষ্টতা আলাদাভাবে সংজ্ঞায়িত হয় (যেমন প্রত্যাহার এবং সংবেদনশীলতার মতো, নির্দিষ্টকরণটি কলামের মোটের সাথে সংজ্ঞায়িত করা হয় তবে স্পষ্টতাটি সারির মোটকে বোঝায়)। যথার্থতাকে কখনও কখনও "ইতিবাচক ভবিষ্যদ্বাণীমূলক মান" বা খুব কমই "মিথ্যা পজিটিভ রেট" বলা হয় (তবে মিথ্যা পজিটিভের এই সংজ্ঞাটিকে ঘিরে বিভ্রান্তি সম্পর্কিত সত্য ধনাত্মক, মিথ্যা ধনাত্মক, মিথ্যা নেতিবাচক এবং সত্য নেতিবাচক মধ্যে আমার সম্পর্ক দেখুন) হার)।
মজার বিষয় হল তথ্য পুনরুদ্ধার মেট্রিক্স "সত্য নেতিবাচক" গণনা জড়িত না। এই জ্ঞান করে তোলে: তথ্য আহরণ, আপনি সম্পর্কে সঠিকভাবে যত্ন না নেতিবাচক দৃষ্টান্ত classifying SE প্রতি , আপনি শুধু তাদের আপনার ফলাফল দূষণ অনেক চাই না (এছাড়াও দেখুন কেন অ্যাকাউন্ট সত্য নেগেটিভ নিতে প্রত্যাহার না? )।
এই পার্থক্যের কারণে, অতিরিক্ত তথ্য, যথাযথ নেতিবাচক সংখ্যা বা বিকল্প হিসাবে, ইতিবাচক এবং নেতিবাচক কেসগুলির সামগ্রিক অনুপাত ছাড়া নির্দিষ্টতা থেকে নির্ভুলতা বা অন্যভাবে অন্যদিকে যাওয়া সম্ভব নয়। তবে একই কর্পস / পরীক্ষার সেটগুলির জন্য, উচ্চতর নির্দিষ্টকরণের অর্থ সর্বদা আরও ভাল নির্ভুলতা থাকে তাই তারা নিবিড়ভাবে সম্পর্কিত।
তথ্য পুনরুদ্ধার প্রসঙ্গে, লক্ষ্যটি সাধারণত প্রচুর পরিমাণে নথি থেকে সংখ্যক মিল খুঁজে পাওয়া। এই অসমত্বের কারণে সংবেদনশীলতা / স্মরণকে অবিচ্ছিন্ন রাখার ক্ষেত্রে একটি ভাল নির্দিষ্টতার চেয়ে ভাল নির্ভুলতা পাওয়াটা আসলে আরও বেশি কঠিন। যেহেতু বেশিরভাগ নথি অপ্রাসঙ্গিক, আপনার কাছে সত্য ধনাত্মকগুলির চেয়ে মিথ্যা অ্যালার্মের জন্য আরও অনেক উপলক্ষ রয়েছে এবং শ্রেণিবদ্ধের একটি ভারসাম্য পরীক্ষার সেটটিতে চিত্তাকর্ষক নির্ভুলতা থাকলেও এই ফলাফলগুলি সঠিকভাবে জলাবদ্ধ করতে পারে (এটি আসলে ঘটনাস্থলের আইনে কী চলছে) false উপরে আমার 2 পয়েন্টে উল্লিখিত)। ফলস্বরূপ, আপনার সত্যিকারের নির্ভুলতা নির্দিষ্ট করতে হবে এবং কেবলমাত্র নির্দিষ্ট সুনির্দিষ্টতা নিশ্চিত করার জন্য নয় কারণ 99% বা তার বেশি এর মতো চিত্তাকর্ষক-দর্শনীয় হারগুলিও কখনও কখনও অসংখ্য মিথ্যা অ্যালার্মগুলি এড়াতে পর্যাপ্ত হয় না।
সংবেদনশীলতা এবং নির্দিষ্টতার মধ্যে সাধারণত বাণিজ্য হয় (বা প্রত্যাহার এবং যথার্থতা)। স্বজ্ঞাতভাবে, আপনি যদি আরও বিস্তৃত নেট জাল করেন তবে আপনি আরও প্রাসঙ্গিক নথি / ইতিবাচক কেসগুলি (উচ্চ সংবেদনশীলতা / স্মরণ পুনরায়) সনাক্ত করতে পারবেন তবে আপনি আরও ভুয়া অ্যালার্ম পাবেন (নিম্ন সুনির্দিষ্টতা এবং নিম্ন নির্ভুলতা)। আপনি যদি ইতিবাচক বিভাগে সবকিছুকে শ্রেণিবদ্ধ করেন তবে আপনার 100% স্মরণ / সংবেদনশীলতা, একটি খারাপ নির্ভুলতা এবং বেশিরভাগ অকেজো শ্রেণিবদ্ধকারী ("বেশিরভাগ ক্ষেত্রে" কারণ আপনার কাছে অন্য কোনও তথ্য না থাকলে, এটি এটি যাচ্ছে না বলে ধরে নেওয়া পুরোপুরি যুক্তিসঙ্গত কোনও মরুভূমিতে বৃষ্টিপাত এবং সেই অনুসারে কাজ করার জন্য সম্ভবত আউটপুটটি সর্বোপরি অকেজো নয়; অবশ্যই, এর জন্য আপনার একটি পরিশীলিত মডেলের প্রয়োজন নেই)।
এই সমস্ত বিষয় বিবেচনা করে, 60% নির্ভুলতা এবং 95% পুনরুদ্ধার খুব খারাপ শোনাচ্ছে না তবে, এটি সত্যিই ডোমেন এবং এই শ্রেণিবদ্ধের সাথে আপনি কী করতে চান তার উপর নির্ভর করে।
সর্বশেষ মন্তব্য / সম্পাদনা সম্পর্কিত কিছু অতিরিক্ত তথ্য:
আবার, আপনি যে পারফরম্যান্সের আশা করতে পারেন তা সুনির্দিষ্টতার উপর নির্ভর করে (এই প্রসঙ্গে এটি প্রশিক্ষণের সেটে উপস্থিত আবেগের সঠিক সেট, চিত্র / ভিডিওর মানের, আলোকিতি, অবসারণ, মাথা নড়াচড়া, অভিনয় বা স্বতঃস্ফূর্ত ভিডিওগুলির মতো জিনিসগুলি হবে) ব্যক্তি-নির্ভর বা ব্যক্তি-স্বাধীন মডেল ইত্যাদি) তবে খুব ভাল মডেলগুলি কিছু ডেটা সেটগুলিতে আরও ভাল করতে পারে এমনকী এই ধরণের অ্যাপ্লিকেশনগুলির জন্য F1 ওভার ভাল লাগে [ভালস্টার, এমএফ, মেহু, এম, জিয়াং, বি।, প্যান্টিক, এম, এবং স্কেরার, কে। (2012)। প্রথম মুখের প্রকাশের স্বীকৃতি চ্যালেঞ্জের মেটা-বিশ্লেষণ। সিস্টেম, ম্যান এবং সাইবারনেটিক্স সম্পর্কিত আইইইই লেনদেন, পার্ট বি: সাইবারনেটিক্স, 42 (4), 966-979]]
এই জাতীয় মডেলটি অনুশীলনে কার্যকর কিনা তা সম্পূর্ণ আলাদা প্রশ্ন এবং স্পষ্টতই এটি প্রয়োগের উপর নির্ভর করে। নোট করুন যে ফেসিয়াল "এক্সপ্রেশন" নিজেই একটি জটিল বিষয় এবং একটি আদর্শ প্রশিক্ষণের সেট (পোজ করা এক্সপ্রেশন) থেকে কোনও বাস্তব জীবনের পরিস্থিতিতে যাওয়া সহজ নয়। এটি বরং এই ফোরামে অফ-টপিক তবে এটি যে কোনও ব্যবহারিক প্রয়োগের জন্য আপনি ভাবেন তার গুরুতর পরিণতি হবে।
শেষ অবধি, মডেলগুলির মধ্যে মাথা থেকে মাথা তুলনা করা আরও একটি প্রশ্ন। আপনি যে সংখ্যাগুলি উপস্থাপন করেছেন তা গ্রহণ করা হ'ল মডেলগুলির মধ্যে কোনও নাটকীয় পার্থক্য নেই (যদি আপনি উপরে বর্ণিত কাগজটি উল্লেখ করেন তবে এই অঞ্চলে সুপরিচিত মডেলগুলির জন্য এফ 1 স্কোরের পরিধি আরও বিস্তৃত)। অনুশীলনে, প্রযুক্তিগত দিকগুলি (স্ট্যান্ডার্ড লাইব্রেরির সহজলভ্যতা / বিভিন্ন প্রযুক্তির গতি ইত্যাদি) সম্ভবত কোন মডেলটি বাস্তবায়িত হবে তা সিদ্ধান্ত নেবে, ব্যয় হলে / ব্যয় এবং সামগ্রিক হার আপনাকে দৃ strongly়তার সাথে যথাযথতা বা পুনর্বিবেচনার পক্ষে করে তোলে।