কয়েকটি সম্ভাবনা আমার মনে আসে।
সামগ্রিক হিট রেটের দিকে নজর দেওয়া সাধারণত খুব ভাল ধারণা হয় না কারণ এটি বিভিন্ন শ্রেণির পারফরম্যান্সের ক্ষেত্রে পার্থক্য থাকলে টেস্ট সেটটির রচনার উপর নির্ভর করবে। সুতরাং খুব কমপক্ষে, আপনাকে অর্থবোধক মান অর্জনের জন্য আপনার পরীক্ষার ডেটাগুলিতে ক্লাসগুলির আপেক্ষিক ফ্রিকোয়েন্সি নির্দিষ্ট (এবং ন্যায্যতা) দেওয়া উচিত।
দ্বিতীয়ত, @ শোরাক যেমন ইতিমধ্যে বলেছে, ত্রুটি কী ধরণের গুরুত্বপূর্ণ তা উল্লেখ করুন। প্রায়শই, শ্রেণিবদ্ধকারীকে কার্যকর হওয়ার জন্য নির্দিষ্ট পারফরম্যান্সের মানদণ্ডগুলি পূরণ করতে হয় (এবং সামগ্রিক যথার্থতা পর্যাপ্ত পরিমাপ খুব কমই হয়)। সংবেদনশীলতা, সুনির্দিষ্টতা, ধনাত্মক এবং নেতিবাচক প্রাক্কলনমূলক মানের মতো পদক্ষেপ রয়েছে যা বিভিন্ন শ্রেণি এবং বিভিন্ন ধরণের ভুল শৃঙ্খলাবদ্ধতার বিষয়টি বিবেচনা করে। আপনি বলতে পারেন যে এই ব্যবস্থাগুলি শ্রেণিবদ্ধকারী সম্পর্কে বিভিন্ন প্রশ্নের উত্তর দেয়:
- সংবেদনশীলতা: সত্যিকার অর্থে শ্রেণীর C এর সাথে সম্পর্কিত কোন অংশটি স্বীকৃত?
- সুনির্দিষ্টতা: সত্যিকার অর্থে শ্রেণীর সি এর অন্তর্ভুক্ত না হওয়ার ক্ষেত্রে কোন ভগ্নাংশটি স্বীকৃত?
- ধনাত্মক ভবিষ্যদ্বাণীমূলক মান: শ্রেণিবদ্ধার দেওয়া সি ক্লাস পূর্বাভাস, এই ভবিষ্যদ্বাণীটি সঠিক হওয়ার সম্ভাবনা কী?
- নেতিবাচক ভবিষ্যদ্বাণীমূলক মান: শ্রেণিবদ্ধের পূর্বাভাস দেওয়া হয়েছে যে কেস সি ফর্ম নয় , এই ভবিষ্যদ্বাণীটি সঠিক হওয়ার সম্ভাবনা কী?
এই প্রশ্নগুলি প্রায়শই এমন স্পেসিফিকেশনগুলি তৈরি করতে দেয় যা কার্যকর হওয়ার জন্য শ্রেণিবদ্ধের অবশ্যই আবশ্যক।
শ্রেণিবদ্ধের ব্যবহারিক প্রয়োগের দৃষ্টিকোণ থেকে ভবিষ্যদ্বাণীমূলক মানগুলি প্রায়শই বেশি গুরুত্বপূর্ণ: সেগুলি পূর্বাভাসের উপর শর্তযুক্ত হয়, ক্লাসিফার প্রয়োগ করার সময় আপনি যে পরিস্থিতিতে রয়েছেন (একজন রোগী সাধারণত কীভাবে সম্ভাবনা জানেন তা জানতে আগ্রহী নন পরীক্ষা হ'ল রোগাক্রান্ত কেসগুলি সনাক্ত করা, তবে বর্ণিত রোগ নির্ণয়টি সঠিক হওয়ার সম্ভাবনা বেশি)। তবে, তাদের যথাযথভাবে গণনা করার জন্য শ্রেণিবদ্ধকারীর জন্য জনসংখ্যার বিভিন্ন শ্রেণীর তুলনামূলক ফ্রিকোয়েন্সিগুলি জানতে হবে (মনে হয় আপনার কাছে এই তথ্য রয়েছে - সুতরাং এটি দেখার থেকে আপনাকে রক্ষা করে এমন কিছুই নেই)।
ইতিবাচক বা নেতিবাচক পূর্বাভাস আপনাকে প্রদত্ত তথ্য অর্জনের দিকেও নজর রাখতে পারেন। এটি ইতিবাচক এবং নেতিবাচক সম্ভাবনা অনুপাত, LR⁺ এবং LR⁻ দ্বারা পরিমাপ করা হয় ⁻ সংক্ষেপে, তারা আপনাকে বলেছিল যে ভবিষ্যদ্বাণী প্রশ্নাবলীতে শ্রেণীর প্রতিকূলতাগুলিকে কতটা পরিবর্তন করে। ( আরও বিস্তারিত ব্যাখ্যা জন্য আমার উত্তর এখানে দেখুন)
আপনার তুচ্ছ শ্রেণিবদ্ধের জন্য, জিনিসগুলি দেখতে দেখতে: আমি "0" শ্রেণিকে প্রশ্নযুক্ত শ্রেণি হিসাবে ব্যবহার করব, সুতরাং "ইতিবাচক" অর্থ শ্রেণি "0"। 100 টির মধ্যে 100 টি ইতিবাচকভাবে পূর্বাভাস দেওয়া হয়েছে (0 শ্রেণির অন্তর্গত)। তাদের মধ্যে 97 সত্যিই করেন, 3 করবেন না। শ্রেণি 0 এর সংবেদনশীলতা 100% (সত্যিকারের ক্লাস 0 সম্পর্কিত সমস্ত 97 টি মামলা স্বীকৃত ছিল), সুনির্দিষ্টতা 0 (অন্যান্য ক্ষেত্রে কোনওটিই স্বীকৃত ছিল না)। ইতিবাচক ভবিষ্যদ্বাণী মান ((৯: ৩ আপেক্ষিক ফ্রিকোয়েন্সি প্রতিনিধি হিসাবে ধরে নেওয়া) %৯%, নেতিবাচক ভবিষ্যদ্বাণীমূলক মান গণনা করা যায় না কারণ কোনও নেতিবাচক ভবিষ্যদ্বাণী ঘটে নি।
LR+=sensitivity1−specificity=1
LR−=1−sensitivityspecificity=00
এখন এলআরএ এবং এলআর⁻ হ'ল ফ্যাক্টরি যার সাহায্যে আপনি ইতিবাচক শ্রেণীর ("0") এর সাথে সম্পর্কিত কেসটির পক্ষে মতভেদগুলি গুণান। 1 এর LR⁺ থাকার অর্থ ইতিবাচক পূর্বাভাস আপনাকে কোনও তথ্য দেয়নি: এটি প্রতিকূলতাকে পরিবর্তন করবে না। সুতরাং এখানে আপনার একটি পরিমাপ রয়েছে যা পরিষ্কারভাবে প্রকাশ করে যে আপনার তুচ্ছ শ্রেণিবদ্ধকারী কোনও তথ্য যুক্ত করে না ।
চিন্তার সম্পূর্ণ ভিন্ন দিক: আপনি উল্লেখ করেছেন যে আপনি বিভিন্ন শ্রেণিবদ্ধকে মূল্যায়ন করতে চাই। এটি কিছুটা শ্রেণিবদ্ধ তুলনা বা নির্বাচনের মতো শোনাচ্ছে। উপরে আমি যে পদক্ষেপগুলি নিয়ে আলোচনা করেছি তার সাথে সতর্কতা হ'ল আপনি যদি "হার্ড" শ্রেণির লেবেলে তাদের মূল্যায়ন করেন তবে এগুলি খুব উচ্চ র্যান্ডম অনিশ্চয়তার (যার অর্থ আপনার অনেক পরীক্ষার ক্ষেত্রে প্রয়োজন) to যদি আপনার ভবিষ্যদ্বাণীটি প্রাথমিকভাবে অবিচ্ছিন্ন থাকে (মেট্রিক, উদাহরণস্বরূপ উত্তরীয় সম্ভাবনা) আপনি সম্পর্কিত পদক্ষেপগুলি একই ধরণের প্রশ্নের দিকে তাকান তবে কেসগুলির ভগ্নাংশগুলি ব্যবহার না করে অবিচ্ছিন্ন ব্যবস্থা ব্যবহার করতে পারেন, দেখুন এখানে । ভবিষ্যদ্বাণীগুলির মধ্যে ছোট পার্থক্য সনাক্ত করার জন্য এগুলি আরও ভাল।
(@ ফ্র্যাঙ্কহারেল আপনাকে বলবে যে আপনার "যথাযথ স্কোরিং বিধি" প্রয়োজন, তাই এটি মনে রাখার জন্য অন্য একটি অনুসন্ধান শব্দ term)