নির্ভুলতার সাথে সমস্যা
মানক নির্ভুলতা সম্পন্ন শ্রেণিবিন্যাসের সংখ্যার সাথে সঠিক শ্রেণিবদ্ধের অনুপাত হিসাবে সংজ্ঞায়িত করা হয়।
accuracy:=correct classificationsnumber of classifications
এটি সমস্ত শ্রেণীর উপর সামগ্রিক পরিমাপের উপর এটি এবং আমরা শীঘ্রই দেখতে পাব এটি একটি আসল দরকারী পরীক্ষা বাদে কোনও ওরাকলকে বলা ভাল ব্যবস্থা নয়। একটি ওরাকল একটি শ্রেণিবদ্ধকরণ ফাংশন যা প্রতিটি নমুনার জন্য এলোমেলো অনুমান দেয়। তেমনি, আমরা আমাদের শ্রেণিবদ্ধকরণ ফাংশনের শ্রেণিবিন্যাসের পারফরম্যান্সকে রেট দিতে সক্ষম হতে চাই। যথার্থতা \ টেক্সটাইট} একটি কার্যকর পরিমাপ হতে পারে যদি আমাদের প্রতি ক্লাসে একই পরিমাণের নমুনা থাকে তবে আমাদের যদি নমুনার নির্ভুলতার ভারসাম্যহীন সেটটি মোটেই কার্যকর হয় না। আরও বেশি, টেস্টের উচ্চতর নির্ভুলতা থাকতে পারে তবে একটি কম যথার্থতার সাথে পরীক্ষার চেয়ে খারাপ কাজ করা যায়।
আমাদের যদি নমুনাগুলির বিতরণ থাকে যে 90% নমুনাগুলি A ক্লাসের অন্তর্গত , 5% B এবং অন্য 5%% এর C তবে নীচের শ্রেণিবদ্ধকরণ 0.9 যথাযথতা 0.9 থাকবে :
classify(sample):={Aif ⊤
তবুও, তা দেওয়া আমরা জানি যে কিভাবে সুস্পষ্ট classify কাজ করে এই এটা শ্রেণীর পৃথক্ এ সব বলতে পারে না। তেমনি, আমরা একটি শ্রেণিবদ্ধকরণ ফাংশন তৈরি করতে পারি
classify(sample):=guess⎧⎩⎨ABCwith p =0.96with p =0.02with p =0.02
একটি সঠিকতা যা 0.96⋅0.9+0.02⋅0.05⋅2=0.866 এবং সবসময় ভবিষ্যদ্বাণী করা হবে না
A কিন্তু এখনও দেওয়া আমরা জানি যে কিভাবে classify কাজ করে এটা সুস্পষ্ট যে শ্রেণীর আলাদা করে বলতে পারি না। এক্ষেত্রে নির্ভুলতা কেবল আমাদের শ্রেণিবিন্যাসের কাজটি অনুমান করার ক্ষেত্রে কতটা দুর্দান্ত তা বলে। এর অর্থ হ'ল সঠিক পরীক্ষাটি কোনও দরকারী পরীক্ষা বাদে কোনও ওরাকলকে বলা ভাল ব্যবস্থা নয়।
ক্লাস প্রতি নির্ভুলতা
আমরা একই ক্লাস থেকে আমাদের শ্রেণীবিন্যাস ফাংশন শুধুমাত্র নমুনার দিয়ে স্বতন্ত্রভাবে প্রতি ক্লাসে সঠিকতা গনা করতে পারেন এবং মনে রাখবেন এবং সঠিক শ্রেণীবিভাগেরও এবং ভুল শ্রেণীবিভাগেরও সংখ্যা গণনা তারপর গনা accuracy:=correct/(correct+incorrect) । আমরা প্রতিটি শ্রেণীর জন্য এটি পুনরাবৃত্তি। আমরা একটি শ্রেণীবিন্যাস ফাংশন সঠিকভাবে বর্গ চিনতে পারে যদি
A কিন্তু আউটপুট অন্য ক্লাসের জন্য একটি র্যান্ডম অনুমান তারপর এই একটি সঠিকতা ফলাফল হবে 1.00 জন্য
A এবং একটি সঠিকতা 0.33অন্যান্য ক্লাসের জন্য। এটি ইতিমধ্যে আমাদের শ্রেণিবদ্ধকরণ ফাংশনটির কার্যকারিতা বিচার করার জন্য আরও একটি ভাল উপায় সরবরাহ করে। সর্বদা একই শ্রেণীর অনুমান করা একটি ওরাকল সেই শ্রেণীর জন্য প্রতি শ্রেণীর যথার্থতা 1.00 , তবে অন্যান্য শ্রেণীর জন্য 0.00 উত্পাদন করবে । যদি আমাদের পরীক্ষা দরকারী সব প্রতি ক্লাসে accuracies হওয়া উচিত >0.5 । অন্যথায়, আমাদের পরীক্ষা সুযোগের চেয়ে ভাল নয়। তবে, ক্লাস প্রতি যথার্থতা মিথ্যা ইতিবাচক বিবেচনায় নেয় না। যদিও আমাদের শ্রেণীবিন্যাস ফাংশন বর্গ জন্য 100 \% সঠিকতা হয়েছে A সেখানে জন্য মিথ্যা পজিটিভ হতে হবে A (যেমন একটি হিসাবে B ভুলভাবে একটি হিসাবে শ্রেণীবদ্ধ করা A )।
সংবেদনশীলতা এবং নির্দিষ্টতা
চিকিত্সা পরীক্ষায় সংবেদনশীলতা সংজ্ঞায়িত করা হয় যে রোগটি সঠিকভাবে চিহ্নিত হওয়া এবং প্রকৃতপক্ষে এই রোগে আক্রান্ত মানুষের পরিমাণ হিসাবে চিহ্নিত করা হয় between নির্দিষ্টভাবে স্বাস্থ্যকর হিসাবে চিহ্নিত ব্যক্তি এবং প্রকৃতপক্ষে সুস্থ মানুষের পরিমাণের মধ্যে অনুপাত হিসাবে নির্দিষ্টকরণটিকে সংজ্ঞায়িত করা হয়। প্রকৃতপক্ষে এই রোগে আক্রান্ত ব্যক্তিদের পরিমাণ হ'ল সত্য পজিটিভ পরীক্ষার ফলাফলের পরিমাণ এবং মিথ্যা নেতিবাচক পরীক্ষার ফলাফলের পরিমাণ। প্রকৃত স্বাস্থ্যকর মানুষের পরিমাণ হ'ল সত্য নেতিবাচক পরীক্ষার ফলাফলের পরিমাণ এবং মিথ্যা ইতিবাচক পরীক্ষার ফলাফলের পরিমাণ।
বাইনারি শ্রেণিবদ্ধকরণ
বাইনারি শ্রেণিবদ্ধকরণের সমস্যাগুলিতে P এবং N দুটি শ্রেণি রয়েছে । Tn বলতে বোঝায় যে নমুনাগুলি সঠিকভাবে চিহ্নিত হয়েছিল যা ক্লাস n এবং Fn অন্তর্গত হিসাবে সঠিকভাবে চিহ্নিত হয়েছিল যেগুলি নমুনাগুলির সংখ্যাটিকে মিথ্যাভাবে চিহ্নিত করা হয়েছে যা ক্লাস n অন্তর্গত হিসাবে চিহ্নিত হয়েছিল । এই ক্ষেত্রে সংবেদনশীলতা এবং নির্দিষ্টতা নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়:
sensitivity:=TPTP+FNspecificity:=TNTN+FP
TP সত্যিকারের ধনাত্মকহওয়াFN মিথ্যা s ণাত্মক
হওয়া,TN সত্য negativeণাত্মক এবংFP মিথ্যা ধনাত্মক হওয়া। যাইহোক, নেগেটিভ এবং পজিটিভ দিক থেকে চিন্তা শিক্ষক পরীক্ষার জন্য কিন্তু একটা ভাল অনুভূতি আমরা নেগেটিভ এবং পজিটিভ পরিপ্রেক্ষিতে মনে করা উচিত নয় পেতে কিন্তু জেনেরিক ক্লাসের জরিমানাα এবংβ । তারপর, আমরা বলতে পারি যে নমুনা সঠিকভাবে অন্তর্গত হিসাবে চিহ্নিত পরিমাণα হয়Tα এবং নমুনার পরিমাণ যে আসলে অন্তর্গতα হয়Tα+Fβ। নমুনা সঠিকভাবে একাত্মতার না হিসেবে চিহ্নিত পরিমাণ α হয় Tβ এবং নমুনার আসলে একাত্মতার না পরিমাণ α হয়
Tβ+Fα । এটা আমাদের জন্য সংবেদনশীলতা এবং বিশেষত্বের দেয় α কিন্তু আমরা ক্লাসে একই জিনিস আবেদন করতে পারেন β । নমুনা সঠিকভাবে অন্তর্গত হিসাবে চিহ্নিত পরিমাণ β হয়
Tβ এবং আসলে একাত্মতার নমুনা পরিমাণ β হয় Tβ+Fα । নমুনার পরিমাণটি সঠিকভাবে β এর সাথে সম্পর্কিত নয় বলে চিহ্নিত করা হয়েছে βহয় Tα এবং নমুনার আসলে একাত্মতার না পরিমাণ β হয় Tα+Fβ । আমরা এইভাবে প্রতি ক্লাসে সংবেদনশীলতা এবং নির্দিষ্টতা পাই:
sensitivityα:=TαTα+Fβspecificityα:=TβTβ+Fαsensitivityβ:=TβTβ+Fαspecificityβ:=TαTα+Fβ
আমরা অবশ্য মান্য যে sensitivityα=specificityβ এবং specificityα=sensitivityβ। এর অর্থ হ'ল আমাদের যদি কেবল দুটি ক্লাস থাকে তবে আমাদের প্রতি ক্লাসে সংবেদনশীলতা এবং নির্দিষ্টতার প্রয়োজন নেই।
এন-আরি শ্রেণিবিন্যাস
প্রতি শ্রেণি প্রতি সংবেদনশীলতা এবং নির্দিষ্টতা কার্যকর নয় যদি আমাদের কেবল দুটি ক্লাস থাকে তবে আমরা এটি একাধিক ক্লাসে প্রসারিত করতে পারি। সংবেদনশীলতা এবং নির্দিষ্টতা হিসাবে সংজ্ঞায়িত করা হয়:
sensitivity:=true positivestrue positives+false negativesspecificity:=true negativestrue negatives+false-positives
সত্য ইতিবাচক সহজভাবে হয় Tn , মিথ্যা নেগেটিভ সহজভাবে হয় ∑i(Fn,i) এবং মিথ্যা পজিটিভ সহজভাবে হয় ∑i(Fi,n) । সত্য negativeণাত্মক সন্ধান করা আরও শক্ত কিন্তু আমরা বলতে পারি যে আমরা যদি n আলাদা কোনও শ্রেণীর অন্তর্ভুক্ত হিসাবে কিছুকে সঠিকভাবে শ্রেণিবদ্ধ করি তবে এটি সত্য negativeণাত্মক হিসাবে গণ্য হয়। এর অর্থ আমাদের কমপক্ষে ∑i(Ti)−T(n)সত্য নেতিবাচক। তবে, এটি সমস্ত সত্য নেতিবাচক নয়। একটি বর্গ চেয়ে ভিন্ন এর জন্য সকল ভুল শ্রেণীবিভাগেরও n সত্য নেগেটিভ কারণ তারা সঠিকভাবে একাত্মতার হিসেবে চিহ্নিত করা হয় নি হয় n । ∑i(∑k(Fi,k)) সমস্ত ভুল শ্রেণিবদ্ধকরণ উপস্থাপন করে। এর থেকে আমাদের কেসগুলি বিয়োগ করতে হবে যেখানে ইনপুট শ্রেণি ছিল n অর্থ আমরা n জন্য মিথ্যা ∑i(Fn,i) বিয়োগ করতে হবে যা ∑ i ( F n , i ) তবে আমরা এর জন্য মিথ্যা ধনাত্মককেও বিয়োগ করতে হবেn কারণ তারা মিথ্যা positives এবং না সত্য নেগেটিভ তাই আমরা বিয়োগ করতে আছে∑i(Fi,n) পরিশেষে পেয়ে
∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n)। সংক্ষিপ্তসার হিসাবে আমাদের রয়েছে:
true positives:=Tntrue negatives:=∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n)false positives:=∑i(Fi,n)false negatives:=∑i(Fn,i)
sensitivity(n):=TnTn+∑i(Fn,i)specificity(n):=∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)−∑i(Fi,n)∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)
আত্মবিশ্বাসের পরিচয়
confidence⊤Tn+∑i(Fi,n)nTn
confidence⊤(n):=TnTn+∑i(Fi,n)
confidence⊥nn
∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn∑i(Fn,i)
confidence⊥(n)=∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn−∑i(Fn,i)∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn