ভোজটেক জে। ক্রজানোভস্কি এবং ডেভিড জে। হ্যান্ড আরআরসি কার্ভস অফ কনটিনিউস ডেটা (২০০৯) আরওসি বক্ররেখা সম্পর্কিত সমস্ত কিছুর জন্য দুর্দান্ত রেফারেন্স। হতাশাজনকভাবে বিস্তৃত সাহিত্যের ভিত্তি কী, এর ক্ষেত্রে এটি বেশ কয়েকটি ফলাফল সংগ্রহ করে যা প্রায়শই একই বিষয় নিয়ে আলোচনার জন্য বিভিন্ন পরিভাষা ব্যবহার করে।
অধিকন্তু, এই বইটি বিকল্প পদ্ধতির ভাষ্য এবং তুলনাগুলি সরবরাহ করে যা একই পরিমাণের অনুমান করার জন্য উত্পন্ন হয়েছে এবং উল্লেখ করেছে যে কিছু পদ্ধতি অনুমানগুলি তৈরি করে যা বিশেষ প্রেক্ষাপটে অক্ষম হতে পারে। এটি এমনই একটি প্রসঙ্গ; অন্যান্য উত্তরগুলি হ্যানলি ও ম্যাকনিল পদ্ধতিটি রিপোর্ট করে, যা স্কোর বিতরণের জন্য দ্বি-দ্বৈত মডেল গ্রহণ করে, যা ক্লাস স্কোর বিতরণ স্বাভাবিকের (কাছাকাছি) নয় এমন ক্ষেত্রে অনুচিত হতে পারে। সাধারণভাবে বিতরণ করা স্কোরগুলির অনুমান আধুনিক মেশিন-লার্নিং প্রসঙ্গে বিশেষভাবে অনুচিত বলে মনে হয় , এক্সজিবিস্টের মতো সাধারণ সাধারণ মডেলগুলি শ্রেণিবিন্যাসের কাজের জন্য "বাথটব" বিতরণ দিয়ে স্কোর তৈরি করার প্রবণতা দেখায় (যা, 0 এবং 1 এর নিকটবর্তী মাত্রায় উচ্চ ঘনত্ব সহ বিতরণ) )।
প্রশ্ন 1 - এউসি
বিভাগ 6.3 দুটি আরওসি বক্ররেখার জন্য পিওসি এউসির তুলনা আলোচনা করেছে (পিপি 113-114)। বিশেষ করে, আমার বোঝার যে এই দুই মডেলের হয় হয় সম্পর্কিত, তাই কিভাবে গনা সম্পর্কে তথ্য এখানে সমালোচকদের গুরুত্বপূর্ণ; অন্যথায়, আপনার পরীক্ষার পরিসংখ্যান পক্ষপাতদুষ্ট হবে কারণ এটি পারস্পরিক সম্পর্কের অবদানের জন্য অ্যাকাউন্ট করে না।r
অসামঞ্জস্যিত আরওসি কার্ভগুলির ক্ষেত্রে কোনও প্যারাম্যাট্রিক বিতরণ অনুমানের ভিত্তিতে নয়, টু এবং আত্মবিশ্বাসের ব্যবস্থাগুলির তুলনায় এউসি'র তুলনা করা পরিসংখ্যানগুলি এবং ^ এউসি 2 এর মূল্য নির্ধারণের উপর ভিত্তি করে , এবং তাদের স্ট্যান্ডার্ড বিচ্যুতি এস 1 এবং অনুমানের উপর ভিত্তি করে তৈরি করা যেতে পারে এস 2 , বিভাগে 3.5.1 হিসাবে দেওয়া হয়েছে:AUCˆ1AUCˆ2S1S2
Z=AUCˆ1−AUCˆ2S21+S22−−−−−−−√
উভয় শ্রেণিবদ্ধের জন্য একই ডেটা ব্যবহৃত হয় সেই ক্ষেত্রে এই জাতীয় পরীক্ষা করাতে আমাদের এউসি অনুমানের মধ্যে পারস্পরিক সম্পর্কের বিষয়টি গ্রহণ করতে হবে:
z=AUCˆ1−AUCˆ2S21+S22−rS1S2−−−−−−−−−−−−−√
এই পারস্পরিক সম্পর্কের অনুমান যেখানে । Hanley এবং McNeil (1983) যেমন একটি এক্সটেনশন তৈরি binormal ক্ষেত্রে তাদের বিশ্লেষণ ভিত্তিবিন্দু, কিন্তু শুধুমাত্র কিভাবে আনুমানিক পারস্পরিক সম্পর্কের সহগের নিরূপণ করা দেখানোর সময় একটি টেবিল দিলেন দ পারস্পরিক সম্পর্ক থেকে দ পি বর্গ পি তাতে থাকা দুটি ক্লাসিফায়ার, এবং এর পারস্পরিক সম্পর্ক দ N বর্গ এন তাতে থাকা দুটি ক্লাসিফায়ার এই বলে যে গাণিতিক শিক্ষাদীক্ষা অনুরোধের ভিত্তিতে উপলব্ধ ছিল। অন্যান্য বিভিন্ন লেখক (উদাঃ Zou, 2001) বাইনরমাল মডেলের উপর ভিত্তি করে পরীক্ষা তৈরি করেছেন, ধরে নিয়েছেন যে একটি উপযুক্ত রূপান্তর পাওয়া যাবে যা একই সাথে পি এবং এন ক্লাসের স্কোর বিতরণকে স্বাভাবিক রূপান্তরিত করবে।rrrPrn
দেওলং এট আল (1988) এইউসি এবং মান-হুইটনি পরীক্ষার পরিসংখ্যানের মধ্যে পরিচয়ের সুযোগ নিয়েছিলেন এবং একসাথে সেনের (1960) জেনারেলাইজড স্টাটিস্টিক তত্ত্বের ফলাফলের সাথে এটিউসগুলির মধ্যে পারস্পরিক সম্পর্কের একটি অনুমান পেতে পেরেছিলেন বাইনারাল অনুমানের উপর নির্ভর করে না। আসলে, ডিলং এট আল (1988) কে ≥ 2 শ্রেণিবদ্ধের মধ্যে তুলনার জন্য নিম্নলিখিত ফলাফলগুলি উপস্থাপন করেছে ।Uk≥2
৩.৩.১ বিভাগে, আমরা দেখিয়েছি যে অনুশীলনামূলক আরওসি বক্ররেখার অঞ্চলটি মান-হুইটনি স্ট্যাটিস্টিকের সমান এবং এটি দিয়েছিলU
যেখানেএসপিআই,আই=1,…,এনপিক্লাসপিঅবজেক্ট এবংএসএনজে,জ=1,…,এনএনএর জন্য স্কোরনমুনায়ক্লাসএনঅবজেক্টস। ধরুন আমরা আছেটক্লাসিফায়ার, স্কোর ফলনশীলগুলি দ এন ঞ ,
AUCˆ=1nNnP∑i=1nN∑j=1nP[I(sPj>sNi)+12I(sPj=sNi)]
sPi,i=1,…,nPPsNj,j=1,…,nNNk এবং s r P i , j = 1 , … , n P [আমি এই অংশে একটি সূচী ত্রুটি সংশোধন করেছি - সাইকোরাক্স], এবং ^ এ ইউ সি আর , আর = 1 , … , কে । নির্ধারণ করাsrNj,j=1…nNsrPi,j=1,…,nPAUCˆr,r=1,…,k
এবং
ভি আর 01 =1
Vr10=1nN∑j=1nN[I(srPi>srNj)+12I(srPi=srNj)],i=1,…,nP
Vr01=1nP∑i=1nP[I(srPi>srNj)+12I(srPi=srNj)],j=1,…,nN
পরবর্তী, নির্ধারণ ম্যাট্রিক্স ডব্লিউ 10 সঙ্গে ( দ , গুলি ) তম উপাদান
W দ , গুলি 10 = 1k×kW10(r,s)
এবংকে×কেম্যাট্রিক্সডব্লিউ01সঙ্গে(দ,গুলি)তম উপাদান
W R
Wr , s10= 1এনপি- 1Σi = 1এনপি[ ভিR10( গুলি)পিআমি) - এ ইউসিˆR] [ ভিগুলি10( গুলি)পিআমি) - এ ইউসিˆগুলি]
কে × কেওয়াট01( আর , এস )
তারপরে ভেক্টরের জন্য অনুমানিত কোভারিয়েন্স ম্যাট্রিক্স( ^ একজন ইউ সি 1,..., ^ একজন ইউ সি টWr , s01= 1এনএন- 1Σi = 1এনএন[ ভিR01( গুলি)এনআমি) - এ ইউসিˆR] [ ভিগুলি01( গুলি)এনআমি) - এ ইউসিˆগুলি]
বক্ররেখার অধীনে আনুমানিক অঞ্চলগুলির
ডাব্লু = 1( এ ইউসিˆ1, … , এ ইউসিˆট)উপাদানের সঙ্গেWদ,গুলি। এটি একটি একক অনুমানকৃত এউসির আনুমানিক পরিবর্তনের জন্য ফলাফলটির সাধারণীকরণ, এটি বিভাগে 3.5.1.1 এও দেওয়া হয়েছে। দুই ক্লাসিফায়ার ক্ষেত্রে, estiamted পারস্পরিক সম্পর্কদআনুমানিক AUCs মধ্যে এইভাবে দেওয়া হয়W1,2ডাব্লু = 1এনপিওয়াট10+ 1এনএনওয়াট01
Wr , sR যাউপরেরজেডেব্যবহার করা যেতে পারে।W১ , ২Wঘ , ঘW2 , 2√z- র
যেহেতু অন্য উত্তরগুলি হানলি এবং ম্যাকনিলকে এউসি বৈকল্পিকের অনুমানের জন্য এক্সপ্রেশন দেয়, তাই এখানে আমি পি থেকে দেওলং অনুমানকারী পুনরুত্পাদন করব। 68:
গুলিগুলিগুলি1 - এফ( গুলি )গুলি1 - জি ( গুলি )গুলিএনআমিগুলিপিএনআমিগুলিএনআমিvar ( গুলি)এনপিআমি)
এ ইউসিˆ
গুলি2( এ ইউসিˆ) = 1এনপিvar ( গুলি)এনপিআমি) + 1এনএনvar ( গুলি)পিএনআমি)
এফজিএফজি
জেডz- র
হাইপোথিসিস টেস্টিং কীভাবে কাজ করে এটি এটি একটি সরল, উচ্চ-স্তরের রূপরেখা:
আপনার কথায়, পরীক্ষা করা, "একটি শ্রেণিবদ্ধ অন্যের তুলনায় উল্লেখযোগ্যভাবে উন্নত কিনা" এই নাল অনুমানের পরীক্ষার জন্য পুনরায় কেন্দ্রীভূত করা যেতে পারে যে দুটি মডেলের পরিসংখ্যানটি অসম যে বিকল্প অনুমানের বিরুদ্ধে পরিসংখ্যানগতভাবে সমান এউসি রয়েছে।
এটি একটি দ্বি-পুচ্ছ পরীক্ষা।
পরীক্ষার পরিসংখ্যান যদি রেফারেন্স বিতরণের সমালোচনামূলক অঞ্চলে থাকে তবে আমরা নাল অনুমানকে প্রত্যাখ্যান করি, যা এই ক্ষেত্রে একটি সাধারণ স্ট্যান্ডার্ড বিতরণ।
αz- র> 1.96z- র< - 1.96α / 21 - α / 2
প্রশ্ন 1 - সংবেদনশীলতা এবং নির্দিষ্টতা
টি
সংবেদনশীলতা = টি পি1 - নির্দিষ্টতা = চপি= পি ( গুলি)পি> টি )= পি ( গুলি)এন> টি )
মূল স্টিকিং পয়েন্টটি যথাযথ পরীক্ষার বিকাশ করছে যে দুটি নমুনা অনুপাতের সাথে সম্পর্কযুক্ত হবে (আপনি একই পরীক্ষার ডেটাতে দুটি মডেল প্রয়োগ করেছেন)। এটি পি। 111।
টি পিচপিটি( টি পি1- টি পি2) / এস12টি পিআমিআমিগুলি212টি পি1টি পি2
টি পি1টি পি2
এন
টি পি1= টি পি2টি পি1≠ t পি2
মডেল 2 টি তে ইতিবাচক মডেল 2 টি তে নেতিবাচক মডেল 1 টি তে ইতিবাচক একটিগমডেল 1 টি তে নেতিবাচক খঘ
একটিখগঘ= ∑i = 1এনপিআমি( গুলি)1পিআমি> টি ) ⋅ আমি( গুলি)2পিআমি> টি )= ∑i = 1এনপিআমি( গুলি)1পিআমি≤ t ) ⋅ আই( গুলি)2পিআমি> টি )= ∑i = 1এনপিআমি( গুলি)1পিআমি> টি ) ⋅ আমি( গুলি)2পিআমি≤ টি )= ∑i = 1এনপিআমি( গুলি)1পিআমি≤ t ) ⋅ আই( গুলি)2পিআমি≤ টি )
এম= ( খ - গ )2খ + গ
χ21α = 95 %এম> 3.841459
গুলিRপিআমিগুলিRএনঞ
প্রশ্ন 2
দেখে মনে হচ্ছে যে প্রতিটি প্রতিবেদকের জন্য পূর্বাভাসের মানগুলি গড় করে ফলাফলগুলি মার্জ করার পক্ষে যথেষ্ট, যাতে প্রতিটি মডেলের জন্য আপনার 100 গড় পূর্বাভাসিত মানের 1 ভেক্টর রয়েছে। তারপরে যথারীতি আরওসি এউসি, সংবেদনশীলতা এবং নির্দিষ্টকরণের পরিসংখ্যানগুলি গণনা করুন যেন মূল মডেলগুলির অস্তিত্ব নেই। এটি এমন একটি মডেলিং কৌশল প্রতিফলিত করে যা 5 জন উত্তরদাতাদের প্রত্যেককেই মডেলগুলির একটি "কমিটি" হিসাবে বিবেচনা করে, বাছাইয়ের মতো সাজায় each