আরওসি এবং মাল্টিআরসি বিশ্লেষণ: কীভাবে অনুকূল কাটপয়েন্ট গণনা করবেন?


14

আমি কীভাবে একটি আরওসি বক্ররেখা (সংবেদনশীলতা এবং নির্দিষ্টতা সর্বাধিকীকরণ করা হয়েছে এমন মান) এর জন্য অনুকূল কাট-পয়েন্ট গণনা করব তা বোঝার চেষ্টা করছি। আমি aSAHপ্যাকেজ থেকে ডেটাসেট ব্যবহার করছি pROC

outcomeপরিবর্তনশীল দুটি স্বাধীন ভেরিয়েবল দ্বারা ব্যাখ্যা করা যেতে পারে: s100bএবং ndkaEpiপ্যাকেজের সিনট্যাক্স ব্যবহার করে আমি দুটি মডেল তৈরি করেছি:

library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)

নিম্নলিখিত দুটি গ্রাফে আউটপুট চিত্রিত:

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

প্রথম গ্রাফ ( s100b) এ, ফাংশনটি বলে যে অনুকূল কাট-পয়েন্টটি সংশ্লিষ্ট মানটিতে স্থানীয়করণ করা হয় lr.eta=0.304। দ্বিতীয় গ্রাফে ( ndka) সর্বোত্তম কাট-পয়েন্টটি স্থানীয় মানের lr.eta=0.335(যার অর্থ কী lr.eta) এর সাথে সম্পর্কিত মানের হয় ized আমার প্রথম প্রশ্নটি হ'ল:

  • কি সংশ্লিষ্ট s100bএবং ndkaমান lr.etaমান উল্লিখিত (পরিপ্রেক্ষিতে অনুকূল কাটা দফা কি s100bএবং ndka)?

দ্বিতীয় প্রশ্ন:

এখন ধরুন আমি ভেরিয়েবল উভয়ই বিবেচনায় নিয়ে একটি মডেল তৈরি করেছি:

ROC(form=outcome~ndka+s100b, data=aSAH)

প্রাপ্ত গ্রাফটি হ'ল:

এখানে চিত্র বর্ণনা লিখুন

আমি জানতে চাই কি মান চান ndkaএবং s100bএ যা সংবেদনশীলতা এবং বিশেষত্বের ফাংশন দ্বারা বড় করা হয়। অন্যান্য পদ ইন: মান কি ndkaএবং s100bযা আমরা Se থেকে = 68,3% ও পুলিশ সুপার = 76,4% (গ্রাফ থেকে প্রাপ্ত মান) আছে?

আমি মনে করি এই দ্বিতীয় প্রশ্নটি মাল্টিআরসি বিশ্লেষণের সাথে সম্পর্কিত, তবে Epiপ্যাকেজের ডকুমেন্টেশনটি কীভাবে মডেলটিতে ব্যবহৃত উভয় ভেরিয়েবলের জন্য অনুকূল কাটপয়েন্ট গণনা করবেন তা ব্যাখ্যা করে না ।

আমার প্রশ্নটি রিসার্চগেটের এই প্রশ্নের সাথে খুব মিলে যায় , যা সংক্ষেপে বলে:

সংবেদনশীলতা এবং একটি পরিমাপের নির্দিষ্টতার মধ্যে একটি আরও ভাল বাণিজ্য-অফ প্রতিনিধিত্বকারী কাট-অফ স্কোরের সংকল্পটি সহজ। তবে মাল্টিভারিয়েট আরওসি বক্ররেখা বিশ্লেষণের জন্য, আমি উল্লেখ করেছি যে বেশিরভাগ গবেষকই এউসির শর্তে বেশ কয়েকটি সূচক (পরিবর্তনশীল) এর রৈখিক সংমিশ্রণের সামগ্রিক যথার্থতা নির্ধারণের জন্য অ্যালগরিদমে মনোনিবেশ করেছেন। [...]

তবে, এই পদ্ধতিগুলি কীভাবে একাধিক সূচকগুলির সাথে সম্পর্কিত কাট-অফ স্কোরগুলির সংমিশ্রণটি কীভাবে সেরা ডায়াগনস্টিক নির্ভুলতা দেয় তার সিদ্ধান্ত নিতে পারে তা উল্লেখ করে না।

একটি সম্ভাব্য সমাধান হ'ল শুল্টজ তার কাগজে প্রস্তাবিত , তবে এই নিবন্ধ থেকে আমি বুঝতে পারছি না যে কীভাবে একটি মাল্টিভারিয়েট আরওসি বক্ররেখার জন্য অনুকূল কাটপয়েন্ট গণনা করা যায়।

হতে পারে Epiপ্যাকেজ থেকে সমাধানটি আদর্শ নয়, তাই অন্য কোনও সহায়ক লিঙ্কের প্রশংসা করা হবে।

উত্তর:


9

ফ্র্যাঙ্ক হ্যারেলের জবাবটি বিশদভাবে জানাতে, Epiপ্যাকেজটি কী করেছিল তা ছিল একটি লজিস্টিক রিগ্রেশন ফিট করার জন্য, এবং নিম্নলিখিত ফর্মের ফলাফল পূর্বাভাস সহ একটি আরওসি বক্ররেখা তৈরি করা:

outcome=11+e(β0+β1s100b+β2ndka)

আপনার ক্ষেত্রে, লাগানো মানগুলি (ইন্টারসেপ্ট) = -2.379, (এস বি) = 5.334 এবং (এনডকা) = 0.031। আপনি যেমন চান যে আপনার পূর্বাভাসের ফলাফলটি 0.312 ("অনুকূল" কাট অফ) হতে পারে, আপনি তারপরে এটি বিকল্প হিসাবে নিতে পারেন (আশা করি আমি এখানে ত্রুটিগুলি প্রবর্তন করিনি):β0β1β2

0.312=11+e(2.379+5.334s100b+0.031ndka)
1.588214=5.334s100b+0.031ndka
বা:
s100b=1.5882140.031ndka5.334

(S100b, ndka) মানগুলির যে কোনও জোড়া যা এই সাম্যকে সন্তুষ্ট করে তা হ'ল "অনুকূল"। আপনার জন্য দুর্ভাগ্য, এই জোড়গুলির একটি অনন্ত রয়েছে। উদাহরণস্বরূপ, (০.২৯, ১), (০, ৫১.২) ইত্যাদি আরও খারাপ যে তাদের বেশিরভাগই কোনও ধারণা রাখে না। জুটি (-580, 10000) বলতে কী বোঝায়? কোনো কিছুই নেই!

অন্য কথায়, আপনি ইনপুটগুলিতে কাট-অফগুলি স্থাপন করতে পারবেন না - আপনাকে এটি আউটপুটগুলিতে করতে হবে, এবং এটি মডেলের পুরো বিষয়।


8

ইনপুট ভেরিয়েবলগুলিতে কাট অফগুলি সন্ধান করা উপযুক্ত নয়, তবে কেবলমাত্র আউটপুট (উদাহরণস্বরূপ, মাল্টিভারেবল মডেল থেকে ভবিষ্যদ্বাণী করা ঝুঁকি)। এটি কারণ যে এক্স 1 এর কাট অফটি এক্স 2 এর অবিচ্ছিন্ন মানের উপর নির্ভর করবে। এবং সর্বোত্তম সিদ্ধান্ত গ্রহণের জন্য on এর একটি কাটপয়েন্ট চাইলে একটি ইউটিলিটি / ক্ষতি / ব্যয় ক্রিয়াকলাপ প্রয়োজন এবং এটি আরওসি বক্ররেখার সাথে কোন যোগসূত্র নেই।Y^


আপনার ব্যাখ্যা করা সমস্যাটি আমি বুঝতে পারি। আমি ভাবছি, উপায় দ্বারা, যদি কোনও নির্দিষ্ট স্থিতি (রোগ / ফলাফল / ইত্যাদি) সনাক্তকরণের সেন্স এবং স্পেস বাড়ানোর জন্য সমান্তরালভাবে দুটি (বা আরও) পরীক্ষার জন্য কাট-অফ পয়েন্টগুলি গণনা করার কোনও পদ্ধতি থাকে তবে? )। আগাম ধন্যবাদ.
টমমসো

1
যেহেতু এক্স 1 এর জন্য "সর্বোত্তম" কাটপয়েন্টটি এক্স 2 এর অবিচ্ছিন্ন মানের উপর নির্ভর করবে, এবং এক্স 2 এর জন্য "সর্বোত্তম" কাটপয়েন্টটি এক্স 1 এর অবিচ্ছিন্ন মানের উপর নির্ভর করবে, তাই এটি করার কোনও উপায় নেই এবং এটিকে না করে দেওয়ার জন্য পর্যাপ্ত তথ্য সংরক্ষণ করার উপায় নেই বিপর্যয়.
ফ্র্যাঙ্ক হ্যারেল

সুতরাং সংবেদনশীলতা এবং সুনির্দিষ্টতা সর্বাধিক করার জন্য দুই বা ততোধিক পরীক্ষার জন্য কাট-অফ পয়েন্টগুলি খুঁজে পাওয়ার কোনও উপায় নেই? অবশ্যই একটি পদ্ধতি যা কোনও মাল্টিআরসি বিশ্লেষণ নয়। আবার ধন্যবাদ.
টমমসো

2
ইনপুটগুলিতে কাট অফগুলি নেওয়া কেবল উপযুক্ত নয়। সর্বোত্তম সিদ্ধান্তগুলি কোনও কাটঅফ ব্যবহার করে নেওয়া হয় না, বা সিদ্ধান্তের আগে প্রয়োজনের পূর্বে পূর্বাভাসের সম্ভাবনাগুলিতে কাট অফ করে। পূর্বাভাসযুক্ত ঝুঁকির উপর সর্বোত্তম কাট অফের জন্য সমাধানের জন্য ইউটিলিটিগুলি (ক্ষতি / ব্যয়) প্রয়োজন are
ফ্র্যাঙ্ক হ্যারেল

1
এই লক্ষ্য পূরণের সাথে আরওসি বক্ররেখার কিছুই করার নেই। এটি করার জন্য আপনাকে এসসিআরকে ফলাফলের সাথে সম্পর্কিত করতে হবে বা সাধারণ জনগণের তুলনায় কেবলমাত্র চরম এসসিআর পাওয়ার সম্ভাবনা গণনা করতে হবে।
ফ্র্যাঙ্ক হ্যারেল

3

আমি অনুমান করব lr.etaযে লাগানো মডেল থেকে লিনিয়ার প্রেডিক্টর — লগইট as, যেমন এটির জন্য সাধারণত ব্যবহৃত প্রতীক; বা, যদি না হয় তবে লাগানো মডেল থেকে সম্ভাবনা। (এটি পরেরটি দেখাবে: /programming//a/38532555/1864816 দেখুন )) আপনি কোডটি চেক করতে পারেন । যে কোনও ক্ষেত্রে আপনি যে কোনও সংখ্যক ভবিষ্যদ্বাণীকের জন্য মডেল সহগ থেকে এটি গণনা করতে সক্ষম হবেন। (দ্রষ্টব্য যে এটি প্রতিটি পূর্বাভাসীর পৃথক পৃথকভাবে কাট-অফ হবে না, তবে সমস্ত ভবিষ্যদ্বাণীকের কাজ))ηROC

আপনার প্রথম বাক্যে বলা উচিত (গ্রাফগুলির দ্বারা প্রমাণিত) আপনি সংবেদনশীলতা এবং নির্দিষ্টতার যোগফলকে সর্বাধিক যেখানে সন্ধান করছেন where তবে কেন এই "অনুকূল"? একটি মিথ্যা ধনাত্মক ফলাফলের মতো কী মিথ্যা নেতিবাচক ফলাফলের মতো একই আমদানি রয়েছে? এখানে দেখুন ।


এটি সঠিক ছিল, আমি লাগানো মডেল (একটি স্বতন্ত্র ভেরিয়েবলের জন্য) থেকে কাট-অফ পয়েন্ট গণনা করতে পারি, বা বিকল্পভাবে প্যাকেজটি coordsথেকে ফাংশনটি ব্যবহার করতে pROCপারি, কারণ আমি পরে পেয়েছি। আমার ক্ষেত্রে সর্বোত্তম কাট-অফ পয়েন্টটি ছিল সেন্স এবং স্পেকের সর্বোত্তম সমন্বয়; আমি লিঙ্কযুক্ত উত্তরটি পড়েছি, তবে মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক ফলাফলগুলি সম্পর্কে আমি (কমপক্ষে আপাতত) পাত্তা দিই না, কারণ (যদি আমি ভাল করে বুঝতে পারি) তবে আমি গবেষণার জন্য সংগৃহীত ডেটার একটি গ্রুপ বিশ্লেষণ করছি।
টমমসো

কি কি তোমরা চিন্তা করেন? কাট-অফ দিয়ে আপনি কী করছেন যার পরিণতির কোনও বিবেচনার প্রয়োজন নেই? এবং তারপর কি এটা 'অনুকূল' বা 'শ্রেষ্ঠ' হল জন্য ?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

টমাসো "অনুকূল "টিকে" সংবেদনশীলতা এবং নির্দিষ্টতা সর্বাধিকীকরণ করা মান "(প্রশ্নের প্রথম বাক্যটি উদ্ধৃত করে) হিসাবে সংজ্ঞায়িত করেছেন, স্পষ্টভাবে অর্থ সর্বোচ্চ (সংবেদনশীলতা + নির্দিষ্টতা) meaning এটি বোধগম্য হোক বা না হোক (এবং যখন পড়ি তখন সে যত্ন করে না, আমি ভাবতে আগ্রহী না যে এটি নেই) অন্য একটি প্রশ্ন।
ক্যালিমো

1
এই পদ্ধতির সিদ্ধান্ত গ্রহণের সাথে মতবিরোধ রয়েছে।
ফ্র্যাঙ্ক হ্যারেল

1
আমি মনে করি যে আমি যদি আপনার পোস্টটি সঠিকভাবে পড়ছি তবে আপনি যে দ্বিতীয় বিকল্পটি উল্লেখ করেছেন ঠিক এটি lr.etaহ'ল : লাগানো মডেলের সম্ভাব্যতা: । আপনার যদি এক মিনিট সময় থাকে তবে এটি পরীক্ষা করে দেখুনE[Yi|Xi]=11+e(β0+β1×s100b)
আন্তনি পরল্লদা

0

সত্যিকারের ধনাত্মক হার (টিআরপি) সত্য negativeণাত্মক হারকে (টিএনআর) ছেদ করে এমন প্রান্তিকের সন্ধান করতে পারবেন এটি সেই বিন্দুতে যেখানে মিথ্যা ধনাত্মক এবং মিথ্যা নেগেটিভের যোগফল সর্বনিম্ন।


একটি বাক্য উত্তর সাধারণত আমাদের ফর্ম্যাট জন্য সামান্য সংক্ষিপ্ত হিসাবে বিবেচিত হয়। আপনি কীভাবে জানেন যে ন্যূনতম কোথায় থাকতে হবে তার সংক্ষিপ্ত বিবরণ অন্তর্ভুক্ত করার জন্য আপনি নিজের উত্তরটি প্রসারিত করতে পারেন?
গ্লেন_বি -রিনস্টেট মনিকা

1
এই জাতীয় কৌশলটি সর্বোত্তম সিদ্ধান্ত নেওয়ার মুখে উড়ে যায়।
ফ্র্যাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.