আর-তে কীভাবে আরওসির আওতাধীন অঞ্চলের জন্য পি-মান গণনা করা যায়


12

আমি রিসিভার অপারেটর বৈশিষ্ট্যযুক্ত (আরওসি) এর আওতাধীন অঞ্চলের জন্য পি-মানটি গণনা করার উপায় খুঁজে বের করার জন্য সংগ্রাম করছি। আমার একটানা পরিবর্তনশীল এবং ডায়াগনস্টিক পরীক্ষার ফলাফল রয়েছে। আমি দেখতে চাই যে AUROC পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ কিনা।

আমি আরওসি বক্ররেখার সাথে লেনদেনকারী অনেকগুলি প্যাকেজ পেয়েছি: পিআরওসি, আরআরসিআর, ক্যাটুলস, যাচাইকরণ, এপিআই। তবে ডকুমেন্টেশন এবং পরীক্ষাটি পড়তে অনেক ঘন্টা ব্যয় করার পরেও কীভাবে খুঁজে পেলাম না। আমি মনে করি আমি এটিকে কেবল মিস করেছি।


1
বক্ররেখার ক্ষেত্রফলটি 'তাৎপর্যপূর্ণ' হওয়ার সম্ভবত এটির অর্থ কী হতে পারে?
গুং - মনিকা পুনরায়


আপনার আরওসি বক্ররেখাটি কী থেকে এসেছে? সম্ভবত আপনি এটির একটি পরীক্ষা চান (উদাহরণস্বরূপ, সামগ্রিকভাবে নেওয়া লজিস্টিক রিগ্রেশন মডেলের একটি পি-মান রয়েছে)।
গুং - মনিকা পুনরায়

ঠিক আছে, আমার ডেটা নীচের মত, আমার একটি স্ট্যান্ডার্ড টেস্ট রয়েছে যা রোগের সাথে / ছাড়াই দলবদ্ধ করে তোলে এবং আমি রক্তের নমুনা থেকে জৈবিক সংকল্পের জন্য একটি কাট-অফ মান খুঁজে পেতে চাই। এর পাশাপাশি আমার বক্ররেখার নিচে অঞ্চলটি প্রয়োজন। সুতরাং না, আমার কোনও রিগ্রেশন মডেল নেই
ব্যবহারকারীর 2530

সুতরাং আপনার কিছু পরীক্ষা আছে যা রোগীর কাছ থেকে নেওয়া রক্তের নমুনার উপর পরীক্ষা করা হয়, যা আপনাকে একটি সংখ্যা দেয়; এবং যদি রোগীর কোনও রোগ থাকে তবে আপনি এই নম্বরটি শ্রেণিবদ্ধ করতে ব্যবহার করতে চাইবেন। বর্তমানে এই পরীক্ষা থেকে শুরু করে আপনার কাছে রোগীদের একটি সেট রয়েছে যেখানে আপনি তাদের সত্যিকারের রোগের অবস্থা জানেন set সব কি ঠিক আছে?
গুং - মনিকা পুনরায়

উত্তর:


12

আপনার পরিস্থিতিতে একটি আরওসি বক্ররেখা প্লট করা ভাল হবে, এবং সেই বক্ররেখার অধীনে অঞ্চলটি গণনা করা উচিত, তবে এটি প্রাথমিক বিশ্লেষণের চেয়ে আপনার মূল বিশ্লেষণের পরিপূরক হিসাবে বিবেচনা করা উচিত । পরিবর্তে, আপনি একটি লজিস্টিক রিগ্রেশন মডেল ফিট করতে চান ।

লজিস্টিক রিগ্রেশন মডেলটি পুরো মডেলটির একটি পরীক্ষার সাথে স্ট্যান্ডার্ড আসবে। (আসলে, যেহেতু আপনার কেবলমাত্র একটি ভেরিয়েবল রয়েছে, সেই পি-মানটি আপনার পরীক্ষার ফলাফলের ভেরিয়েবলের পি-মানের সমান হবে)) সেই পি-মানটি আপনার পরে রয়েছে। মডেল আপনাকে কোনও রোগাক্রান্ত পর্যবেক্ষণের পূর্বাভাসের সম্ভাবনা গণনা করার অনুমতি দেবে। কোনও রিসিভার অপারেটিং বৈশিষ্ট্য আপনাকে জানায় যে সংবেদনশীলতা এবং নির্দিষ্টতা কীভাবে বাণিজ্য করবে, যদি আপনি পূর্বাভাসের সম্ভাবনাটিকে ভবিষ্যদ্বাণীযুক্ত শ্রেণিবিন্যাসে রূপান্তরিত করতে বিভিন্ন থ্রেশহোল্ড ব্যবহার করেন। যেহেতু পূর্বাভাসপ্রাপ্ত সম্ভাবনাটি আপনার পরীক্ষার ফলাফলের পরিবর্তনশীল একটি ফাংশন হবে তাই এটি আপনাকে বলছে যে আপনি যদি বিভিন্ন পরীক্ষার ফলাফলের মানগুলি আপনার প্রান্তিক হিসাবে ব্যবহার করেন তবে তারা কীভাবে বাণিজ্য করে।


আপনি যদি লজিস্টিক রিগ্রেশন সম্পর্কে ভয়ঙ্করভাবে পরিচিত না হন তবে ইন্টারনেটে কিছু সংস্থান আছে (উপরে উইকিপিডিয়া পৃষ্ঠা ছাড়াও):


এটা ছিল খুব আলোকিত। ধন্যবাদ! সুতরাং আমি একটি লজিস্টিক মডেল গ্ল্ম বাইনোমিয়াল (লগইট) ফিট করি। তারপরে আমি এটিকে একটি নাল মডেলের সাথে তুলনা করি এবং সেই পরীক্ষাটি আমাকে যে পি মানটি সন্ধান করছি তা দেয়?
ব্যবহারকারী32530

হ্যাঁ, এটি আপনার পক্ষে করা উচিত। এলআর অন্যান্য অনেকগুলি জিনিসও সম্ভব করে তুলবে, তবে এটি আপনার প্রয়োজন হতে পারে।
গুং - মনিকা পুনরায়

কোড নীচের মত হবে? GLM.1 <- গ্ল্যাম (গোষ্ঠী ~ ধারাবাহিকবার, পরিবার = দ্বিপদী (লগইট), তথ্য = ডায়াগনস্টিক ডেটা) সারাংশ (জিএলএম .১) জিএলএম ২ <- গ্ল্যাম (গ্রুপ ~ 1, পরিবার = দ্বিপদী (লগিট), তথ্য = ডায়াগনস্টিক ডেটা) আনোভা (জিএলএম ২, জিএলএম .১, পরীক্ষা = "চিস্ক")
ব্যবহারকারীর 2525

summary(GLM.1)আপনার যা প্রয়োজন তা আপনাকে দেওয়া উচিত, এবং আমি মনে করি anova(GLM.1)এটি নাল মডেল ডাব্লু / ও এর বিরুদ্ধে এটি পরীক্ষা করবে আপনার আসলে এটি ঠিকভাবে ফিট করার জন্য। তবে আপনার উপায় অবশ্যই কাজ করবে, হ্যাঁ।
গুং - মনিকা পুনরায়

9

মূলত আপনি H0 = "এওসি সমান 0.5 এর সমান" পরীক্ষা করতে চান।

এটি আসলে এইচ 0 বলার সমতুল্য "" দুটি গ্রুপে র‌্যাঙ্কগুলির বিতরণ সমান "।

পরেরটি হ'ল মান-হুইটনি (উইলকক্সন) পরীক্ষার নাল কল্পনা (উদাহরণ স্বর্ণ, ১৯৯৯ দেখুন )।

অন্য কথায়, আপনি আপনার প্রশ্নের উত্তর দেওয়ার জন্য মান-হুইটনি-উইলকক্সন পরীক্ষাটি নিরাপদে ব্যবহার করতে পারেন (উদাহরণস্বরূপ ম্যাসন এবং গ্রাহাম, 2002 )। ফ্রাঙ্ক ডারনকোর্ট দ্বারা উল্লিখিত যাচাইকরণ প্যাকেজটি ঠিক এটিই করে।


ভবিষ্যদ্বাণীগুলি এলোমেলো নয় তা দেখাতে কেন আগ্রহ হবে? যা দরকারীতা মূল্যায়ন করে না।
ফ্রাঙ্ক হ্যারেল 31'14

1
@ ফ্র্যাঙ্কহারেল কারণ অনেক ক্ষেত্রে আপনার ভবিষ্যদ্বাণীগুলি এলোমেলো চেয়ে ভাল নাও হতে পারে - এক্ষেত্রে আপনার প্রতিবেদন করা কার্যকরীতাটি শূন্য। অবশ্যই, কার্যকারিতা ব্যবস্থার (সংবেদনশীলতা এবং নির্দিষ্টতা) একটি আত্মবিশ্বাসের ব্যবধানের প্রতিবেদন করা আরও দরকারী হবে be তবে ক্লিনিকাল সাহিত্যে কমপক্ষে দুটি দলের মধ্যে পার্থক্য পরীক্ষা করা সাধারণ বিষয় (এবং বাস্তবে সেখানে গ্রুপগুলি প্রায়শই পৃথক হয় না) এবং আমি পর্যালোচকদের এটির জন্য বিশেষভাবে জিজ্ঞাসা করতে দেখেছি।
ক্যালিমো

এটি আইএমএইচও-তে সামান্য ধারণা দেয়। আমি জানতে চাই যে কোনও জিনিস কতটা কার্যকর, এটি কেবল একটি মুদ্রা উল্টানোর চেয়ে ভাল কিনা।
ফ্র্যাঙ্ক হ্যারেল

যদি এটি একটি মুদ্রা উল্টানোর চেয়ে ভাল না হয় তবে আপনি কেন সেই সমস্ত কাজটি চালিয়ে যাবেন? শুধু মুদ্রা উল্টানো।
স্কট

4

আপনি প্যাকেজ যাচাইকরণ থেকে roc.area () ব্যবহার করতে পারেন :

install.packages("verification")
library("verification")

# Data used from Mason and Graham (2002).
a<- c(1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990,
 1991, 1992, 1993, 1994, 1995)
d<- c(.928,.576, .008, .944, .832, .816, .136, .584, .032, .016, .28, .024, 0, .984, .952)

A<- data.frame(a,d)
names(A)<- c("year", "p2")

# For model without ties
roc.area(A$event, A$p2)

এটি ফিরে আসবে $p.value [1] 0.0069930071


আপনাকে অনেক ধন্যবাদ, তবে আমার কোনও সি এবং ডি মান নেই। আমার একটি স্ট্যান্ডার্ড টেস্ট রয়েছে যা রোগের সাথে / ছাড়াই গোষ্ঠীভুক্ত করে তোলে এবং আমি রক্তের নমুনা থেকে জৈবিক সংকল্পের জন্য একটি কাট-অফ মান খুঁজে পেতে চাই। এর পাশাপাশি আমার বক্ররেখার নিচে অঞ্চলটি প্রয়োজন। সুতরাং না, আমার কোনও প্রতিরোধ নেই। আমার সবচেয়ে স্ট্যান্ডেস্ট বাইনারি ভেরিয়েবল এবং জৈবিক
মূল্যায়ন

ওহ ঠিক আছে আমি ভেবেছিলাম আপনার কাছে আছে, যেমন আমি ধরে নিয়েছিলাম আপনার ইতিমধ্যে একটি আরওসি বক্ররেখা আছে।
ফ্রাঙ্ক ডারননকোর্ট

3
সাধারণত রোগের সম্ভাবনার সাথে সত্যিকারের সম্পর্কটি মসৃণ হলে একটি স্বেচ্ছাসেবী কাট অফের সন্ধান করা ভুল। এছাড়াও, নাল অনুমানটি পরীক্ষা করা যে আরওসি অঞ্চলটি 0.5 টি একটি বেশ বিরক্তিকর অনুমান। বেশিরভাগ ভবিষ্যদ্বাণীগুলির জন্য আপনি ভবিষ্যদ্বাণীটি এলোমেলো কিনা তা কতটা ভাল তা যত্নবান হন care
ফ্র্যাঙ্ক হ্যারেল

কোনও সমস্যা নেই, এবং আপনাকে ধন্যবাদ, ফ্র্যাঙ্ক ডেমোনকোর্ট, সম্ভবত ডি করার কোনও উপায় আছে।
ব্যবহারকারী32530

চিকিত্সা ক্ষেত্রে কখনও কখনও তাদের ডায়াগনোস্ট টেস্টগুলি তৈরি করার জন্য সেই কাটফ পয়েন্টের প্রয়োজন হয়। তাদের সাথে তারা বিষয়টি অসুস্থ কিনা তা খুঁজে পেতে চান, কোনও কিছুর পূর্বাভাস না দেওয়ার জন্য। কখনও কখনও তাদের রোগের স্থিতি সনাক্ত করতে সস্তা সংকল্পের সাথে ব্যয়গুলি হ্রাস করতে হবে cut
ব্যবহারকারী32530

0

দুটি আরওসি বক্ররেখা ব্যবহার করে পিআরওসি ব্যবহার করে তুলনা করা যেতে পারে roc.test()। এটি একটি পি-মান উত্পাদন করে। উপরন্তু, ব্যবহার roc(..., auc=TRUE, ci=TRUE)আপনি AUC সহ নিম্ন ও উচ্চ আস্থা অন্তর আউটপুটে আরওসি বস্তু, যার দরকারী হতে পারে তৈরি করার সময় দিতে হবে।

নীচে উদাহরণস্বরূপ কোডটি কাজ করছে যা পরীক্ষা করে যে প্রতি গ্যালন প্রতি মাইল বা গাড়ির ওজন এটির (স্বয়ংক্রিয় বা ম্যানুয়াল) সজ্জিত আসে এমন প্রকারের সংক্রমণের চেয়ে আরও ভাল পূর্বাভাসক কিনা:

library(pROC)
roc_object_1 <- roc(mtcars$am, mtcars$mpg, auc=T, ci=T) #gives AUC and CI
roc_object_2 <- roc(mtcars$am, mtcars$wt, auc=T, ci=T) #gives AUC and CI

roc.test(roc_object_1, roc_object_2) #gives p-value

ওজন জ্বালানী খরচ তুলনায় একটি উল্লেখযোগ্যভাবে ভাল পূর্বাভাসক, এটি বলে মনে হয়। যাইহোক, এটি দুটি বক্ররেখার সাথে তুলনা করছে এবং 0.5 এর মতো সংখ্যার বিরুদ্ধে একটি বক্ররেখা নয়। আত্মবিশ্বাসের ব্যবধানের দিকে তাকানোর জন্য এটিতে 0.5 নম্বর রয়েছে কিনা তা আমাদের উল্লেখ করে যে এটি উল্লেখযোগ্যভাবে আলাদা কিনা, তবে এটি কোনও পি-মান তৈরি করে না।


এটি পি-মান প্রদান করে?
মাইকেল আর। চেরনিক

যদিও প্রশ্নটি বিশেষত আর এর শর্তে জিজ্ঞাসা করা হয়েছে, আমাদের সাধারণ নীতিটি হ'ল আমরা একটি পরিসংখ্যান (মেশিন লার্নিং, ইত্যাদি) প্রশ্নোত্তর সাইট। সুতরাং, কোনও কিউয়ের পক্ষে পরিসংখ্যানগত বিষয়বস্তু থাকা প্রয়োজন, এবং এটি দৃ software়ভাবে পছন্দ করা হয় যে কেবল সফটওয়্যার নির্দিষ্ট শর্তাদি সরবরাহ করা হয় না। এর আলোকে, আপনি এই পরীক্ষাটি কী এবং এটি কীভাবে কাজ করে সে সম্পর্কে আরও বলতে পারেন, এটি আর এর মধ্যে রয়েছে এবং এটির জন্য আর কোডটি প্রদর্শন করে কেবল তা উল্লেখ করা ছাড়াও?
গুং - মনিকা

ঠিক আছে, আমি কিছু পরিসংখ্যানের পটভূমি প্রতিফলিত করতে আমার উত্তর আপডেট করব
naco
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.