কোনও অর্ডিনাল লজিস্টিক রিগ্রেশন মডেল প্রদত্ত প্রতিক্রিয়া বিভাগটি কীভাবে আপনি পূর্বাভাস করবেন?

আমি একটি স্বাস্থ্য সমস্যার পূর্বাভাস দিতে চাই। আমার কাছে 3 ফলাফল বিভাগ রয়েছে যা অর্ডার করা হয়: 'সাধারণ', 'হালকা' এবং 'গুরুতর'। আমি দুটি পূর্বাভাসকারী ভেরিয়েবল, একটি পরীক্ষার ফলাফল (একটি অবিচ্ছিন্ন, অন্তরবৃত্তাকার covariate) এবং এই সমস্যাটির সাথে পারিবারিক ইতিহাস (হ্যাঁ বা না) থেকে ভবিষ্যদ্বাণী করতে চাই। আমার নমুনায়, সম্ভাবনাগুলি 55% (স্বাভাবিক), 35% (মৃদু) এবং 10% (গুরুতর)। এই অর্থে, আমি সবসময় কেবলমাত্র 'সাধারণ' ভবিষ্যদ্বাণী করতে পারি এবং সময়টির 55% সঠিক হতে পারি, যদিও এটি আমাকে ব্যক্তিগত রোগীদের সম্পর্কে কোনও তথ্য দেয় না। আমি নিম্নলিখিত মডেল ফিট:

\begin{aligned} the cut point for \hat{(y \geq 1)} & = - 2.18 \\ the cut point for \hat{(y \geq 2)} & = - 4.27 \\ {\hat{β}}_{t e s t} & = 0.60 \\ {\hat{β}}_{f a m i l y h i s t o r y} & = 1.05 \end{aligned}

$\begin{align} \text{the cut point for }\widehat{(y \ge 1)} &= -2.18 \\ \text{the cut point for }\widehat{(y \ge 2)} &= -4.27 \\ \hat\beta_{\rm test} &= 0.60 \\ \hat\beta_{\rm family\ history} &= 1.05 \end{align}$

ধরে নিন যে কোনও মিথস্ক্রিয়া নেই এবং মডেলটির সাথে সবকিছু ঠিক আছে। সম্মতি, সি, 60০.৫%, যা আমি মডেলটির সর্বাধিক ভবিষ্যদ্বাণীমূলক নির্ভুলতা হিসাবে বুঝতে পারি।

আমি নিম্নলিখিত তথ্য সহ দুটি নতুন রোগী দেখতে পেলাম: 1. পরীক্ষা = 3.26, পরিবার = 0; ২. পরীক্ষা = ২.৮৫, পরিবার = ১। আমি তাদের পূর্বসূরীর পূর্বাভাস দিতে চাই। সূত্রটি ব্যবহার করে: (এবং তারপর ক্রমসঞ্চিত সম্ভাব্যতা মধ্যে পার্থক্য করার), আমি সাড়া বিভাগ মডেলের উপর শর্তাধীন উপর সম্ভাব্যতা বিতরণের নিরূপণ করতে পারেন। আর কোড (এনবি, রাউন্ডিং ইস্যুগুলির কারণে, আউটপুট পুরোপুরি মেলে না):

\frac{\exp (- X β - c u t P o i n t)}{(1 + \exp (- X β - c u t P o i n t))}

$\frac{\exp(-X\beta - {\rm cutPoint})}{(1+\exp(-X\beta - {\rm cutPoint}))}$

cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X    <- rbind(c(3.26, 0), c(2.85, 1))

pred_cat1      <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3      <- 1-pred_cat2.temp
pred_cat2      <- pred_cat2.temp-pred_cat1

predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)

যথা: 1. 0 = 55.1%, 1 = 35.8%, 2 = 9.1%; এবং 2. 0 = 35.6%, 1 = 46.2%, 2 = 18.2%। আমার প্রশ্ন হ'ল আমি কীভাবে সম্ভাব্যতা বিতরণ থেকে ভবিষ্যদ্বাণী করা প্রতিক্রিয়া বিভাগে যাব?

আমি নমুনা তথ্য ব্যবহার করে বেশ কয়েকটি সম্ভাবনার চেষ্টা করেছি, যেখানে ফলাফলটি জানা যায়। যদি আমি সর্বাধিক (সম্ভাব্যতাগুলি) বাছাই করি তবে নির্ভুলতা 57% হয়, শূন্যের তুলনায় সামান্য উন্নতি, তবে একত্রীকরণের নীচে। তদুপরি, নমুনায়, এই পদ্ধতির কখনও 'গুরুতর' বাছাই করে না, যা আমি সত্যিই জানতে চাই। নাল এবং মডেল সম্ভাব্যতাগুলিকে প্রতিকূলতার মধ্যে রূপান্তর করে এবং তারপরে সর্বাধিক (বিজোড় অনুপাত) বাছাই করে আমি একটি বয়েশিয়ান পদ্ধতির চেষ্টা করেছি। এটি মাঝেমধ্যে 'গুরুতর' বাছাই করে তবে আরও খারাপ নির্ভুলতা 49.5% দেয়। আমি সম্ভাব্যতা এবং বৃত্তাকার দ্বারা ভারিত বিভাগগুলির একটি সংখ্যার চেষ্টাও করেছি। এটি আবার কখনও 'গুরুতর' বাছাই করে না এবং এর যথাযথতাও কম থাকে ৫১.৫%।

সমীকরণটি কী যা উপরের তথ্য গ্রহণ করে এবং সর্বোত্তম নির্ভুলতা (60.5%) দেয়?

logistic ordered-logit

— gung - মনিকা পুনরায় স্থাপন করুন
সূত্র

উত্তর:

$Y$ rmslrmpredict.lrm

— ফ্র্যাঙ্ক হ্যারেল
সূত্র

আপনার সাহায্যের জন্য ধন্যবাদ. আমি সন্দেহ করি যে কম ফ্রিকোয়েন্সি মারাত্মক এই সমস্যার অংশ ছিল। আমি মনে করি আমার কাঁচা ওয়াই, 0 1 2 অপর্যাপ্ত পরিমাণে সমান বিরতি। আমি জড়ো আমার লক্ষ্য ভুল হয়। দুর্ভাগ্যবশত, আমি মনে করি আমি জানতে চাই কি বিভাগ একটি নতুন রোগীর মধ্যে / সম্পূর্ণরূপে বুঝতে পারছি না কি আমার লক্ষ্য পড়া হবে চান উচিত হবে। একটু বেশি অন্তর্দৃষ্টি দেওয়া কি সম্ভব? (আসলে, আমি সন্দেহ সিভি না সম্পূর্ণ পাঠ জন্য ফোরাম নয়; অন্যথায়, আপনি কি জানেন যেখানে আমি এই সমস্যা সম্পর্কে জানতে পারে না আমি Agresti এর ইন্ট্রো & Hosmer & Lemeshow এর পণ্য সরবরাহ থেকে বিভাগে পড়া আছে, কিন্তু কোন উপকার।)

— গুং - মনিকা পুনরায়

লক্ষ্যটি প্রয়োজনীয় সিদ্ধান্ত দ্বারা বা বিষয় দ্বারা চালিত হয়। যদি আপনি চূড়ান্ত লক্ষ্যটি বর্ণনা করেন তবে আমি মন্তব্য করতে সক্ষম হতে পারি।

— ফ্র্যাঙ্ক হ্যারেল

আমার স্পষ্টতার অভাবের জন্য দুঃখিত, এটি উপরেও সমস্যা বলে মনে হচ্ছে। বর্তমানে আমি নতুন মামলার ফলাফল সম্পর্কে ভবিষ্যদ্বাণী করতে সক্ষম হতে চাই। দীর্ঘমেয়াদে, আমি অর্ডার লগ রেগ আরও ভালভাবে বুঝতে চাই, উদাহরণস্বরূপ আপনার যদি পূর্বাভাসযুক্ত বিভাগ না থাকে তবে আপনি কীভাবে অবশিষ্টাংশ পাবেন? আমি সামান্য ভাল নির্ভুলতা সংগ্রহ করা সম্ভব হয়, কিন্তু আমি কিভাবে এটি পেতে জানি না। আমি নিশ্চিত যে আপনার কাছে সমস্ত কিছু ব্যাখ্যা করার সময় নেই, তবে আগ্রেস্তি বা এইচএন্ডএল উভয়ই ভবিষ্যদ্বাণী বা অবশিষ্টাংশ ইত্যাদি সম্পর্কে কিছু বলতে পারেন না এবং আমি ডাব্লু / গুগল কিছুই পাইনি। এইভাবে, আমি সিভি জিজ্ঞাসা। আমি আপনার অব্যাহত সহায়তার প্রশংসা করি।

— গুং - মনিকা পুনরায়

Y \geq j

$Y\geq j$

j

$j$

-1

সুসংহততা সর্বোচ্চ স্কোর নয়, গড় স্কোর পরীক্ষা করে সংজ্ঞায়িত হয়।

সুতরাং আপনার উদাহরণগুলির জন্য, 1 এর গড় স্কোর 0 * 55.1% + 1 * 35.8% + 2 * 9.1% = 0.54, এবং 2 (একই গণনার মাধ্যমে) 0.826।

এটি এই মানটি যে আপনার সাথে একত্রীকরণ বা অন্য কোনও সংস্থার পরিসংখ্যান পাওয়ার তুলনা করা উচিত।

রেফ - http://support.sas.com/docamentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_logistic_sect042.htm

— kalel
সূত্র

Y

$Y$

X β

$X\beta$

D_{x y}

$D_{xy}$

SAS PROC LOGIST

Y

$Y$