আমি একটি স্বাস্থ্য সমস্যার পূর্বাভাস দিতে চাই। আমার কাছে 3 ফলাফল বিভাগ রয়েছে যা অর্ডার করা হয়: 'সাধারণ', 'হালকা' এবং 'গুরুতর'। আমি দুটি পূর্বাভাসকারী ভেরিয়েবল, একটি পরীক্ষার ফলাফল (একটি অবিচ্ছিন্ন, অন্তরবৃত্তাকার covariate) এবং এই সমস্যাটির সাথে পারিবারিক ইতিহাস (হ্যাঁ বা না) থেকে ভবিষ্যদ্বাণী করতে চাই। আমার নমুনায়, সম্ভাবনাগুলি 55% (স্বাভাবিক), 35% (মৃদু) এবং 10% (গুরুতর)। এই অর্থে, আমি সবসময় কেবলমাত্র 'সাধারণ' ভবিষ্যদ্বাণী করতে পারি এবং সময়টির 55% সঠিক হতে পারি, যদিও এটি আমাকে ব্যক্তিগত রোগীদের সম্পর্কে কোনও তথ্য দেয় না। আমি নিম্নলিখিত মডেল ফিট:
ধরে নিন যে কোনও মিথস্ক্রিয়া নেই এবং মডেলটির সাথে সবকিছু ঠিক আছে। সম্মতি, সি, 60০.৫%, যা আমি মডেলটির সর্বাধিক ভবিষ্যদ্বাণীমূলক নির্ভুলতা হিসাবে বুঝতে পারি।
আমি নিম্নলিখিত তথ্য সহ দুটি নতুন রোগী দেখতে পেলাম: 1. পরীক্ষা = 3.26, পরিবার = 0; ২. পরীক্ষা = ২.৮৫, পরিবার = ১। আমি তাদের পূর্বসূরীর পূর্বাভাস দিতে চাই। সূত্রটি ব্যবহার করে: (এবং তারপর ক্রমসঞ্চিত সম্ভাব্যতা মধ্যে পার্থক্য করার), আমি সাড়া বিভাগ মডেলের উপর শর্তাধীন উপর সম্ভাব্যতা বিতরণের নিরূপণ করতে পারেন। আর কোড (এনবি, রাউন্ডিং ইস্যুগুলির কারণে, আউটপুট পুরোপুরি মেলে না):
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X <- rbind(c(3.26, 0), c(2.85, 1))
pred_cat1 <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3 <- 1-pred_cat2.temp
pred_cat2 <- pred_cat2.temp-pred_cat1
predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)
যথা: 1. 0 = 55.1%, 1 = 35.8%, 2 = 9.1%; এবং 2. 0 = 35.6%, 1 = 46.2%, 2 = 18.2%। আমার প্রশ্ন হ'ল আমি কীভাবে সম্ভাব্যতা বিতরণ থেকে ভবিষ্যদ্বাণী করা প্রতিক্রিয়া বিভাগে যাব?
আমি নমুনা তথ্য ব্যবহার করে বেশ কয়েকটি সম্ভাবনার চেষ্টা করেছি, যেখানে ফলাফলটি জানা যায়। যদি আমি সর্বাধিক (সম্ভাব্যতাগুলি) বাছাই করি তবে নির্ভুলতা 57% হয়, শূন্যের তুলনায় সামান্য উন্নতি, তবে একত্রীকরণের নীচে। তদুপরি, নমুনায়, এই পদ্ধতির কখনও 'গুরুতর' বাছাই করে না, যা আমি সত্যিই জানতে চাই। নাল এবং মডেল সম্ভাব্যতাগুলিকে প্রতিকূলতার মধ্যে রূপান্তর করে এবং তারপরে সর্বাধিক (বিজোড় অনুপাত) বাছাই করে আমি একটি বয়েশিয়ান পদ্ধতির চেষ্টা করেছি। এটি মাঝেমধ্যে 'গুরুতর' বাছাই করে তবে আরও খারাপ নির্ভুলতা 49.5% দেয়। আমি সম্ভাব্যতা এবং বৃত্তাকার দ্বারা ভারিত বিভাগগুলির একটি সংখ্যার চেষ্টাও করেছি। এটি আবার কখনও 'গুরুতর' বাছাই করে না এবং এর যথাযথতাও কম থাকে ৫১.৫%।
সমীকরণটি কী যা উপরের তথ্য গ্রহণ করে এবং সর্বোত্তম নির্ভুলতা (60.5%) দেয়?