নীচের প্লটটি বিবেচনা করুন যেখানে আমি ডেটা সিমুলেটেড করেছি। আমরা একটি বাইনারি ফলাফল তাকানযার জন্য 1 হওয়ার প্রকৃত সম্ভাবনাটি কালো রেখা দ্বারা নির্দেশিত। একটি covariate মধ্যে কার্যকরী সম্পর্ক এবং লজিস্টিক লিঙ্ক সহ তৃতীয় ক্রমের বহুপদী (তাই এটি একটি দ্বৈত পথে অ-রৈখিক)।
সবুজ লাইনটি জিএলএম লজিস্টিক রিগ্রেশন যেখানে ফিট fit 3 য় অর্ডার বহুপদী হিসাবে চালু করা হয়। ড্যাশযুক্ত সবুজ রেখাগুলি পূর্বাভাসের চারদিকে 95% আস্থা অন্তর, কোথায় লাগানো রিগ্রেশন সহগ। আমি ব্যবহার করেছি R glmএবং predict.glmএই জন্য।
একইভাবে, pruple রেখাটি 95% এর জন্য বিশ্বাসযোগ্য ব্যবধান সহ উত্তরকালের গড় পূর্বে ইউনিফর্ম ব্যবহার করে একটি বয়েসীয় লজিস্টিক রিগ্রেশন মডেল। আমি এর জন্য MCMCpackফাংশন সহ প্যাকেজটি ব্যবহার করেছি MCMClogit(সেটিংস B0=0আগে ইউনিফর্মটিকে অজানা তথ্য দেয়)।
লাল বিন্দুগুলির জন্য ডেটা সেটটিতে পর্যবেক্ষণগুলি বোঝায় , কালো বিন্দুগুলি পর্যবেক্ষণ করে । নোট করুন যে শ্রেণিবদ্ধকরণ / বিচ্ছিন্ন বিশ্লেষণে সাধারণ কিন্তু না পালন করা হয়.
বেশ কয়েকটি জিনিস দেখা যায়:
- আমি উদ্দেশ্য যে অনুকরণ বাম হাতে বিরল। আমি চাই যে তথ্যের অভাব (পর্যবেক্ষণ) এর কারণে আত্মবিশ্বাস এবং বিশ্বাসযোগ্য ব্যবধানটি এখানে প্রশস্ত হয়।
- উভয় ভবিষ্যদ্বাণী বাম দিকে wardর্ধ্বমুখী হয়। এই পক্ষপাতটি চারটি রেড পয়েন্ট ডেনোটিংয়ের কারণে ঘটেপর্যবেক্ষণগুলি, যা ভুলভাবে পরামর্শ দেয় যে আসল কার্যকরী ফর্মটি এখানে উঠে আসবে। সত্যিকারের ফাংশনাল ফর্মটি নিম্নমুখী বাঁকানো উপসংহারে অ্যালগরিদমের অপর্যাপ্ত তথ্য রয়েছে।
- আত্মবিশ্বাসের ব্যবধানটি প্রত্যাশার মতো আরও বিস্তৃত হয়, যেখানে বিশ্বাসযোগ্য ব্যবধান হয় না । প্রকৃতপক্ষে আত্মবিশ্বাসের ব্যবধানটি পুরো পরামিতি জায়গাকে ঘিরে রাখে, তথ্যের অভাবে এটি হওয়া উচিত।
মনে হচ্ছে বিশ্বাসযোগ্য ব্যবধানটি এখানে / এর একটি অংশের জন্য খুব আশাবাদী । যখন তথ্য বিচ্ছিন্ন হয়ে যায় বা পুরোপুরি অনুপস্থিত থাকে তখন বিশ্বাসযোগ্য ব্যবধানটি সংকীর্ণ হওয়া সত্যিই অযাচিত আচরণ। সাধারণত এটি কোনও বিশ্বাসযোগ্য ব্যবধানের প্রতিক্রিয়া হয় না। কেউ কি ব্যাখ্যা করতে পারেন:
- এর কারণ কী?
- আরও কার্যকর বিশ্বাসযোগ্য ব্যবধানে আসতে আমি কী পদক্ষেপ নিতে পারি? (এটি হ'ল এমন একটি যা অন্তত সত্যিকারের কার্যকরী ফর্মটি আবদ্ধ করে রাখে বা আত্মবিশ্বাসের ব্যবধানের মতো আরও প্রশস্ত হয়)
গ্রাফিক মধ্যে পূর্বাভাস অন্তর পেতে কোড এখানে মুদ্রিত হয়:
fit <- glm(y_obs ~ x + I(x^2) + I(x^3), data=data, family=binomial)
x_pred <- seq(0, 1, by=0.01)
pred <- predict(fit, newdata = data.frame(x=x_pred), se.fit = T)
plot(plogis(pred$fit), type='l')
matlines(plogis(pred$fit + pred$se.fit %o% c(-1.96,1.96)), type='l', col='black', lty=2)
library(MCMCpack)
mcmcfit <- MCMClogit(y_obs ~ x + I(x^2) + I(x^3), data=data, family=binomial)
gibbs_samps <- as.mcmc(mcmcfit)
x_pred_dm <- model.matrix(~ x + I(x^2) + I(x^3), data=data.frame('x'=x_pred))
gibbs_preds <- apply(gibbs_samps, 1, `%*%`, t(x_pred_dm))
gibbs_pis <- plogis(apply(gibbs_preds, 1, quantile, c(0.025, 0.975)))
matlines(t(gibbs_pis), col='red', lty=2)
ডেটা অ্যাক্সেস : https://pastebin.com/1H2iX দেখুন @ দেলতাভ এবং @ অ্যাডামো ধন্যবাদ thanks
dputডেটাযুক্ত ডেটাফ্রেমে ব্যবহার করতে পারেন এবং তারপরে dputআপনার পোস্টে কোড হিসাবে আউটপুট অন্তর্ভুক্ত করতে পারেন ।
