নীচের প্লটটি বিবেচনা করুন যেখানে আমি ডেটা সিমুলেটেড করেছি। আমরা একটি বাইনারি ফলাফল তাকানযার জন্য 1 হওয়ার প্রকৃত সম্ভাবনাটি কালো রেখা দ্বারা নির্দেশিত। একটি covariate মধ্যে কার্যকরী সম্পর্ক এবং লজিস্টিক লিঙ্ক সহ তৃতীয় ক্রমের বহুপদী (তাই এটি একটি দ্বৈত পথে অ-রৈখিক)।
সবুজ লাইনটি জিএলএম লজিস্টিক রিগ্রেশন যেখানে ফিট fit 3 য় অর্ডার বহুপদী হিসাবে চালু করা হয়। ড্যাশযুক্ত সবুজ রেখাগুলি পূর্বাভাসের চারদিকে 95% আস্থা অন্তর, কোথায় লাগানো রিগ্রেশন সহগ। আমি ব্যবহার করেছি R
glm
এবং predict.glm
এই জন্য।
একইভাবে, pruple রেখাটি 95% এর জন্য বিশ্বাসযোগ্য ব্যবধান সহ উত্তরকালের গড় পূর্বে ইউনিফর্ম ব্যবহার করে একটি বয়েসীয় লজিস্টিক রিগ্রেশন মডেল। আমি এর জন্য MCMCpack
ফাংশন সহ প্যাকেজটি ব্যবহার করেছি MCMClogit
(সেটিংস B0=0
আগে ইউনিফর্মটিকে অজানা তথ্য দেয়)।
লাল বিন্দুগুলির জন্য ডেটা সেটটিতে পর্যবেক্ষণগুলি বোঝায় , কালো বিন্দুগুলি পর্যবেক্ষণ করে । নোট করুন যে শ্রেণিবদ্ধকরণ / বিচ্ছিন্ন বিশ্লেষণে সাধারণ কিন্তু না পালন করা হয়.
বেশ কয়েকটি জিনিস দেখা যায়:
- আমি উদ্দেশ্য যে অনুকরণ বাম হাতে বিরল। আমি চাই যে তথ্যের অভাব (পর্যবেক্ষণ) এর কারণে আত্মবিশ্বাস এবং বিশ্বাসযোগ্য ব্যবধানটি এখানে প্রশস্ত হয়।
- উভয় ভবিষ্যদ্বাণী বাম দিকে wardর্ধ্বমুখী হয়। এই পক্ষপাতটি চারটি রেড পয়েন্ট ডেনোটিংয়ের কারণে ঘটেপর্যবেক্ষণগুলি, যা ভুলভাবে পরামর্শ দেয় যে আসল কার্যকরী ফর্মটি এখানে উঠে আসবে। সত্যিকারের ফাংশনাল ফর্মটি নিম্নমুখী বাঁকানো উপসংহারে অ্যালগরিদমের অপর্যাপ্ত তথ্য রয়েছে।
- আত্মবিশ্বাসের ব্যবধানটি প্রত্যাশার মতো আরও বিস্তৃত হয়, যেখানে বিশ্বাসযোগ্য ব্যবধান হয় না । প্রকৃতপক্ষে আত্মবিশ্বাসের ব্যবধানটি পুরো পরামিতি জায়গাকে ঘিরে রাখে, তথ্যের অভাবে এটি হওয়া উচিত।
মনে হচ্ছে বিশ্বাসযোগ্য ব্যবধানটি এখানে / এর একটি অংশের জন্য খুব আশাবাদী । যখন তথ্য বিচ্ছিন্ন হয়ে যায় বা পুরোপুরি অনুপস্থিত থাকে তখন বিশ্বাসযোগ্য ব্যবধানটি সংকীর্ণ হওয়া সত্যিই অযাচিত আচরণ। সাধারণত এটি কোনও বিশ্বাসযোগ্য ব্যবধানের প্রতিক্রিয়া হয় না। কেউ কি ব্যাখ্যা করতে পারেন:
- এর কারণ কী?
- আরও কার্যকর বিশ্বাসযোগ্য ব্যবধানে আসতে আমি কী পদক্ষেপ নিতে পারি? (এটি হ'ল এমন একটি যা অন্তত সত্যিকারের কার্যকরী ফর্মটি আবদ্ধ করে রাখে বা আত্মবিশ্বাসের ব্যবধানের মতো আরও প্রশস্ত হয়)
গ্রাফিক মধ্যে পূর্বাভাস অন্তর পেতে কোড এখানে মুদ্রিত হয়:
fit <- glm(y_obs ~ x + I(x^2) + I(x^3), data=data, family=binomial)
x_pred <- seq(0, 1, by=0.01)
pred <- predict(fit, newdata = data.frame(x=x_pred), se.fit = T)
plot(plogis(pred$fit), type='l')
matlines(plogis(pred$fit + pred$se.fit %o% c(-1.96,1.96)), type='l', col='black', lty=2)
library(MCMCpack)
mcmcfit <- MCMClogit(y_obs ~ x + I(x^2) + I(x^3), data=data, family=binomial)
gibbs_samps <- as.mcmc(mcmcfit)
x_pred_dm <- model.matrix(~ x + I(x^2) + I(x^3), data=data.frame('x'=x_pred))
gibbs_preds <- apply(gibbs_samps, 1, `%*%`, t(x_pred_dm))
gibbs_pis <- plogis(apply(gibbs_preds, 1, quantile, c(0.025, 0.975)))
matlines(t(gibbs_pis), col='red', lty=2)
ডেটা অ্যাক্সেস : https://pastebin.com/1H2iX দেখুন @ দেলতাভ এবং @ অ্যাডামো ধন্যবাদ thanks
dput
ডেটাযুক্ত ডেটাফ্রেমে ব্যবহার করতে পারেন এবং তারপরে dput
আপনার পোস্টে কোড হিসাবে আউটপুট অন্তর্ভুক্ত করতে পারেন ।