বোনমিয়াল সেটিংয়ের আওতায় সাফল্যের ভবিষ্যতের অনুপাতের জন্য ভবিষ্যদ্বাণী ব্যবধান


9

ধরা যাক আমি দ্বিপদী রিগ্রেশন ফিট করে এবং প্যাশন অনুমান এবং রিগ্রেশন সহগগুলির বৈকল্পিক-কোভারিয়েন্স ম্যাট্রিক্স প্রাপ্ত করি। এটি আমাকে ভবিষ্যতের পরীক্ষায় সাফল্যের প্রত্যাশিত অনুপাতের জন্য সিআই পেতে অনুমতি দেবে,p, তবে পর্যবেক্ষণের অনুপাতে আমার একটি সিআই দরকার। সিমুলেশন (ধরুন আমি তা করতে চাই না) এবং কৃষ্ণমূর্থ্য এট আল (যা আমার প্রশ্নের পুরো উত্তর দেয় না) সহ কয়েকটি সম্পর্কিত উত্তর পোস্ট হয়েছে।

আমার যুক্তিটি নিম্নরূপ: আমরা যদি কেবল দ্বিপদী মডেল ব্যবহার করি তবে আমরা তা ধরে নিতে বাধ্য হই pসাধারণ বিতরণ থেকে নমুনা দেওয়া হয় (সংশ্লিষ্ট ওয়াল্ড সিআই সহ) এবং তাই বদ্ধ আকারে পর্যবেক্ষিত অনুপাতের জন্য সিআই পাওয়া অসম্ভব। আমরা যদি ধরে নিইpবিটা বিতরণ থেকে নমুনা দেওয়া হয়, তারপরে জিনিসগুলি আরও সহজ কারণ সাফল্যের সংখ্যা গণনা বিটা-বিনোমিয়াল বিতরণকে অনুসরণ করবে। আমাদের ধরে নিতে হবে যে অনুমিত বিটা পরামিতিগুলিতে কোনও অনিশ্চয়তা নেই,α এবং β

তিনটি প্রশ্ন আছে:

1) একটি তাত্ত্বিক একটি: বিটা পরামিতিগুলির কেবলমাত্র বিন্দু অনুমানগুলি ব্যবহার করা কি ঠিক? আমি জানি যে একাধিক লিনিয়ার রিগ্রেশন ভবিষ্যতে পর্যবেক্ষণের জন্য সিআই তৈরি করতে

Y=xβ+ϵ,ϵN(0,σ2)

তারা সেই কব্জি ত্রুটি শর্তের ভেরিয়েন্স করে, σ2। আমি এটি গ্রহণ করি (আমি ভুল হলে আমাকে সংশোধন করি) যে যুক্তিটি বাস্তবে এটিσ2 রিগ্রেশন সহগের তুলনায় অনেক বেশি নির্ভুলতার সাথে অনুমান করা হয় এবং এর অনিশ্চয়তা অন্তর্ভুক্ত করার চেষ্টা করে আমরা বেশি কিছু অর্জন করতে পারি না σ2। আনুমানিক বিটা পরামিতিগুলির ক্ষেত্রে এটি কি একই রকমের ন্যায়সঙ্গততা প্রযোজ্য,α এবং β?

2) কোন প্যাকেজটি আরও ভাল (আর: gamlss-bb, betareg, aod ?; আমার এসএএস এও অ্যাক্সেস রয়েছে)।

৩) অনুমিত বিটা পরামিতিগুলি দেওয়া, ভবিষ্যতের সাফল্যের গণনার জন্য কোয়ান্টাইলগুলি (2.5%, 97.5%) পাওয়ার জন্য বা বিটা-বোনমিয়াল বিতরণের আওতায় ভবিষ্যতের সাফল্যের অনুপাতে আরও ভাল (শনিবারের শর্টকাট) রয়েছে কি?


: প্রশ্ন এক উপর, হ্যাঁ এটা একটা বৈধ জিনিস যে মানুষ না, এটা গবেষণামূলক বায়েসের বলা হয় en.wikipedia.org/wiki/Empirical_Bayes_method
পল

1
আমি মনে করি না যে কোনও মডেল প্যারামিটার অনুমানের জন্য পদ্ধতি এক্সওয়াইজেডটি স্বয়ংক্রিয়ভাবে বোঝাতে পারে যে ভবিষ্যতের পর্যবেক্ষণের জন্য সিআই তৈরি করার সময় অনুমানের অনিশ্চয়তা উপেক্ষা করা ঠিক আছে। যেমন একাধিক লিনিয়ার রিগ্রেশন এ তারা EB এর পরিবর্তে ওএলএস ব্যবহার করে এবং এর মধ্যে অনিশ্চয়তাσপাশাপাশি উপেক্ষা করা হয়। কেন এমন? এছাড়াও, উইকি নিবন্ধটি কখনই পরামর্শ দেয় না যে ইসিতে শীর্ষ স্তরের হাইপারপ্যারামিটারগুলির প্রাক্কলনের যথার্থতা সাধারণত এত বেশি যে তাদের ব্যবহারিক উদ্দেশ্যে স্থির করা বিবেচনা করা ঠিক হবে।
জেমস

1
“যখন সত্য বিতরণ p(ηy) অবিচ্ছেদ্য নির্ধারণকারী, তীব্রভাবে শীর্ষে পৌঁছেছে p(θy) সম্ভাব্যতা বিতরণ ওভার পরিবর্তন করে খুব বেশি পরিবর্তন করা যাবে না η একটি বিন্দু অনুমান সহ ηবিতরণ শিখর প্রতিনিধিত্ব ”। আপনার ক্ষেত্রে এটি সত্য কিনা তা আপনার সমস্যার ডোমেনের নির্দিষ্টকরণের উপর নির্ভর করে।
পল

2
ভাল প্রশ্ন! আপনি একটি পিভট পেতে পারেন না, তবে প্রোফাইল সম্ভাবনার ব্যবহার সম্পর্কে কী? ভবিষ্যদ্বাণীমূলক অনুমানের জন্য নন-বায়েশিয়ান পদ্ধতিগুলি দেখুন কি?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

উত্তর:


1

আমি প্রশ্নের 3 টি অংশে সম্বোধন করব।

দুটি বিবাদযুক্ত সমস্যা রয়েছে, প্রথমত আপনি এই ক্ষেত্রে কোনও রিগ্রেশন মডেল ফিট করতে ব্যবহার করেন to দ্বিতীয়টি হ'ল কীভাবে কোনও নতুন অনুমানের পূর্বাভাস দেওয়ার জন্য আপনার অনুমান থেকে বিরতি অনুমান করা যায়।

যদি আপনার প্রতিক্রিয়া ভেরিয়েবলগুলি দ্বি-দ্বি বিতরণ করা হয় তবে আপনি সাধারণত লজিস্টিক রিগ্রেশন বা প্রবিট রিগ্রেশন (লিঙ্ক ফাংশন হিসাবে সাধারণ সিডিএফ সহ গ্ল্যাম) ব্যবহার করতে পারেন।

আপনি যদি লজিস্টিক রিগ্রেশন করেন, তবে জবাবদিহিটি উপরের সীমানা দ্বারা বিভক্ত পর্যবেক্ষণ গণনার অনুপাত হিসাবে গ্রহণ করুন yi/ni। তারপরে আপনার ভবিষ্যদ্বাণীকারী / কোভেরিয়েটগুলি নিন এবং এগুলি আপনার আর কলটিতে একটি গ্ল্যাম ফাংশনে রাখুন। ফিরে আসা অবজেক্টে আপনার সমস্ত গণনা করার দরকার আছে।

x<- rnorm(100, sd=2)
prob_true <- 1/(1+exp(-(1+5*x)))
counts <- rbinom(100, 50,prob_true)
print(d.AD <- data.frame(counts,x))
glm.D93 <- glm(counts/50 ~ x, family = binomial() )

একটি জন্য রৈখিক নির্ভরণ সূত্র মডেল জন্য একটি পূর্বানুমান ব্যবধান হল:

y^i±tnpsy1+1n+(xix¯)2(n1)sx2

আপনি গ্ল্যামের জন্য অনুমান হিসাবে লিনিয়ার রিগ্রেশন মডেলটি ব্যবহার করতে পারেন। এটি করার জন্য আপনি সম্ভাব্যতাগুলি 0-1 স্কেলে ফিরে পেতে বিপরীতমুখী লিঙ্ক রূপান্তর করার আগে ভবিষ্যদ্বাণীদের রৈখিক সংমিশ্রনের জন্য লিনিয়ার রিগ্রেশন সূত্র । এটি করার কোডটি পূর্বাভাস.glm () আর ফাংশনে বেকড। এখানে কিছু উদাহরণ কোড যা একটি দুর্দান্ত প্লট তৈরি করবে। ( সম্পাদনা : এই কোডটি আত্মবিশ্বাসের ব্যবধানের জন্য, পূর্বাভাস ব্যবধানের জন্য নয়)

y_hat <- predict(glm.D93, type="link", se.fit=TRUE)
t_np<- qt(.975, 100-2, ncp=0)

ub <- y_hat$fit + t_np * y_hat$se.fit
lb <- y_hat$fit - t_np * y_hat$se.fit

point <- y_hat$fit

p_hat <- glm.D93$family$linkinv(point)
p_hat_lb <- glm.D93$family$linkinv(lb)
p_hat_ub <- glm.D93$family$linkinv(ub)

plot(x,p_hat)
points(x, p_hat_ub, col='red')
points(x, p_hat_lb, col='blue')

আপনি যে কোনও গ্ল্যামের জন্য একই জিনিসটি করতে পারেন, যেমন পায়সন, বিপরীত গসিয়ান, গামা ইত্যাদি each প্রতিটি ক্ষেত্রেই ভবিষ্যদ্বাণীকারীদের রৈখিক সংমিশ্রণের স্কেলে ভবিষ্যদ্বাণী ব্যবধান করে। পূর্বাভাস ব্যবধানের দুটি শেষ পয়েন্ট পাওয়ার পরে আপনি এই শেষ পয়েন্টগুলিকে বিপরীত লিঙ্কের মাধ্যমে রূপান্তর করেন। প্রতিটি উজ্জ্বলতার জন্য আমি উল্টো লিঙ্কটি উল্লেখ করেছি যে আমি এখানে লিখেছি লজিট কেসের চেয়ে আলাদা হতে পারে। আশাকরি এটা সাহায্য করবে.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.