লজিস্টিক রিগ্রেশন থেকে লাগানো মানগুলির জন্য কীভাবে স্ট্যান্ডার্ড ত্রুটিগুলি গণনা করা হয়?


29

আপনি যখন লজিস্টিক রিগ্রেশন মডেল থেকে কোনও উপযুক্ত মানটির পূর্বাভাস দেন, তখন স্ট্যান্ডার্ড ত্রুটিগুলি কীভাবে গণনা করা হয়? আমি সংযুক্ত মানগুলির জন্য নয়, সহগের জন্য নয় (যার মধ্যে ফিশার্স তথ্য ম্যাট্রিক্স জড়িত)।

আমি কেবলমাত্র কীভাবে নম্বরগুলি পেতে পারি তা খুঁজে পেয়েছি R(উদাহরণস্বরূপ, এখানে আর-সাহায্যে, বা এখানে স্ট্যাক ওভারফ্লোতে) তবে আমি সূত্রটি খুঁজে পাই না।

pred <- predict(y.glm, newdata= something, se.fit=TRUE)

আপনি যদি অনলাইনে উত্স সরবরাহ করতে পারেন (পছন্দমত কোনও বিশ্ববিদ্যালয়ের ওয়েবসাইটে), এটি দুর্দান্ত।

উত্তর:


35

পূর্বাভাসটি অনুমানযুক্ত সহগগুলির একমাত্র লিনিয়ার সংমিশ্রণ। গুণাগুণগুলি অসম্পূর্ণভাবে স্বাভাবিক তাই সেইসব সহগের একটি লিনিয়ার সংমিশ্রণও asympotically স্বাভাবিক হবে। সুতরাং আমরা যদি প্যারামিটার অনুমানের জন্য কোভারিয়েন্স ম্যাট্রিক্স পেতে পারি তবে আমরা সহজেই সেই অনুমানগুলির একটি রৈখিক সংমিশ্রণের জন্য স্ট্যান্ডার্ড ত্রুটিটি পেতে পারি। আমি যদি কোভেরিয়েন্স ম্যাট্রিক্সকে হিসাবে চিহ্নিত করি এবং আমার লিনিয়ার সংমিশ্রনের জন্য সহগের হিসাবে ভেক্টর লিখি তবে স্ট্যান্ডার্ড ত্রুটিটি কেবলমাত্র isসি ΣCCΣC

# Making fake data and fitting the model and getting a prediction
set.seed(500)
dat <- data.frame(x = runif(20), y = rbinom(20, 1, .5))
o <- glm(y ~ x, data = dat)
pred <- predict(o, newdata = data.frame(x=1.5), se.fit = TRUE)

# To obtain a prediction for x=1.5 I'm really
# asking for yhat = b0 + 1.5*b1 so my
# C = c(1, 1.5)
# and vcov applied to the glm object gives me
# the covariance matrix for the estimates
C <- c(1, 1.5)
std.er <- sqrt(t(C) %*% vcov(o) %*% C)

> pred$se.fit
[1] 0.4246289
> std.er
          [,1]
[1,] 0.4246289

আমরা দেখতে পাচ্ছি যে 'বাই হ্যান্ড' পদ্ধতিটি আমি দেখিয়েছি একইভাবে স্ট্যান্ডার্ড ত্রুটি দেয় reported predict


2
আমার একটি সম্পর্কিত প্রশ্ন আছে। আমরা যখন লিনিয়ার রিগ্রেশন (লজিস্টিক নয়) এর উপর একটি মান এবং আত্মবিশ্বাসের ব্যবধানের পূর্বাভাস দিই, আমরা ত্রুটি বৈকল্পিক / মান ত্রুটি অন্তর্ভুক্ত করি। কিন্তু লজিস্টিক রিগ্রেশন তা করে না। এই পার্থক্যটি কি এই যুক্তি থেকে এসেছে যে লজিস্টিক রিগ্রেশনটির পর্যবেক্ষণকৃত মানগুলি 0 বা 1 হয় এবং ত্রুটি বৈকল্পের অনুমান করার কোনও মানে নেই? আমার মনে হচ্ছে আমাদের কমপক্ষে কিছু করা উচিত তবে আমি কিছু অনুপস্থিত হতে পারি।
ব্যবহারকারীর 45457873

3
পুরানো প্রশ্ন, তবে এই থ্রেডটি আমাকে এখনই সহায়তা করেছে, সুতরাং এখানে যায়: লগইট 0 বা 1 পর্যবেক্ষণ করে তবে এটি সম্ভাবনার পূর্বাভাস দেয়। আপনি যখন কোনও উপযুক্ত মানটির একটি মানক ত্রুটি পান, এটি লিনিয়ার প্রেডিক্টরের স্কেলে on আপনি logit (হইয়া +/- 1.96 * se.fit) কথা বলার মাধ্যমে সম্ভাব্যতা উপর একটি আস্থা ব্যবধান পেতে
generic_user

কেবল সচেতন থাকুন যে এটি অ্যাসিম্পটোটিক স্বাভাবিক প্রায় ব্যবহার করে, যা লজিস্টিক মডেলটির জন্য বেশ খারাপ হতে পারে (হাউস-ডোনার ঘটনার জন্য এই সাইটটি অনুসন্ধান করুন)। সহগের জন্য, এটির সম্ভাবনা প্রোফাইলিং (এমএএসএস-এ সীমাবদ্ধ ফাংশন দ্বারা ব্যবহৃত) উদাহরণস্বরূপ প্রতিকার করা যেতে পারে। লিনিয়ার ভবিষ্যদ্বাণীকারীদের পক্ষে এটি সম্ভব নয় ...
কেজিটিল বি হালওয়ারসেন

2
ওপি যা চেয়েছিল তার জন্য এটি ভুল; আপনি যে জিএলএম ফিট করেছেন তা পরিচয় লিঙ্ক ফাংশন ব্যবহার করে, লগইট লিঙ্ক ফাংশনটি নয়। o <- glm(y ~ x, data = dat, family = binomial)পরিবর্তে আপনার ফিট করা উচিত । আপনি দয়া করে সংশোধন করতে পারেন? আপনার ব্যাখ্যা লগ-প্রতিক্রিয়া এসই ( type = "link"বিকল্পটি ব্যবহার করে ) অনুমান করার জন্য কাজ করে তবে এসই বিকল্পটি predictব্যবহার করার সময় নয় type = "response"
ঝে ঝ্যাং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.