আমি কোনও দ্বিপদী লজিস্টিক রিগ্রেশন ব্যবহার করছি ব্যবহারকারী যদি কোনও কিছুর উপর ক্লিক করে তার সম্ভাব্যতার সংস্পর্শে has_x
বা has_y
প্রভাবিত করে তবে তা চিহ্নিত করতে। আমার মডেলটি নিম্নলিখিত:
fit = glm(formula = has_clicked ~ has_x + has_y,
data=df,
family = binomial())
এটি আমার মডেল থেকে আউটপুট:
Call:
glm(formula = has_clicked ~ has_x + has_y,
family = binomial(), data = active_domains)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9869 -0.9719 -0.9500 1.3979 1.4233
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.504737 0.008847 -57.050 < 2e-16 ***
has_xTRUE -0.056986 0.010201 -5.586 2.32e-08 ***
has_yTRUE 0.038579 0.010202 3.781 0.000156 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 217119 on 164182 degrees of freedom
Residual deviance: 217074 on 164180 degrees of freedom
AIC: 217080
Number of Fisher Scoring iterations: 4
প্রতিটি সহগ তাত্পর্যপূর্ণ হিসাবে, এই মডেলটি ব্যবহার করে আমি নীচের পদ্ধতির ব্যবহার করে এই সংমিশ্রণের কোনওটির মূল্য কী তা বলতে সক্ষম হয়েছি:
predict(fit, data.frame(has_x = T, has_y=T), type = "response")
আমি বুঝতে পারছি না আমি কীভাবে স্ট্যান্ডার্ডে রিপোর্ট করতে পারি। ভবিষ্যদ্বাণী ত্রুটি।
আমার কি কেবল ব্যবহার করা দরকার ? বা এখানে বর্ণিত পদ্ধতির সাহায্যে আমার রূপান্তর করতে হবে ?এস ই
আমি যদি উভয় ভেরিয়েবলের জন্য স্ট্যান্ডার্ড-ত্রুটি বুঝতে চাই তবে আমি কীভাবে এটি বিবেচনা করব?
এই প্রশ্নের বিপরীতে , আমি বুঝতে পারছি যে ত্রুটির উপরের এবং নীচের সীমাটি শতাংশে কী তা বোঝার জন্য। উদাহরণস্বরূপ, আমার পূর্বাভাসের 37% এর মান দেখায় True,True
আমি গণনা করতে পারি যে এটি জন্য ? (0.3% আমার বক্তব্য চিত্রিত করতে বেছে নেওয়া হয়েছে)95 % সি আই