নিম্নলিখিত ব্যাখ্যাটি লজিস্টিক রিগ্রেশন সীমাবদ্ধ নয় তবে সাধারণ লিনিয়ার রিগ্রেশন এবং অন্যান্য জিএলএমগুলিতে সমানভাবে প্রযোজ্য। সাধারণত, R
শ্রেণিবদ্ধের একটি স্তরকে বাদ দেওয়া হয় এবং সহগগণ এই রেফারেন্স ক্লাসের (বা কখনও কখনও বেসলাইন শ্রেণি বলা হয়) প্রতিটি শ্রেণির পার্থক্য বোঝায় (এটিকে ডামি কোডিং বা চিকিত্সার বিপরীতে বলা হয় R
, বিভিন্ন বিপরীতে বিকল্পগুলির একটি দুর্দান্ত ওভারভিউয়ের জন্য এখানে দেখুন )। বর্তমানের বৈপরীত্যগুলি দেখতে R
টাইপ করুন options("contrasts")
। সাধারণত R
বর্ণানুক্রমিক পরিবর্তনশীল স্তরের অর্ডার দেয় এবং রেফারেন্স ক্লাস হিসাবে প্রথম স্থান গ্রহণ করে। এটি সর্বদা অনুকূল নয় এবং টাইপ করে এটি পরিবর্তন করা যেতে পারে (এখানে আমরা রেফারেন্স ক্লাসটি নতুন ভেরিয়েবলে "সি" তে সেট করব)new.variable <- relevel(old.variable, ref="c")
। শ্রেণিবদ্ধ ভেরিয়েবলের প্রতিটি স্তরের প্রতিটি সহগের জন্য , রেফারেন্স শ্রেণীর এবং অন্যান্য শ্রেণীর সহগের মধ্যে জোড়াযুক্ত পার্থক্য শূন্য থেকে আলাদা কিনা তা পরীক্ষা করার জন্য একটি ওয়াল্ড পরীক্ষা করা হয় । এই কি z- র এবং পি রিগ্রেশন টেবিলে -values হয়। যদি কেবল একটি শ্রেণিবদ্ধ শ্রেণিটি উল্লেখযোগ্য হয় তবে এটি বোঝায় না যে পুরো পরিবর্তনশীল অর্থহীন এবং মডেল থেকে অপসারণ করা উচিত। আপনি একটি সম্পাদন দ্বারা ভেরিয়েবলের সামগ্রিক প্রভাব পরীক্ষা করতে পারবেন সম্ভাবনা অনুপাত পরীক্ষা : দুই মডেল, সঙ্গে এক এবং এক পরিবর্তনশীল এবং ধরন ছাড়া হইয়া মধ্যে (নীচের উদাহরণ দেখুন)। এখানে একটি উদাহরণ:z- রপিanova(model1, model2, test="LRT")
R
mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
mydata$rank <- factor(mydata$rank)
my.mod <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")
summary(my.mod)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.989979 1.139951 -3.500 0.000465 ***
gre 0.002264 0.001094 2.070 0.038465 *
gpa 0.804038 0.331819 2.423 0.015388 *
rank2 -0.675443 0.316490 -2.134 0.032829 *
rank3 -1.340204 0.345306 -3.881 0.000104 ***
rank4 -1.551464 0.417832 -3.713 0.000205 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
rank1
rank
rank1
rank
rank1
rank2
- 0.675rank1
rank2
- 3.99 - 0.675 = - 4.67rank1
rank1
। - 1
মডেল সূত্রে যুক্ত করে সমস্ত সহগুণকে সরাসরি দেখতে আপনি কোনও বাধা ছাড়াই মডেলটিকে ফিট করতে পারেন:
my.mod2 <- glm(admit ~ gre + gpa + rank - 1, data = mydata, family = "binomial")
summary(my.mod2) # no intercept model
Coefficients:
Estimate Std. Error z value Pr(>|z|)
gre 0.002264 0.001094 2.070 0.038465 *
gpa 0.804038 0.331819 2.423 0.015388 *
rank1 -3.989979 1.139951 -3.500 0.000465 ***
rank2 -4.665422 1.109370 -4.205 2.61e-05 ***
rank3 -5.330183 1.149538 -4.637 3.54e-06 ***
rank4 -5.541443 1.138072 -4.869 1.12e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
নোট করুন যে ইন্টারসেপ্ট এখন চলে গেছে এবং এর সহগটি rank1
হ'ল প্রথম মডেলের ইন্টারসেপ্ট। এখানে ওয়াল্ড পরীক্ষাটি সহগের মধ্যে জুটিযুক্ত পার্থক্যটি পরীক্ষা করে না তবে প্রতিটি পৃথক সহগ শূন্য বলে অনুমান করা হয়। আবার, আমাদের প্রমাণ রয়েছে যে প্রতিটি সহগের rank
শূন্য থেকে পৃথক। পরিশেষে, পুরো ভেরিয়েবলটি rank
মডেল ফিট করে কি না তা পরীক্ষা করতে , আমরা একটি মডেল ( my.mod1
) এবং একটি পরিবর্তনশীল rank
( my.mod2
) ছাড়াই ফিট করি এবং সম্ভাবনা অনুপাতের পরীক্ষা করি। এটি এই অনুমানটি পরীক্ষা করে যে এর সমস্ত সহগটি rank
শূন্য:
my.mod1 <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial") # with rank
my.mod2 <- glm(admit ~ gre + gpa, data = mydata, family = "binomial") # without rank
anova(my.mod1, my.mod2, test="LRT")
Analysis of Deviance Table
Model 1: admit ~ gre + gpa + rank
Model 2: admit ~ gre + gpa
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 394 458.52
2 397 480.34 -3 -21.826 7.088e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
সম্ভাবনা অনুপাতের পরীক্ষাটি অত্যন্ত তাৎপর্যপূর্ণ এবং আমরা এই সিদ্ধান্তে পৌঁছে যাব যে পরিবর্তনশীলটি rank
মডেলটিতে থাকা উচিত।
এই পোস্টটি খুব আকর্ষণীয়।
admit ~ 1
বনাম হবেadmit ~ rank - 1
?