নিম্নলিখিত ব্যাখ্যাটি লজিস্টিক রিগ্রেশন সীমাবদ্ধ নয় তবে সাধারণ লিনিয়ার রিগ্রেশন এবং অন্যান্য জিএলএমগুলিতে সমানভাবে প্রযোজ্য। সাধারণত, Rশ্রেণিবদ্ধের একটি স্তরকে বাদ দেওয়া হয় এবং সহগগণ এই রেফারেন্স ক্লাসের (বা কখনও কখনও বেসলাইন শ্রেণি বলা হয়) প্রতিটি শ্রেণির পার্থক্য বোঝায় (এটিকে ডামি কোডিং বা চিকিত্সার বিপরীতে বলা হয় R, বিভিন্ন বিপরীতে বিকল্পগুলির একটি দুর্দান্ত ওভারভিউয়ের জন্য এখানে দেখুন )। বর্তমানের বৈপরীত্যগুলি দেখতে Rটাইপ করুন options("contrasts")। সাধারণত Rবর্ণানুক্রমিক পরিবর্তনশীল স্তরের অর্ডার দেয় এবং রেফারেন্স ক্লাস হিসাবে প্রথম স্থান গ্রহণ করে। এটি সর্বদা অনুকূল নয় এবং টাইপ করে এটি পরিবর্তন করা যেতে পারে (এখানে আমরা রেফারেন্স ক্লাসটি নতুন ভেরিয়েবলে "সি" তে সেট করব)new.variable <- relevel(old.variable, ref="c")। শ্রেণিবদ্ধ ভেরিয়েবলের প্রতিটি স্তরের প্রতিটি সহগের জন্য , রেফারেন্স শ্রেণীর এবং অন্যান্য শ্রেণীর সহগের মধ্যে জোড়াযুক্ত পার্থক্য শূন্য থেকে আলাদা কিনা তা পরীক্ষা করার জন্য একটি ওয়াল্ড পরীক্ষা করা হয় । এই কি z- র এবং পি রিগ্রেশন টেবিলে -values হয়। যদি কেবল একটি শ্রেণিবদ্ধ শ্রেণিটি উল্লেখযোগ্য হয় তবে এটি বোঝায় না যে পুরো পরিবর্তনশীল অর্থহীন এবং মডেল থেকে অপসারণ করা উচিত। আপনি একটি সম্পাদন দ্বারা ভেরিয়েবলের সামগ্রিক প্রভাব পরীক্ষা করতে পারবেন সম্ভাবনা অনুপাত পরীক্ষা : দুই মডেল, সঙ্গে এক এবং এক পরিবর্তনশীল এবং ধরন ছাড়া হইয়া মধ্যে (নীচের উদাহরণ দেখুন)। এখানে একটি উদাহরণ:z- রপিanova(model1, model2, test="LRT")R
mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
mydata$rank <- factor(mydata$rank)
my.mod <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")
summary(my.mod)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.989979 1.139951 -3.500 0.000465 ***
gre 0.002264 0.001094 2.070 0.038465 *
gpa 0.804038 0.331819 2.423 0.015388 *
rank2 -0.675443 0.316490 -2.134 0.032829 *
rank3 -1.340204 0.345306 -3.881 0.000104 ***
rank4 -1.551464 0.417832 -3.713 0.000205 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
rank1rankrank1rankrank1rank2- 0.675rank1rank2- 3.99 - 0.675 = - 4.67rank1rank1। - 1মডেল সূত্রে যুক্ত করে সমস্ত সহগুণকে সরাসরি দেখতে আপনি কোনও বাধা ছাড়াই মডেলটিকে ফিট করতে পারেন:
my.mod2 <- glm(admit ~ gre + gpa + rank - 1, data = mydata, family = "binomial")
summary(my.mod2) # no intercept model
Coefficients:
Estimate Std. Error z value Pr(>|z|)
gre 0.002264 0.001094 2.070 0.038465 *
gpa 0.804038 0.331819 2.423 0.015388 *
rank1 -3.989979 1.139951 -3.500 0.000465 ***
rank2 -4.665422 1.109370 -4.205 2.61e-05 ***
rank3 -5.330183 1.149538 -4.637 3.54e-06 ***
rank4 -5.541443 1.138072 -4.869 1.12e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
নোট করুন যে ইন্টারসেপ্ট এখন চলে গেছে এবং এর সহগটি rank1হ'ল প্রথম মডেলের ইন্টারসেপ্ট। এখানে ওয়াল্ড পরীক্ষাটি সহগের মধ্যে জুটিযুক্ত পার্থক্যটি পরীক্ষা করে না তবে প্রতিটি পৃথক সহগ শূন্য বলে অনুমান করা হয়। আবার, আমাদের প্রমাণ রয়েছে যে প্রতিটি সহগের rankশূন্য থেকে পৃথক। পরিশেষে, পুরো ভেরিয়েবলটি rankমডেল ফিট করে কি না তা পরীক্ষা করতে , আমরা একটি মডেল ( my.mod1) এবং একটি পরিবর্তনশীল rank( my.mod2) ছাড়াই ফিট করি এবং সম্ভাবনা অনুপাতের পরীক্ষা করি। এটি এই অনুমানটি পরীক্ষা করে যে এর সমস্ত সহগটি rankশূন্য:
my.mod1 <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial") # with rank
my.mod2 <- glm(admit ~ gre + gpa, data = mydata, family = "binomial") # without rank
anova(my.mod1, my.mod2, test="LRT")
Analysis of Deviance Table
Model 1: admit ~ gre + gpa + rank
Model 2: admit ~ gre + gpa
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 394 458.52
2 397 480.34 -3 -21.826 7.088e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
সম্ভাবনা অনুপাতের পরীক্ষাটি অত্যন্ত তাৎপর্যপূর্ণ এবং আমরা এই সিদ্ধান্তে পৌঁছে যাব যে পরিবর্তনশীলটি rankমডেলটিতে থাকা উচিত।
এই পোস্টটি খুব আকর্ষণীয়।
admit ~ 1বনাম হবেadmit ~ rank - 1?