লজিস্টিক রিগ্রেশন মধ্যে শ্রেণিবদ্ধ ভবিষ্যদ্বাণী এর তাৎপর্য


19

লজিস্টিক রিগ্রেশনে শ্রেণিবদ্ধ ভেরিয়েবলের জন্য z মানগুলি ব্যাখ্যা করতে আমার সমস্যা হচ্ছে। নীচের উদাহরণে আমার 3 শ্রেণি সহ একটি স্পষ্টতাল পরিবর্তনশীল আছে এবং z মান অনুসারে, CLASS2 প্রাসঙ্গিক হতে পারে অন্যগুলি না থাকলে।

তবে এখন এর অর্থ কী?

যে আমি অন্য ক্লাস এক একীকরণ করতে পারি?
পুরো পরিবর্তনটি ভাল ভবিষ্যদ্বাণীকারী নাও হতে পারে?

এটি কেবল একটি উদাহরণ এবং এখানে প্রকৃত z মানগুলি আসল সমস্যা থেকে নয়, তাদের ব্যাখ্যা সম্পর্কে আমার কেবল অসুবিধা রয়েছে।

           Estimate    Std. Error  z value Pr(>|z|)    
CLASS0     6.069e-02  1.564e-01   0.388   0.6979    
CLASS1     1.734e-01  2.630e-01   0.659   0.5098    
CLASS2     1.597e+00  6.354e-01   2.514   0.0119 *  

উত্তর:


47

নিম্নলিখিত ব্যাখ্যাটি লজিস্টিক রিগ্রেশন সীমাবদ্ধ নয় তবে সাধারণ লিনিয়ার রিগ্রেশন এবং অন্যান্য জিএলএমগুলিতে সমানভাবে প্রযোজ্য। সাধারণত, Rশ্রেণিবদ্ধের একটি স্তরকে বাদ দেওয়া হয় এবং সহগগণ এই রেফারেন্স ক্লাসের (বা কখনও কখনও বেসলাইন শ্রেণি বলা হয়) প্রতিটি শ্রেণির পার্থক্য বোঝায় (এটিকে ডামি কোডিং বা চিকিত্সার বিপরীতে বলা হয় R, বিভিন্ন বিপরীতে বিকল্পগুলির একটি দুর্দান্ত ওভারভিউয়ের জন্য এখানে দেখুন )। বর্তমানের বৈপরীত্যগুলি দেখতে Rটাইপ করুন options("contrasts")। সাধারণত Rবর্ণানুক্রমিক পরিবর্তনশীল স্তরের অর্ডার দেয় এবং রেফারেন্স ক্লাস হিসাবে প্রথম স্থান গ্রহণ করে। এটি সর্বদা অনুকূল নয় এবং টাইপ করে এটি পরিবর্তন করা যেতে পারে (এখানে আমরা রেফারেন্স ক্লাসটি নতুন ভেরিয়েবলে "সি" তে সেট করব)new.variable <- relevel(old.variable, ref="c")। শ্রেণিবদ্ধ ভেরিয়েবলের প্রতিটি স্তরের প্রতিটি সহগের জন্য , রেফারেন্স শ্রেণীর এবং অন্যান্য শ্রেণীর সহগের মধ্যে জোড়াযুক্ত পার্থক্য শূন্য থেকে আলাদা কিনা তা পরীক্ষা করার জন্য একটি ওয়াল্ড পরীক্ষা করা হয় । এই কি z- র এবং পি রিগ্রেশন টেবিলে -values হয়। যদি কেবল একটি শ্রেণিবদ্ধ শ্রেণিটি উল্লেখযোগ্য হয় তবে এটি বোঝায় না যে পুরো পরিবর্তনশীল অর্থহীন এবং মডেল থেকে অপসারণ করা উচিত। আপনি একটি সম্পাদন দ্বারা ভেরিয়েবলের সামগ্রিক প্রভাব পরীক্ষা করতে পারবেন সম্ভাবনা অনুপাত পরীক্ষা : দুই মডেল, সঙ্গে এক এবং এক পরিবর্তনশীল এবং ধরন ছাড়া হইয়া মধ্যে (নীচের উদাহরণ দেখুন)। এখানে একটি উদাহরণ:z- রপিanova(model1, model2, test="LRT")R

mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")

mydata$rank <- factor(mydata$rank)

my.mod <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")

summary(my.mod)

Coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -3.989979   1.139951  -3.500 0.000465 ***
gre          0.002264   0.001094   2.070 0.038465 *  
gpa          0.804038   0.331819   2.423 0.015388 *  
rank2       -0.675443   0.316490  -2.134 0.032829 *  
rank3       -1.340204   0.345306  -3.881 0.000104 ***
rank4       -1.551464   0.417832  -3.713 0.000205 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

rank1rankrank1rankrank1rank2-0,675rank1rank2-3.99-0,675=-4.67rank1rank1- 1মডেল সূত্রে যুক্ত করে সমস্ত সহগুণকে সরাসরি দেখতে আপনি কোনও বাধা ছাড়াই মডেলটিকে ফিট করতে পারেন:

my.mod2 <- glm(admit ~ gre + gpa + rank - 1, data = mydata, family = "binomial")

summary(my.mod2) # no intercept model

Coefficients:
       Estimate Std. Error z value Pr(>|z|)    
gre    0.002264   0.001094   2.070 0.038465 *  
gpa    0.804038   0.331819   2.423 0.015388 *  
rank1 -3.989979   1.139951  -3.500 0.000465 ***
rank2 -4.665422   1.109370  -4.205 2.61e-05 ***
rank3 -5.330183   1.149538  -4.637 3.54e-06 ***
rank4 -5.541443   1.138072  -4.869 1.12e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

নোট করুন যে ইন্টারসেপ্ট এখন চলে গেছে এবং এর সহগটি rank1হ'ল প্রথম মডেলের ইন্টারসেপ্ট। এখানে ওয়াল্ড পরীক্ষাটি সহগের মধ্যে জুটিযুক্ত পার্থক্যটি পরীক্ষা করে না তবে প্রতিটি পৃথক সহগ শূন্য বলে অনুমান করা হয়। আবার, আমাদের প্রমাণ রয়েছে যে প্রতিটি সহগের rankশূন্য থেকে পৃথক। পরিশেষে, পুরো ভেরিয়েবলটি rankমডেল ফিট করে কি না তা পরীক্ষা করতে , আমরা একটি মডেল ( my.mod1) এবং একটি পরিবর্তনশীল rank( my.mod2) ছাড়াই ফিট করি এবং সম্ভাবনা অনুপাতের পরীক্ষা করি। এটি এই অনুমানটি পরীক্ষা করে যে এর সমস্ত সহগটি rankশূন্য:

my.mod1 <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial") # with rank
my.mod2 <- glm(admit ~ gre + gpa, data = mydata, family = "binomial") # without rank

anova(my.mod1, my.mod2, test="LRT")

Analysis of Deviance Table

Model 1: admit ~ gre + gpa + rank
Model 2: admit ~ gre + gpa
  Resid. Df Resid. Dev Df Deviance  Pr(>Chi)    
1       394     458.52                          
2       397     480.34 -3  -21.826 7.088e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

সম্ভাবনা অনুপাতের পরীক্ষাটি অত্যন্ত তাৎপর্যপূর্ণ এবং আমরা এই সিদ্ধান্তে পৌঁছে যাব যে পরিবর্তনশীলটি rankমডেলটিতে থাকা উচিত।

এই পোস্টটি খুব আকর্ষণীয়।


খুব তথ্যপূর্ণ উত্তর! একটি তাত্ক্ষণিক প্রশ্ন: আমাদের যদি কেবল ভবিষ্যদ্বাণী হিসাবে পদমর্যাদা থাকে? এলআরটি পরীক্ষা করার জন্য, নালটি admit ~ 1বনাম হবে admit ~ rank - 1?
NULL

1
@ নুল হ্যাঁ, হয় নাল বনাম admit~rankবা admit~rank - 1, তারা ফিটের সমতুল্য।
COOLSerdash

দুর্দান্ত - ধন্যবাদ! অন্য একটি দ্রুত প্রশ্ন: যখন আমি (থেকে বেসলাইন তুলনা ছাড়া - আমি বলতে চাচ্ছি কোন পথিমধ্যে) শ্রেণীগত ভেরিয়েবলের কোফিসিয়েন্টস এক-টেইলড Wald, পরীক্ষা করণ আগ্রহী, যেমন অন্যান্য ভবিষ্যতবক্তা প্রভাব হবে greএবং gpaএই অভাব দ্বারা প্রভাবিত হতে অন্তর্ভুক্তি অন্তর্ভুক্ত?
শুক্র

অন্য কথায়, যদি আমি অন্যান্য সহকারীদের নিয়ন্ত্রণ করতে গিয়ে শ্রেণীবদ্ধ ভবিষ্যদ্বাণীটির গুণাগুণগুলির উপর এক-লেজযুক্ত পরীক্ষা করতে চাই, তবে কি এভাবেই চলবে? এবং এটি লিনিয়ার রিগ্রেশন-এর ক্ষেত্রেও প্রযোজ্য?
শুক্র

1
rankrankপি মানগুলি দেখতে পারেন। একতরফা পরীক্ষার জন্য, এই পোস্টটি এখানে দেখুন । এবং হ্যাঁ, উপরের সমস্তটি লিনিয়ার রিগ্রেশনকেও প্রযোজ্য, যেমনটি উত্তরের শুরুতে বলা হয়েছিল।
COOLSerdash

8

z- র

সুতরাং একটি অ-উল্লেখযোগ্য সহগ বলতে কি বোঝায় যে আপনি বিভাগগুলিকে একীভূত করতে পারেন? না First প্রমাণের অনুপস্থিতি অনুপস্থিতির প্রমাণ হিসাবে একই জিনিস নয়। দ্বিতীয়ত, বিভাগগুলিকে মার্জ করা, বিশেষত রেফারেন্স বিভাগটি অন্যান্য সমস্ত সহগের ব্যাখ্যা বদলে দেয়। এই বোধগম্যতা রয়েছে কি না তা নির্ভর করে different বিভিন্ন শ্রেণীর পক্ষে কী নির্ভর করে।

তার মানে কি পুরো শ্রেণিবদ্ধ পরিবর্তনশীলটি একটি "খারাপ" (অ-উল্লেখযোগ্য) ভবিষ্যদ্বাণী? না, এর জন্য আপনাকে সমস্ত CLASS পদগুলির জন্য একযোগে পরীক্ষা করাতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.