আমার পি-মানগুলি লজিস্টিক রিগ্রেশন আউটপুট, চি-স্কোয়ার্ড পরীক্ষা এবং ওআর এর জন্য আস্থার ব্যবধানের মধ্যে কেন পার্থক্য করে?


37

আমি একটি লজিস্টিক রিগ্রেশন তৈরি করেছি যেখানে চিকিত্সা ( Cureবনাম No Cure) পাওয়ার পরে ফলাফলের পরিবর্তনশীল নিরাময় হচ্ছে । এই গবেষণার সমস্ত রোগী চিকিত্সা পেয়েছিলেন। ডায়াবেটিস হওয়া এই পরিণতির সাথে যুক্ত কিনা তা জানতে আগ্রহী।

আর-তে আমার লজিস্টিক রিগ্রেশন আউটপুট নীচের মত দেখাচ্ছে:

Call:
glm(formula = Cure ~ Diabetes, family = binomial(link = "logit"), data = All_patients)
...
Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.2735     0.1306   9.749   <2e-16 ***
Diabetes     -0.5597     0.2813  -1.990   0.0466 *  
...
    Null deviance: 456.55  on 415  degrees of freedom
Residual deviance: 452.75  on 414  degrees of freedom
  (2 observations deleted due to missingness)
AIC: 456.75

তবে, বৈষম্যের অনুপাতের জন্য আস্থার ব্যবধানে 1 :

                   OR     2.5 %   97.5 %
(Intercept) 3.5733333 2.7822031 4.646366
Diabetes    0.5713619 0.3316513 1.003167

আমি যখন এই ডেটাগুলির উপর চ-স্কোয়ার পরীক্ষা করি তখন আমি নিম্নলিখিতগুলি পাই:

data:  check
X-squared = 3.4397, df = 1, p-value = 0.06365

আপনি যদি নিজে থেকে নিরাময় এবং নিরাময়ের গোষ্ঠীগুলিতে ডায়াবেটিসের বিতরণ এটি গণনা করতে চান তবে:

Diabetic cure rate:      49 /  73 (67%)
Non-diabetic cure rate: 268 / 343 (78%)

আমার প্রশ্ন হ'ল পি-মান এবং 1 সহ আত্মবিশ্বাসের বিরতি কেন একমত হয় না?


ডায়াবেটিসের আস্থা অন্তর কীভাবে গণনা করা হয়েছিল? যদি আপনি ওয়াল্ড সিআই গঠনের জন্য প্যারামিটারের প্রাক্কলন এবং মান ত্রুটি ব্যবহার করেন তবে আপনি ওপরের শেষ পয়েন্ট হিসাবে এক্সপ্রেস (- 55 5597 + 1.96 * .2813) = .99168 পাবেন।
হার্ড

@ হার্ড 2 ফ্যাথম, সম্ভবত ওপি ব্যবহার করা হবে confint()। অর্থাৎ, সম্ভাবনাটি প্রোফাইল হয়েছিল। এইভাবে আপনি সিআরগুলি পান যা এলআরটির সাথে সাদৃশ্যপূর্ণ। আপনার গণনা সঠিক, তবে পরিবর্তে ওয়াল্ড সিআই গঠন করুন। নীচে আমার উত্তর আরও তথ্য আছে।
গুং - মনিকা পুনরায়

আরও মনোযোগ দিয়ে পড়ার পরে আমি এটিকে উন্নত করেছিলাম। ইন্দ্রিয় তোলে।
হার্ড

উত্তর:


64

জেনারালাইজড লিনিয়ার মডেলগুলির সাথে, এখানে তিনটি বিভিন্ন ধরণের পরিসংখ্যান পরীক্ষা করা যেতে পারে। এগুলি হ'ল ওয়াল্ড পরীক্ষা, সম্ভাবনা অনুপাতের পরীক্ষা এবং স্কোর পরীক্ষা। দুর্দান্ত ইউসিএলএ পরিসংখ্যান সহায়তা সাইটের এখানে তাদের নিয়ে আলোচনা রয়েছে । নিম্নলিখিত চিত্র (তাদের সাইট থেকে অনুলিপি করা) তাদের চিত্রিত করতে সহায়তা করে:

এখানে চিত্র বর্ণনা লিখুন

  1. Wald, পরীক্ষা ধরে নেয় যে সম্ভাবনা স্বাভাবিকভাবে বিতরণ করা হয়, এবং যে ভিত্তিতে মান ত্রুটি অনুমান করার জন্য বক্রতা ডিগ্রী ব্যবহার করে। তারপরে, এসই দ্বারা ভাগ করা পরামিতি অনুমান একটি স্কোর দেয়। এটি বৃহত্তর অধীনে রয়েছে তবে ছোট এর সাথে এটি সত্য নয় । আপনার কখন এই সম্পত্তি ধরে রাখার পক্ষে যথেষ্ট বড় তা বলা শক্ত, সুতরাং এই পরীক্ষাটি কিছুটা ঝুঁকিপূর্ণ হতে পারে। z- রএনএনএন
  2. সম্ভাবনা অনুপাত পরীক্ষাগুলি তার সর্বোচ্চ এবং শূন্যতায় সম্ভাবনার অনুপাত (বা লগ সম্ভাবনার মধ্যে পার্থক্য) দেখায়। এটি প্রায়শই সেরা পরীক্ষা হিসাবে বিবেচিত হয়।
  3. স্কোর পরীক্ষা নাল মান সম্ভাবনা ঢাল উপর ভিত্তি করে। এটি সাধারণত কম শক্তিশালী, তবে এমন সময় রয়েছে যখন সম্পূর্ণ সম্ভাবনা গণনা করা যায় না এবং তাই এটি একটি দুর্দান্ত ফ্যালব্যাক বিকল্প।

যে পরীক্ষাগুলি নিয়ে আসে summary.glm()তা হ'ল ওয়াল্ড পরীক্ষা। আপনি কীভাবে আপনার আত্মবিশ্বাসের অন্তর পেতে পারেন তা বলবেন না, তবে আমি ধরে নিই যে আপনি ব্যবহার করেছেন confint(), যার ফলে কলগুলি আসে profile()। আরও সুনির্দিষ্টভাবে, সেই আত্মবিশ্বাসের অন্তরগুলি সম্ভাবনাটি প্রোফাইং করে গণনা করা হয় (যা এসইকে দিয়ে চেয়ে আরও ভাল পদ্ধতির )। এটি হ'ল ওয়াল্ড টেস্ট নয়, সম্ভাবনা অনুপাতের পরীক্ষার সাথে অভিন্ন। একটি স্কোর পরীক্ষা -test, ঘুরে, হয়। 1.96χ2

আপনার যেমন অনির্দিষ্টকালের জন্য বড় হয়ে যায়, তিনটি আলাদা আলাদা এর একই মানতে রূপান্তর করা উচিত তবে আপনার যখন অসীম ডেটা না থাকে তখন এগুলি কিছুটা আলাদা হতে পারে। এটি লক্ষণীয় যে আপনার প্রাথমিক আউটপুটে (ওয়াল্ড) ভ্যালুটি সবেমাত্র তাৎপর্যপূর্ণ এবং মাত্র over ( উদ্ধৃতি ) এর মধ্যে খুব বেশি পার্থক্য রয়েছে । সেই লাইনটি 'ম্যাজিক' নয়। দেওয়া হয়েছে যে আরও দুটি নির্ভরযোগ্য পরীক্ষা মাত্র , আমি বলতে পারি যে প্রচলিত মানদণ্ডের দ্বারা আপনার ডেটা যথেষ্ট 'তাৎপর্যপূর্ণ' নয়। এনপিপিα=.05.05.05

আমি নীচে রৈখিক ভবিষ্যদ্বাণী এর স্কেলে সহগের প্রোফাইল এবং সম্ভাবনা অনুপাত পরীক্ষা স্পষ্টভাবে (মাধ্যমে anova.glm()) চালানো। আমি আপনার মত একই ফলাফল পেতে:

library(MASS)
x = matrix(c(343-268,268,73-49,49), nrow=2, byrow=T);  x
#      [,1] [,2]
# [1,]   75  268
# [2,]   24   49
D = factor(c("N","Diabetes"), levels=c("N","Diabetes"))
m = glm(x~D, family=binomial)
summary(m)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept)  -1.2735     0.1306  -9.749   <2e-16 ***
# DDiabetes     0.5597     0.2813   1.990   0.0466 *  
# ...
confint(m)
# Waiting for profiling to be done...
#                    2.5 %    97.5 %
# (Intercept) -1.536085360 -1.023243
# DDiabetes   -0.003161693  1.103671
anova(m, test="LRT")
# ...
#      Df Deviance Resid. Df Resid. Dev Pr(>Chi)  
# NULL                     1     3.7997           
# D     1   3.7997         0     0.0000  0.05126 .
chisq.test(x)
#         Pearson's Chi-squared test with Yates' continuity correction
# 
# X-squared = 3.4397, df = 1, p-value = 0.06365

@ জেভিলিমন একটি মন্তব্যে (এখন মুছে ফেলা) ইশারা করে বলেছিলেন R, আপনি ব্যবহার করে স্কোর-ভিত্তিক পি-মানও পেতে পারেন anova.glm(model, test="Rao")। নীচের উদাহরণে, নোট করুন যে পি-মান উপরের চি-স্কোয়ার পরীক্ষার মতো একেবারে সমান নয়, কারণ ডিফল্টরূপে, Rএর chisq.test()ধারাবাহিকতা সংশোধন প্রযোজ্য। আমরা যদি সেটিংটি পরিবর্তন করি, পি-মানগুলি মেলে:

anova(m, test="Rao")
# ...
#      Df Deviance Resid. Df Resid. Dev   Rao Pr(>Chi)  
# NULL                     1     3.7997                 
# D     1   3.7997         0     0.0000 4.024  0.04486 *
chisq.test(x, correct=FALSE)
#   Pearson's Chi-squared test
# 
# data:  x
# X-squared = 4.024, df = 1, p-value = 0.04486

12
+1 এটি একটি খুব তথ্যমূলক বিশ্লেষণ, কিছুটা রহস্যজনক আচরণকে স্পষ্টভাবে এবং প্রামাণিকভাবে সম্বোধন করা এবং দরকারী দিকনির্দেশনা সরবরাহ করা।
শুক্র

উত্তম উত্তর গাং, যদিও আপনি "আমি বলতে চাইছি প্রচলিত মানদণ্ডের দ্বারা আপনার ডেটা যথেষ্ট 'তাৎপর্যপূর্ণ' নয় এর অর্থ কী তা আমি বুঝতে পারি না।
999

@ চিহ্ন 999, এখানে সবচেয়ে নির্ভরযোগ্য পরীক্ষা (এলআরটি এবং চি-স্কোয়ার্ড) উভয়ই .05 এর চেয়ে সামান্য।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.