জেনারালাইজড লিনিয়ার মডেলগুলির সাথে, এখানে তিনটি বিভিন্ন ধরণের পরিসংখ্যান পরীক্ষা করা যেতে পারে। এগুলি হ'ল ওয়াল্ড পরীক্ষা, সম্ভাবনা অনুপাতের পরীক্ষা এবং স্কোর পরীক্ষা। দুর্দান্ত ইউসিএলএ পরিসংখ্যান সহায়তা সাইটের এখানে তাদের নিয়ে আলোচনা রয়েছে । নিম্নলিখিত চিত্র (তাদের সাইট থেকে অনুলিপি করা) তাদের চিত্রিত করতে সহায়তা করে:
- Wald, পরীক্ষা ধরে নেয় যে সম্ভাবনা স্বাভাবিকভাবে বিতরণ করা হয়, এবং যে ভিত্তিতে মান ত্রুটি অনুমান করার জন্য বক্রতা ডিগ্রী ব্যবহার করে। তারপরে, এসই দ্বারা ভাগ করা পরামিতি অনুমান একটি স্কোর দেয়। এটি বৃহত্তর অধীনে রয়েছে তবে ছোট এর সাথে এটি সত্য নয় । আপনার কখন এই সম্পত্তি ধরে রাখার পক্ষে যথেষ্ট বড় তা বলা শক্ত, সুতরাং এই পরীক্ষাটি কিছুটা ঝুঁকিপূর্ণ হতে পারে। z- রএনএনএন
- সম্ভাবনা অনুপাত পরীক্ষাগুলি তার সর্বোচ্চ এবং শূন্যতায় সম্ভাবনার অনুপাত (বা লগ সম্ভাবনার মধ্যে পার্থক্য) দেখায়। এটি প্রায়শই সেরা পরীক্ষা হিসাবে বিবেচিত হয়।
- স্কোর পরীক্ষা নাল মান সম্ভাবনা ঢাল উপর ভিত্তি করে। এটি সাধারণত কম শক্তিশালী, তবে এমন সময় রয়েছে যখন সম্পূর্ণ সম্ভাবনা গণনা করা যায় না এবং তাই এটি একটি দুর্দান্ত ফ্যালব্যাক বিকল্প।
যে পরীক্ষাগুলি নিয়ে আসে summary.glm()
তা হ'ল ওয়াল্ড পরীক্ষা। আপনি কীভাবে আপনার আত্মবিশ্বাসের অন্তর পেতে পারেন তা বলবেন না, তবে আমি ধরে নিই যে আপনি ব্যবহার করেছেন confint()
, যার ফলে কলগুলি আসে profile()
। আরও সুনির্দিষ্টভাবে, সেই আত্মবিশ্বাসের অন্তরগুলি সম্ভাবনাটি প্রোফাইং করে গণনা করা হয় (যা এসইকে দিয়ে চেয়ে আরও ভাল পদ্ধতির )। এটি হ'ল ওয়াল্ড টেস্ট নয়, সম্ভাবনা অনুপাতের পরীক্ষার সাথে অভিন্ন। একটি স্কোর পরীক্ষা -test, ঘুরে, হয়। 1.96χ2
আপনার যেমন অনির্দিষ্টকালের জন্য বড় হয়ে যায়, তিনটি আলাদা আলাদা এর একই মানতে রূপান্তর করা উচিত তবে আপনার যখন অসীম ডেটা না থাকে তখন এগুলি কিছুটা আলাদা হতে পারে। এটি লক্ষণীয় যে আপনার প্রাথমিক আউটপুটে (ওয়াল্ড) ভ্যালুটি সবেমাত্র তাৎপর্যপূর্ণ এবং মাত্র over ( উদ্ধৃতি ) এর মধ্যে খুব বেশি পার্থক্য রয়েছে । সেই লাইনটি 'ম্যাজিক' নয়। দেওয়া হয়েছে যে আরও দুটি নির্ভরযোগ্য পরীক্ষা মাত্র , আমি বলতে পারি যে প্রচলিত মানদণ্ডের দ্বারা আপনার ডেটা যথেষ্ট 'তাৎপর্যপূর্ণ' নয়। এনপিপিα = .05.05.05
আমি নীচে রৈখিক ভবিষ্যদ্বাণী এর স্কেলে সহগের প্রোফাইল এবং সম্ভাবনা অনুপাত পরীক্ষা স্পষ্টভাবে (মাধ্যমে anova.glm()
) চালানো। আমি আপনার মত একই ফলাফল পেতে:
library(MASS)
x = matrix(c(343-268,268,73-49,49), nrow=2, byrow=T); x
# [,1] [,2]
# [1,] 75 268
# [2,] 24 49
D = factor(c("N","Diabetes"), levels=c("N","Diabetes"))
m = glm(x~D, family=binomial)
summary(m)
# ...
# Coefficients:
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -1.2735 0.1306 -9.749 <2e-16 ***
# DDiabetes 0.5597 0.2813 1.990 0.0466 *
# ...
confint(m)
# Waiting for profiling to be done...
# 2.5 % 97.5 %
# (Intercept) -1.536085360 -1.023243
# DDiabetes -0.003161693 1.103671
anova(m, test="LRT")
# ...
# Df Deviance Resid. Df Resid. Dev Pr(>Chi)
# NULL 1 3.7997
# D 1 3.7997 0 0.0000 0.05126 .
chisq.test(x)
# Pearson's Chi-squared test with Yates' continuity correction
#
# X-squared = 3.4397, df = 1, p-value = 0.06365
@ জেভিলিমন একটি মন্তব্যে (এখন মুছে ফেলা) ইশারা করে বলেছিলেন R
, আপনি ব্যবহার করে স্কোর-ভিত্তিক পি-মানও পেতে পারেন anova.glm(model, test="Rao")
। নীচের উদাহরণে, নোট করুন যে পি-মান উপরের চি-স্কোয়ার পরীক্ষার মতো একেবারে সমান নয়, কারণ ডিফল্টরূপে, R
এর chisq.test()
ধারাবাহিকতা সংশোধন প্রযোজ্য। আমরা যদি সেটিংটি পরিবর্তন করি, পি-মানগুলি মেলে:
anova(m, test="Rao")
# ...
# Df Deviance Resid. Df Resid. Dev Rao Pr(>Chi)
# NULL 1 3.7997
# D 1 3.7997 0 0.0000 4.024 0.04486 *
chisq.test(x, correct=FALSE)
# Pearson's Chi-squared test
#
# data: x
# X-squared = 4.024, df = 1, p-value = 0.04486