সংক্ষিপ্তসার: স্ট্যান্ডার্ড স্বাভাবিক বিতরণ না করে লজিস্টিক রিগ্রেশন কোঅফিসিয়েন্টগুলির পরীক্ষার জন্য ডিস্ট্রিবিউশনের (অবশিষ্ট ডিগ্রি ভিত্তিক স্বাধীনতার ডিগ্রি সহ) ব্যবহারের সমর্থন করার জন্য কোনও পরিসংখ্যানগত তত্ত্ব আছে কি ?
কিছু সময় আগে আমি আবিষ্কার করেছি যে ডিএল ডিফল্ট সেটিংসের অধীনে এসএএসসিসি জিসিআইএমএমএক্স-এ কোনও লজিস্টিক রিগ্রেশন মডেলটি ফিট করার সময়, লজিস্টিক রিগ্রেশন সহগের মান স্ট্যান্ডার্ড সাধারণ বিতরণের পরিবর্তে বিতরণ ব্যবহার করে পরীক্ষা করা হয় । 1 অর্থাৎ GLIMMIX অনুপাত সঙ্গে একটি কলাম রিপোর্ট β 1 / √ (যা আমি ডাকবz- রএই প্রশ্নের বাকি), কিন্তু একটি "স্বাধীন ডিগ্রীগুলির" কলামে, সেইসাথে একটি রিপোর্টপি-value একটি অভিমানী উপর ভিত্তি করেটিবিতরণেরz- রস্বাধীন ডিগ্রীগুলির সঙ্গে অবশিষ্ট অবলম্বনের উপর ভিত্তি করে - যা স্বাধীনতার ডিগ্রি = প্যারামিটারের মোট পর্যবেক্ষণের বিয়োগ সংখ্যা। এই প্রশ্নের নীচে আমি প্রদর্শন এবং তুলনার জন্য আর এবং এসএএস-তে কিছু কোড এবং আউটপুট সরবরাহ করি। 2
এটি আমাকে বিভ্রান্ত করেছে, যেহেতু আমি ভেবেছিলাম যে লজিস্টিক রিগ্রেশনের মতো সাধারণীকরণীয় রৈখিক মডেলগুলির ক্ষেত্রে এই ক্ষেত্রে বিতরণকে সমর্থন করার মতো কোনও পরিসংখ্যানগত তত্ত্ব নেই । পরিবর্তে আমি ভেবেছিলাম আমরা এই কেস সম্পর্কে যা জানতাম তা was
- সাধারণত "প্রায়" বিতরণ করা হয়;
- এই সীমাবদ্ধতা ছোট নমুনা আকারের জন্য দরিদ্র হতে পারে;
- তবুও এটি ধরে নেওয়া যায় না যে এর টি বিতরণ রয়েছে যেমন আমরা স্বাভাবিক প্রতিরোধের ক্ষেত্রে ধরে নিতে পারি।
আরও সাধারণভাবে, GLIMMIX এখানে মূলত বোধগম্য অন্তর্দৃষ্টি ছাড়া এখানে যা করছে তার কোনও বাস্তব সমর্থন আছে?
আর কোড:
summary(glm(y ~ x, data=dat, family=binomial))
আর আউটপুট:
Call:
glm(formula = y ~ x, family = binomial, data = dat)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.352 -1.243 1.025 1.068 1.156
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.22800 0.06725 3.390 0.000698 ***
x -0.17966 0.10841 -1.657 0.097462 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1235.6 on 899 degrees of freedom
Residual deviance: 1232.9 on 898 degrees of freedom
AIC: 1236.9
Number of Fisher Scoring iterations: 4
এসএএস কোড:
proc glimmix data=logitDat;
model y(event='1') = x / dist=binomial solution;
run;
এসএএস আউটপুট (সম্পাদিত / সংক্ষিপ্ত):
The GLIMMIX Procedure
Fit Statistics
-2 Log Likelihood 1232.87
AIC (smaller is better) 1236.87
AICC (smaller is better) 1236.88
BIC (smaller is better) 1246.47
CAIC (smaller is better) 1248.47
HQIC (smaller is better) 1240.54
Pearson Chi-Square 900.08
Pearson Chi-Square / DF 1.00
Parameter Estimates
Standard
Effect Estimate Error DF t Value Pr > |t|
Intercept 0.2280 0.06725 898 3.39 0.0007
x -0.1797 0.1084 898 -1.66 0.0978
PROC LOGISTIC