মুক্তির


12

সংক্ষিপ্তসার: স্ট্যান্ডার্ড স্বাভাবিক বিতরণ না করে লজিস্টিক রিগ্রেশন কোঅফিসিয়েন্টগুলির পরীক্ষার জন্য ডিস্ট্রিবিউশনের (অবশিষ্ট ডিগ্রি ভিত্তিক স্বাধীনতার ডিগ্রি সহ) ব্যবহারের সমর্থন করার জন্য কোনও পরিসংখ্যানগত তত্ত্ব আছে কি ?t


কিছু সময় আগে আমি আবিষ্কার করেছি যে ডিএল ডিফল্ট সেটিংসের অধীনে এসএএসসিসি জিসিআইএমএমএক্স-এ কোনও লজিস্টিক রিগ্রেশন মডেলটি ফিট করার সময়, লজিস্টিক রিগ্রেশন সহগের মান স্ট্যান্ডার্ড সাধারণ বিতরণের পরিবর্তে বিতরণ ব্যবহার করে পরীক্ষা করা হয় । 1 অর্থাৎ GLIMMIX অনুপাত সঙ্গে একটি কলাম রিপোর্ট β 1 / t1 (যা আমি ডাকবz- রএই প্রশ্নের বাকি), কিন্তু একটি "স্বাধীন ডিগ্রীগুলির" কলামে, সেইসাথে একটি রিপোর্টপি-value একটি অভিমানী উপর ভিত্তি করেটিবিতরণেরz- রস্বাধীন ডিগ্রীগুলির সঙ্গে অবশিষ্ট অবলম্বনের উপর ভিত্তি করে - যা স্বাধীনতার ডিগ্রি = প্যারামিটারের মোট পর্যবেক্ষণের বিয়োগ সংখ্যা। এই প্রশ্নের নীচে আমি প্রদর্শন এবং তুলনার জন্য আর এবং এসএএস-তে কিছু কোড এবং আউটপুট সরবরাহ করি। 2β^1/var(β^1)zptz2

এটি আমাকে বিভ্রান্ত করেছে, যেহেতু আমি ভেবেছিলাম যে লজিস্টিক রিগ্রেশনের মতো সাধারণীকরণীয় রৈখিক মডেলগুলির ক্ষেত্রে এই ক্ষেত্রে বিতরণকে সমর্থন করার মতো কোনও পরিসংখ্যানগত তত্ত্ব নেই । পরিবর্তে আমি ভেবেছিলাম আমরা এই কেস সম্পর্কে যা জানতাম তা wast

  • সাধারণত "প্রায়" বিতরণ করা হয়;z
  • এই সীমাবদ্ধতা ছোট নমুনা আকারের জন্য দরিদ্র হতে পারে;
  • তবুও এটি ধরে নেওয়া যায় না যে এর টি বিতরণ রয়েছে যেমন আমরা স্বাভাবিক প্রতিরোধের ক্ষেত্রে ধরে নিতে পারি।zt

zttt

  1. zt
  2. t

আরও সাধারণভাবে, GLIMMIX এখানে মূলত বোধগম্য অন্তর্দৃষ্টি ছাড়া এখানে যা করছে তার কোনও বাস্তব সমর্থন আছে?

আর কোড:

summary(glm(y ~ x, data=dat, family=binomial))

আর আউটপুট:

Call:
glm(formula = y ~ x, family = binomial, data = dat)

Deviance Residuals: 
   Min      1Q  Median      3Q     Max  
-1.352  -1.243   1.025   1.068   1.156  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.22800    0.06725   3.390 0.000698 ***
x           -0.17966    0.10841  -1.657 0.097462 .  
---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1235.6  on 899  degrees of freedom
Residual deviance: 1232.9  on 898  degrees of freedom
AIC: 1236.9

Number of Fisher Scoring iterations: 4

এসএএস কোড:

proc glimmix data=logitDat;
    model y(event='1') = x / dist=binomial solution;
run;

এসএএস আউটপুট (সম্পাদিত / সংক্ষিপ্ত):

The GLIMMIX Procedure

               Fit Statistics

-2 Log Likelihood            1232.87
AIC  (smaller is better)     1236.87
AICC (smaller is better)     1236.88
BIC  (smaller is better)     1246.47
CAIC (smaller is better)     1248.47
HQIC (smaller is better)     1240.54
Pearson Chi-Square            900.08
Pearson Chi-Square / DF         1.00


                       Parameter Estimates

                         Standard
Effect       Estimate       Error       DF    t Value    Pr > |t|

Intercept      0.2280     0.06725      898       3.39      0.0007
x             -0.1797      0.1084      898      -1.66      0.0978

1

2n


PROC LOGISTICz

1
এসপিএসএস একইভাবে লজিস্টিক মিশ্র-প্রভাবগুলির মডেলগুলির পরীক্ষার জন্য উপস্থিত হয় :(
রিচার্ড বর্ডার

উত্তর:


6

আসলেই কি পরিসংখ্যানগত তত্ত্বটি দেখায় যে লজিস্টিক রিগ্রেশন এবং / বা অন্যান্য জেনারালাইজড লিনিয়ার মডেলগুলির ক্ষেত্রে z আসলেই বিতরণে অনুসরণ করে?

আমি যতদূর জানি, এ জাতীয় কোনও তত্ত্বের অস্তিত্ব নেই। আমি নিয়মিত হাতে-avyেউয়ের তর্কগুলি এবং কিছু নির্দিষ্ট জিএলএম পরিবার বা অন্য কোনও ব্যক্তির জন্য এই জাতীয় দৃষ্টিভঙ্গি সমর্থন করার জন্য সিমুলেশন পরীক্ষাগুলি নিয়মিত দেখতে পাই। হস্তবাহ যুক্তিগুলির চেয়ে সিমুলেশনগুলি আরও দৃinc়প্রত্যয়ী।

যদি এ জাতীয় কোনও তত্ত্ব না থাকে, তবে সেখানে কি অন্তত কোনও কাগজপত্র দেখানো হবে যে বিতরণকে ধরে রেখে এইভাবে কাজ করা হয়, বা একটি সাধারণ বন্টনকে ধরে নিয়ে এর চেয়েও ভাল হতে পারে?

আমি যে প্রত্যাহার মনে করি তা নয়, তবে এটি খুব বেশি কিছু বলছে না।

আমার নিজস্ব (সীমাবদ্ধ) ছোট-নমুনা সিমুলেশনগুলি সুপারিশ করে যে লজিস্টিক ক্ষেত্রে টি-বিতরণ স্বাভাবিক হিসাবে ধরে নেওয়ার চেয়ে যথেষ্ট খারাপ হতে পারে:

এখানে চিত্র বর্ণনা লিখুন

এখানে উদাহরণস্বরূপ, 15 টি সমতুল্য এক্স-পর্যবেক্ষণ যেখানে জনসংখ্যার পরামিতি উভয়ই শূন্য ছিল সেখানে সাধারণ লজিস্টিক রিগ্রেশন (যেমন স্থির-প্রভাব, মিশ্র নয়) জন্য ওয়াল্ড পরিসংখ্যানের 10000 সিমুলেশনগুলির ফলাফল (কিউকিউ প্লট হিসাবে) রয়েছে। লাল রেখাটি হ'ল y = x রেখা। যেমন আপনি দেখতে পাচ্ছেন, প্রতিটি ক্ষেত্রে স্বাভাবিকের মাঝখানে ভাল পরিসরের তুলনায় বেশ ভাল একটি প্রায় অনুমান হয় - প্রায় 5 তম এবং 95 তম পার্সেন্টাইল (1.6-1.7ish), এবং তারপরে পরীক্ষার পরিসংখ্যানের আসল বিতরণ হয় স্বাভাবিকের চেয়ে যথেষ্ট হালকা লেজযুক্ত।

সুতরাং লজিস্টিক কেসের জন্য, আমি z- এর চেয়ে টি-টি ব্যবহার করার জন্য কোনও যুক্তি বলব বলে মনে হয় - এই ভিত্তিতে সফল হওয়ার সম্ভাবনা কম বলে মনে হচ্ছে, যেহেতু এই জাতীয় অনুকরণগুলি ফলাফলকে বোঝায় যে হালকা-লেজযুক্ত থাকতে পারে স্বাভাবিক দিকের চেয়ে ভারী লেজযুক্ত চেয়ে।

[তবে, আমি আপনাকে সাবধান করার সতর্কতা হিসাবে আমার সিমুলেশনগুলির উপর আর বিশ্বাস না করার জন্য পরামর্শ দিচ্ছি - আপনার নিজের কিছু চেষ্টা করুন, সম্ভবত আপনার আইভি ও মডেলের বৈশিষ্ট্যযুক্ত আপনার নিজের পরিস্থিতির আরও প্রতিনিধিত্বকারী (অবশ্যই, আপনাকে সিমুলেট করতে হবে কিছু নাল শূন্যের নীচে কোন বিতরণ ব্যবহার করতে হবে তা দেখতে সত্য)। তারা কীভাবে আপনার জন্য বেরিয়ে আসে তা আমি শুনতে আগ্রহী]]


1
t

4

Glen_b ইতিমধ্যে যা উপস্থাপন করেছে তার কিছুটা বাড়ানোর জন্য এখানে কয়েকটি অতিরিক্ত সিমুলেশন রয়েছে।

[1,1]N=10,20,40,80p=0.5,0.731,0.881,0.952

ztdf=N2z=0p=1QQsim

ptppHistSim

t


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.