একাধিক লজিস্টিক রিগ্রেশন বনাম মাল্টিনোমিয়াল রিগ্রেশন

10

বহুজাতিক নামক রিগ্রেশন না করে একাধিক বাইনারি লজিস্টিক রিগ্রেশন করা কি কার্যকর? এই প্রশ্নটি থেকে: বহু বহুবিধ লজিস্টিক রিগ্রেশন বনাম ওয়ান-বনাম-বাক্স বাইনারি লজিস্টিক রিগ্রেশন আমি দেখছি যে বহুজাতিক রিগ্রেশনটিতে নিম্নমানের ত্রুটি থাকতে পারে।

তবে, আমি যে প্যাকেজটি ব্যবহার করতে চাই তা মাল্টিনোমিয়াল রিগ্রেশন ( ncvreg: http://cran.r-project.org/web/packages/ncvreg/ncvreg.pdf ) তে সাধারণীকরণ করা হয়নি এবং তাই আমি ভাবছিলাম যে আমি কেবল এটি করতে পারি কিনা? পরিবর্তে বেশ কয়েকটি বাইনারি লজিস্টিক রিগ্রেশনগুলি।

r logistic multinomial

— bdeonovic
সূত্র

9

বহুজাতিক নথিভুক্ত মডেলটি দিয়ে আপনি সমস্ত ভবিষ্যদ্বাণীযুক্ত সম্ভাব্যতা ১ টির প্রতিবন্ধকতা চাপিয়ে দেন তবে যখন আপনি পৃথক বাইনারি লগইট মডেল ব্যবহার করেন আপনি আর সেই সীমাবদ্ধতা আরোপ করতে পারবেন না, সেগুলি মোটামুটি পৃথক মডেলগুলিতে অনুমান করা হয়। সুতরাং এই দুটি মডেলের মধ্যে প্রধান পার্থক্য হবে।

আপনি নীচের উদাহরণে দেখতে পাচ্ছেন (স্টাটাতে, যে প্রোগ্রামটি আমি সবচেয়ে ভাল জানি), মডেলগুলি একই রকম হয় তবে একই রকম হয় না। ভবিষ্যদ্বাণী করা সম্ভাব্যতাগুলি এক্সট্রাপোলেটিং সম্পর্কে আমি বিশেষত যত্নবান হব।

// some data preparation
. sysuse nlsw88, clear                                                               
(NLSW, 1988 extract)                                                                 

.                                                                                    
. gen byte occat = cond(occupation < 3                 , 1,      ///                 
>                  cond(inlist(occupation, 5, 6, 8, 13), 2, 3))  ///                 
>                  if !missing(occupation)                                           
(9 missing values generated)                                                         

. label variable occat "occupation in categories"                                    

. label define occat 1 "high"   ///                                                  
>                    2 "middle" ///                                                  
>                    3 "low"                                                         

. label value occat occat                                                            

.                                                                                    
. gen byte middle = (occat == 2) if occat !=1 & !missing(occat)                      
(590 missing values generated)                                                       

. gen byte high   = (occat == 1) if occat !=2 & !missing(occat)                      
(781 missing values generated)                                                       


// a multinomial logit model
. mlogit occat i.race i.collgrad , base(3) nolog                                     

Multinomial logistic regression                   Number of obs   =       2237       
                                                  LR chi2(6)      =     218.82       
                                                  Prob > chi2     =     0.0000       
Log likelihood = -2315.9312                       Pseudo R2       =     0.0451       

-------------------------------------------------------------------------------      
        occat |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]      
--------------+----------------------------------------------------------------      
high          |                                                                      
         race |                                                                      
       black  |  -.4005801   .1421777    -2.82   0.005    -.6792433    -.121917      
       other  |   .4588831   .4962591     0.92   0.355    -.5137668    1.431533      
              |                                                                      
     collgrad |                                                                      
college grad  |   1.495019   .1341625    11.14   0.000     1.232065    1.757972      
        _cons |  -.7010308   .0705042    -9.94   0.000    -.8392165   -.5628451      
--------------+----------------------------------------------------------------      
middle        |                                                                      
         race |                                                                      
       black  |   .6728568   .1106792     6.08   0.000     .4559296     .889784      
       other  |   .2678372    .509735     0.53   0.599    -.7312251    1.266899      
              |                                                                      
     collgrad |                                                                      
college grad  |    .976244   .1334458     7.32   0.000      .714695    1.237793      
        _cons |   -.517313   .0662238    -7.81   0.000    -.6471092   -.3875168      
--------------+----------------------------------------------------------------      
low           |  (base outcome)                                                      
-------------------------------------------------------------------------------      

// separate logits:
. logit high   i.race i.collgrad , nolog                                             

Logistic regression                               Number of obs   =       1465       
                                                  LR chi2(3)      =     154.21       
                                                  Prob > chi2     =     0.0000       
Log likelihood = -906.79453                       Pseudo R2       =     0.0784       

-------------------------------------------------------------------------------      
         high |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]      
--------------+----------------------------------------------------------------      
         race |                                                                      
       black  |  -.5309439   .1463507    -3.63   0.000     -.817786   -.2441017      
       other  |   .2670161   .5116686     0.52   0.602     -.735836    1.269868      
              |                                                                      
     collgrad |                                                                      
college grad  |   1.525834   .1347081    11.33   0.000     1.261811    1.789857      
        _cons |  -.6808361   .0694323    -9.81   0.000     -.816921   -.5447512      
-------------------------------------------------------------------------------      

. logit middle i.race i.collgrad , nolog                                             

Logistic regression                               Number of obs   =       1656       
                                                  LR chi2(3)      =      90.13       
                                                  Prob > chi2     =     0.0000       
Log likelihood = -1098.9988                       Pseudo R2       =     0.0394       

-------------------------------------------------------------------------------      
       middle |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]      
--------------+----------------------------------------------------------------      
         race |                                                                      
       black  |   .6942945   .1114418     6.23   0.000     .4758725    .9127164      
       other  |   .3492788   .5125802     0.68   0.496    -.6553598    1.353918      
              |                                                                      
     collgrad |                                                                      
college grad  |   .9979952   .1341664     7.44   0.000     .7350339    1.260957      
        _cons |  -.5287625   .0669093    -7.90   0.000    -.6599023   -.3976226      
-------------------------------------------------------------------------------

— মার্টেন বুইস
সূত্র

2

আপনি একটি "সমস্ত বনাম সমস্ত" পদ্ধতির চেষ্টা করতে পারেন, যেখানে আপনি ক্লাস যতগুলি বাইনারি ক্লাসিফায়ারকে প্রশিক্ষণ দেন। প্রতিটি শ্রেণিবদ্ধকারীর জন্য, ইতিবাচক নমুনাগুলি হ'ল সেই শ্রেণীর অন্তর্ভুক্ত এবং বাকীগুলি নেতিবাচক হয়, যাতে প্রতিটি লজিস্টিক শ্রেণিবদ্ধকারী আপনাকে শর্তযুক্ত সম্ভাবনা দেয় যে একটি কংক্রিট নমুনা সেই শ্রেণীর অন্তর্গত।

এখন, শ্রেণিবদ্ধকরণ করার সময়, আপনি প্রতিটি নতুন নমুনাকে শ্রেণিতে বরাদ্দ করেন যার জন্য সংশ্লিষ্ট শ্রেণিবদ্ধ আপনাকে সর্বোচ্চ সম্ভাবনা দেয়।

— jpmuc
সূত্র