ক্রস বৈধকরণ এবং সাধারণ লজিস্টিক রিগ্রেশন reg


12

আমি অর্ডিনাল লজিস্টিক রিগ্রেশনটির জন্য ক্রস-বৈধতা বোঝার চেষ্টা করছি। গেমটির লক্ষ্য হ'ল একটি বিশ্লেষণে ব্যবহৃত মডেলটিকে বৈধতা দেওয়া ...

আমি প্রথমে খেলনা ডেটা সেট তৈরি করি:

set.seed(1)
N <- 10000
# predictors
x1 <- runif(N)
x2 <- runif(N)
x3 <- runif(N)

# coeffs in the model
a <- c(-2,-1)
x <- -x1+2*x2+x3

# P( y ≤ i ) is given by logit^{-1} ( a[i]+x )
p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) )

# computing the probabilities of each category
q <- 1 - p[2,]
p[2,] <- p[2,] - p[1,];
p <- rbind(p,q);

# outcome
y <- ordered( apply( p, 2, function(p) which(rmultinom(1,1,p)>0) ) ) 

এখন, আমি lrmপ্যাকেজ ব্যবহার করে এটি মডেল ফিট rms

require("rms")
fit <- lrm(y~x1+x2+x3, x=TRUE,y=TRUE)


> fit

Logistic Regression Model

lrm(formula = y ~ x1 + x2 + x3, x = TRUE, y = TRUE)

                      Model Likelihood     Discrimination    Rank Discrim.
                         Ratio Test            Indexes          Indexes   
Obs         10000    LR chi2    1165.46    R2       0.126    C       0.664
 1           2837    d.f.             3    g        0.779    Dxy     0.328
 2           2126    Pr(> chi2) <0.0001    gr       2.178    gamma   0.329
 3           5037                          gp       0.147    tau-a   0.203
max |deriv| 4e-10                          Brier    0.187                 

     Coef    S.E.   Wald Z Pr(>|Z|)
y>=2  2.1048 0.0656  32.06 <0.0001
y>=3  1.0997 0.0630  17.45 <0.0001
x1    0.8157 0.0675  12.09 <0.0001
x2   -1.9790 0.0701 -28.21 <0.0001
x3   -1.0095 0.0687 -14.68 <0.0001

আমি ফলাফলের দ্বিতীয় অংশটি বুঝতে পারি: আমি মডেলটিতে যে সহগগুলি রেখেছি তা এখানে (এটি প্রায় নিখুঁত N = 100000)। সাইন রিভারসড কারণ আমার মডেল আমি coeffs ব্যবহৃত হচ্ছে মতভেদ গনা , এবং 2 , এখানে এটি অন্যান্য উপায়, আমি মনে করি অনেক বিষয় নয় আছে।12

তবে আমি বৈষম্য এবং র‌্যাঙ্ক বৈষম্য সূচকগুলি বুঝতে পারি না । আপনি কি আমাকে সাহায্য করতে পারেন?! কিছু পয়েন্টার?

যখন আমরা বৈধতা পেরিয়ে যাব তখন পরিস্থিতি আরও খারাপ হয় ...

> validate(fit, method="cross")
          index.orig training    test optimism index.corrected  n
Dxy           0.3278   0.3278  0.3290  -0.0012          0.3291 40
R2            0.1260   0.1260  0.1313  -0.0053          0.1313 40
Intercept     0.0000   0.0000 -0.0072   0.0072         -0.0072 40
Slope         1.0000   1.0000  1.0201  -0.0201          1.0201 40
Emax          0.0000   0.0000  0.0056   0.0056          0.0056 40
D             0.1164   0.1165  0.1186  -0.0021          0.1186 40
U            -0.0002  -0.0002 -0.8323   0.8321         -0.8323 40
Q             0.1166   0.1167  0.9509  -0.8342          0.9509 40
B             0.1865   0.1865  0.1867  -0.0001          0.1867 40
g             0.7786   0.7786  0.7928  -0.0142          0.7928 40
gp            0.1472   0.1472  0.1478  -0.0007          0.1478 40

Mmffff? এটা কী? আমি কীভাবে এটি ব্যাখ্যা করব? ম্যান পেজটি কয়েকটি ব্যাখ্যা দেয়, আমার এই কাগজে অ্যাক্সেস নেই ... এবং জটিলতার সমুদ্র দেখে আমি অভিভূত বোধ করি। সাহায্য করুন!

উত্তর:


11

index.origindex.correctedDxyDxyDxy=2(C12)CInterceptSlopeEmaxB

পদ্ধতিগুলি আমার বইতে বা বইয়ের ওয়েবসাইটে কোর্স নোটগুলিতে বর্ণিত হয়েছে: http://biostat.mc.vanderbilt.edu/rms


ধন্যবাদ, ফ্রাঙ্ক আপনার বই প্যাকেজ রেফার করে? এটিতে ডक्सीের আরও বিশদ রয়েছে?
এলভিস

1
DesignrmsDxy

ধন্যবাদ। আমি এটি ঘন্টা ধরে googled এবং আমি এটি পেলেন না। আমি তোমার বই কিনে দেব।
এলভিস

1

আপনার প্রথম প্রশ্নের জন্য: এগুলি বিভিন্ন মডেলের পারফরম্যান্স পরিমাপ measure আপনি চান তাদের কিছু বড় হোক, অন্যেরা ছোট হোক be আসলে এগুলি কোনওরকমভাবে সম্পর্কিত তাই আপনাকে পরামর্শ দেয় এক বা দুটিতে

আপনার দ্বিতীয় প্রশ্নের কাছে: আপনার প্রথম আর আউটপুটে যা রয়েছে তা হ'ল প্রশিক্ষণের নমুনায় আপনার মডেল পারফরম্যান্স। যখন আপনি ক্রস-বৈধকরণের মাধ্যমে বৈধকরণ করেন, আপনি একাধিক পরীক্ষার নমুনাগুলি এবং তাদের গড়ের উপর সেই পরিমাপগুলি পান। এটি আপনাকে কীভাবে আপনার মডেলটি সম্পাদন করে তার আরও বাস্তবসম্মত অনুমান দেয়।

আছে HTH

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.