রিগ্রেশন সহ লজিস্টিক রিগ্রেশন আর


12

আমি যুক্তরাজ্যে মাথার আঘাতের জাতীয় ট্রমা ডাটাবেস থেকে পূর্ববর্তী তথ্যগুলির ভিত্তিতে একটি লজিস্টিক রিগ্রেশন মডেল বিকাশ করছি। মূল ফলাফলটি হ'ল 30 দিনের মৃত্যুর হার ("বেঁচে থাকা" পরিমাপ হিসাবে চিহ্নিত)। পূর্ববর্তী গবেষণায় ফলাফলের উপর উল্লেখযোগ্য প্রভাবের প্রকাশিত প্রমাণ সহ অন্যান্য ব্যবস্থাগুলির মধ্যে রয়েছে:

Year - Year of procedure = 1994-2013
Age - Age of patient = 16.0-101.5
ISS - Injury Severity Score = 0-75
Sex - Gender of patient = Male or Female
inctoCran - Time from head injury to craniotomy in minutes = 0-2880 (After 2880 minutes is defined as a separate diagnosis)

এই মডেলগুলি ব্যবহার করে, দ্বৈতদৈর্ঘ্য নির্ভরশীল পরিবর্তনশীল দেওয়া, আমি lrm ব্যবহার করে একটি লজিস্টিক রিগ্রেশন তৈরি করেছি built

মডেল ভেরিয়েবল নির্বাচনের পদ্ধতি বিদ্যমান ক্লিনিকাল সাহিত্যের একই নির্ণয়ের মডেলিংয়ের উপর ভিত্তি করে ছিল। সকলেই আইএসএস ব্যতীত লিনিয়ার ফিটের সাথে মডেল হয়েছেন যা ভগ্নাংশ বহুপদী মাধ্যমে ialsতিহ্যগতভাবে মডেল করা হয়েছে। কোনও প্রকাশনা উপরের ভেরিয়েবলগুলির মধ্যে গুরুত্বপূর্ণ তাৎপর্য সনাক্ত করতে পারে নি।

ফ্র্যাঙ্ক হ্যারেলের পরামর্শের পরে আমি মডেল আইএসএসের প্রতি রিগ্রেশন স্প্লাইস ব্যবহার করে এগিয়ে চলেছি (নীচের মন্তব্যে হাইলাইট করা এই পদ্ধতির সুবিধা রয়েছে)। মডেলটি এভাবে নীচে পূর্বনির্ধারিত ছিল:

rcs.ASDH<-lrm(formula = Survive ~ Age + GCS + rcs(ISS) +
    Year + inctoCran + oth, data = ASDH_Paper1.1, x=TRUE, y=TRUE)

মডেলের ফলাফল ছিল:

> rcs.ASDH

Logistic Regression Model

lrm(formula = Survive ~ Age + GCS + rcs(ISS) + Year + inctoCran + 
    oth, data = ASDH_Paper1.1, x = TRUE, y = TRUE)

                      Model Likelihood     Discrimination    Rank Discrim.    
                         Ratio Test            Indexes          Indexes       
Obs          2135    LR chi2     342.48    R2       0.211    C       0.743    
 0            629    d.f.             8    g        1.195    Dxy     0.486    
 1           1506    Pr(> chi2) <0.0001    gr       3.303    gamma   0.487    
max |deriv| 5e-05                          gp       0.202    tau-a   0.202    
                                           Brier    0.176                     

          Coef     S.E.    Wald Z Pr(>|Z|)
Intercept -62.1040 18.8611 -3.29  0.0010  
Age        -0.0266  0.0030 -8.83  <0.0001 
GCS         0.1423  0.0135 10.56  <0.0001 
ISS        -0.2125  0.0393 -5.40  <0.0001 
ISS'        0.3706  0.1948  1.90  0.0572  
ISS''      -0.9544  0.7409 -1.29  0.1976  
Year        0.0339  0.0094  3.60  0.0003  
inctoCran   0.0003  0.0001  2.78  0.0054  
oth=1       0.3577  0.2009  1.78  0.0750  

আমি তখন মডেল থেকে ভবিষ্যদ্বাণীগুলির যথার্থতা নির্ধারণের জন্য আরএমএস প্যাকেজে ক্যালিব্রেট ফাংশনটি ব্যবহার করি। নিম্নলিখিত ফলাফল প্রাপ্ত হয়েছিল:

plot(calibrate(rcs.ASDH, B=1000), main="rcs.ASDH")

বুটস্ট্র্যাপ ক্যালিব্রেশন কার্ভগুলি ওভারফিটের জন্য দন্ডযুক্ত

মডেল ডিজাইনের সমাপ্তির পরে, আমি বেঁচে থাকার ঘটনার বছরের প্রভাব, ধারাবাহিক ভেরিয়েবলের মাঝারি মানের মূল্য এবং শ্রেণিবদ্ধ ভেরিয়েবলের মোডে ভিত্তি করে নিম্নলিখিত গ্রাফটি তৈরি করেছি:

ASDH <- Predict(rcs.ASDH, Year=seq(1994,2013,by=1),Age=48.7,ISS=25,inctoCran=356,Other=0,GCS=8,Sex="Male",neuroYN=1,neuroFirst=1)
Probabilities <- data.frame(cbind(ASDH$yhat,exp(ASDH$yhat)/(1+exp(ASDH$yhat)),exp(ASDH$lower)/(1+exp(ASDH$lower)),exp(ASDH$upper)/(1+exp(ASDH$upper))))
names(Probabilities) <- c("yhat","p.yhat","p.lower","p.upper")
ASDH<-merge(ASDH,Probabilities,by="yhat")
plot(ASDH$Year,ASDH$p.yhat,xlab="Year",ylab="Probability of Survival",main="30 Day Outcome Following Craniotomy for Acute SDH by Year", ylim=range(c(ASDH$p.lower,ASDH$p.upper)),pch=19)
arrows(ASDH$Year,ASDH$p.lower,ASDH$Year,ASDH$p.upper,length=0.05,angle=90,code=3)

উপরের কোডটি নিম্নলিখিত আউটপুটটির ফলস্বরূপ:

নিম্ন এবং উচ্চতর সঙ্গে বছরের প্রবণতা

আমার অবশিষ্ট প্রশ্নগুলি নিম্নলিখিত:

1. স্প্লাইন ব্যাখ্যা - সামগ্রিক ভেরিয়েবলের জন্য মেশানো স্প্লাইনের জন্য আমি কীভাবে পি-মান গণনা করতে পারি?


4
চমৎকার কাজ. বছরের প্রভাব প্রদর্শনের জন্য আমি অন্যান্য পরিবর্তনশীলগুলিকে ডিফল্ট মানগুলিতে (ধারাবাহিকের জন্য মাঝারি, শ্রেণীবদ্ধের জন্য মোড) সেট করার অনুমতি দিচ্ছি এবং এক্স-অক্ষের ক্ষেত্রে বছর পরিবর্তিত করে, উদাহরণস্বরূপ plot(Predict(rcs.ASDH, Year)),। আপনি অন্যান্য ভেরিয়েবলগুলিকে বিভিন্ন ধরণের বাঁক তৈরির মতো জিনিসগুলি করতে আলাদা করতে দিতে পারেন plot(Predict(rcs.ASDH, Year, age=c(25, 35)))
ফ্র্যাঙ্ক হ্যারেল

1
আমি জানি না কেন - তবে আমি সাহিত্যে পক্ষপাত সংশোধন ক্যালিব্রেশন রেখার অনেকগুলি উদাহরণ দেখিনি। একটি ভাল ধারণা মত মনে হয়
চার্লস

1
একাধিক df পরীক্ষা ব্যবহারের সাথে সামগ্রিক সংযোগ পরীক্ষা করতে anova(rcs.ASDH)
ফ্র্যাঙ্ক হ্যারেল

উত্তর:


8

আপনার ফলাফলগুলি ব্যাখ্যা করা খুব কঠিন যখন আপনি মডেলটি প্রাক-নির্দিষ্ট না করে উল্লেখযোগ্য পরীক্ষায় এবং ফলস্বরূপ মডেল পরিবর্তনগুলিতে নিযুক্ত হন। এবং আপনি যে ফিট ফিট ব্যবহার করেছেন তা বিশ্বজগতের জন্য আমি প্রস্তাব দিচ্ছি না কারণ এটির একটি হ্রাসযুক্ত বিতরণ রয়েছে and বিতরণ নয়।χ2

মডেল ফিটকে মূল্যায়নের দুটি প্রস্তাবিত উপায় হ'ল:

  1. পূর্বাভাসের নিখুঁত নির্ভুলতা পরীক্ষা করতে বুটস্ট্র্যাপ ওভারফিটিং-সংশোধন মসৃণ ননপ্যারামেট্রিক (যেমন, * লোস) ক্যালিব্রেশন বক্ররেখা
  2. মডেলের বিভিন্ন সাধারণীকরণ পরীক্ষা করুন, আরও নমনীয় মডেলের স্পেসিফিকেশন আরও ভাল কাজ করে কিনা তা পরীক্ষা করে। উদাহরণস্বরূপ, সম্ভাবনা অনুপাত বা ওয়াল্ড extra extra অতিরিক্ত ননলাইনার বা ইন্টারঅ্যাকশন শর্তাদি পরীক্ষা করুন।χ2

ভগ্নাংশের বহুভৌমতে রিগ্রেশন স্প্লাইজের কিছু সুবিধা রয়েছে, যার মধ্যে রয়েছে:

  1. পূর্বাভাসকের মান ; আপনি এফপি দ্বারা প্রয়োজনীয় যেমন লগগুলির লগ নিতে পারবেন না0
  2. একজন ভবিষ্যদ্বাণীকের উত্স সম্পর্কে আপনার চিন্তা করার দরকার নেই। এফপিগুলি অনুমান করে যে শূন্যটি ভবিষ্যদ্বাণীকারীদের জন্য একটি "যাদু" উত্স, যেখানে রিগ্রেশন স্প্লাইজগুলি একটি ধ্রুবক দ্বারা ভবিষ্যদ্বাণীকে স্থানান্তরিত করার জন্য আক্রমণাত্মক।

রিগ্রেশন স্প্লাইজস এবং লিনিয়ারিটি এবং অ্যাডিটিভিটি মূল্যায়ন সম্পর্কে আরও জানার জন্য আমার হ্যান্ডআউটগুলি http://biostat.mc.vanderbilt.edu/CourseBios330 দেখুন আর rmsপ্যাকেজ rcsফাংশনটি দেখুন। বুটস্ট্র্যাপ ক্যালিব্রেশন কার্ভগুলির জন্য ওভার ফিটিংয়ের জন্য দন্ডযুক্ত rms calibrateফাংশনটি দেখুন।


প্রাথমিকভাবে ক্লিনিকালি উপলব্ধ সমস্ত ভেরিয়েবল এবং ডায়াগনোসিস এবং ফলাফল ভেরিয়েবলের জ্ঞাত প্রাসঙ্গিকতা সহ একটি সম্পূর্ণ মডেল তৈরি করার জন্য আমি মডেলটি প্রাক-নির্দিষ্ট করার চেষ্টা করেছি। তারা সমস্ত লিনিয়ার অবিচ্ছিন্ন বা দ্বিধাত্বক ভেরিয়েবল ছিল আইএসএস ব্যতীত যা পূর্ববর্তী গবেষণাগুলি চিহ্নিত করেছে যেগুলি ভগ্নাংশের বহুভুজের সাহায্যে মডেল করা যেতে পারে। আমি বিশ্বাস করি যে মডেলটি আমি বিশ্বাস করি তার বিকাশ উইল সৌরব্রির "মাল্টিভারিয়েট মডেল-বিল্ডিং" এর সাথে সামঞ্জস্যপূর্ণ। আমি আপনার আরএমএস প্যাকেজটি আর-তে ব্যবহার করতে পারি যাতে ফিটের বৈশ্বিক goodশ্বর্যের মূল্যায়ন করতে পারি? যদি তা হয় তবে আপনি কোন সূত্রটি সুপারিশ করবেন?
ড্যান ফাউন্টেন

আমি এর কিছু সম্বোধনের জন্য আমার উত্তরটি প্রসারিত করেছি।
ফ্র্যাঙ্ক হ্যারেল

আপনি কি মডেল ফিটকে মূল্যায়নের জন্য 1 এবং 2 সম্পাদনের জন্য প্যাকেজগুলির পরামর্শ দিতে পারেন? আমি কি আরএমএসে বৈধতা ফাংশনটি ব্যবহার করতে পারি? রিগ্রেশন স্প্লাইজের ক্ষেত্রে, আমি আপনার লেকচার নোটগুলি পড়েছি এবং বর্তমানে আপনার বইয়ের একটি অনুলিপি সন্ধান করার চেষ্টা করছি (আমি যদি এটি করতে পারি তবে আমি এটি কিনে ফেলতাম!) আপনি কি রিগ্রেশন স্প্লাইস নির্মাণের জন্য আরও একটি আর প্যাকেজ / ফাংশন সুপারিশ করতে সক্ষম হবেন? এই মডেলটিতে অ-লিনিয়ার অবিচ্ছিন্ন পরিবর্তনশীলগুলির জন্য? এখন পর্যন্ত আপনার সমস্ত সহায়তার জন্য অনেক ধন্যবাদ।
ড্যান ফাউন্টেন

সম্ভবত ফ্রেডম্যানের মাল্টিভিয়ারিয়েট অ্যাডাপটিভ রিগ্রেশন স্প্লাইনের উপর ভিত্তি করে পৃথিবী প্যাকেজ?
ড্যান ফাউন্টেন

একটি শেষ প্রশ্ন। ইনজুরি তীব্রতা স্কোর (আইএসএস) এর সূত্রটি হ'ল A ^ 2 + B ^ 2 + C ^ 2 যেখানে এ, বি এবং সি পৃথক আকারের ট্রমা তীব্রতার স্কোর 1-5 এর বিভিন্ন অংশ। সুতরাং এই ডেটা সেটটির মধ্যে সর্বাধিক 75 এবং সর্বনিম্ন 1। এই সূত্রটি দেওয়া, ভগ্নাংশের বহুপদীগুলি কি রিগ্রেশন স্প্লিনের তুলনায় স্কোরকে গণনা করা হয় তার আরও নিবিড় উপস্থাপনা হবে?
ড্যান ফাউন্টেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.