সরল ইংরেজিতে আর ব্যবহার করে একটি কক্স আনুপাতিক বিপত্তি রিগ্রেশন মডেলটির ব্যাখ্যা এবং বৈধতা


14

কেউ কি আমার কক্স মডেলকে সরল ইংরেজিতে ব্যাখ্যা করতে পারেন?

আমি ফাংশনটি ব্যবহার করে আমার সমস্ত ডেটাতে নিম্নলিখিত কক্স রিগ্রেশন মডেলটি ফিট করেছি cph। আমার ডেটা বলা একটি অবজেক্টে সংরক্ষিত হয় Data। পরিবর্তনশীল w, xএবং yঅবিচ্ছিন্ন; zদুটি স্তরের একটি ফ্যাক্টর। সময় মাসগুলিতে পরিমাপ করা হয়। আমার রোগীদের কিছু পরিবর্তনশীল জন্য তথ্য অনুপস্থিত z( বিশেষ দ্রষ্টব্য : আমি যথাযথভাবে ডঃ Harrell এর পরামর্শ উল্লিখিত আছে, নিচে, যে আমি এই মান যাতে আরোপ এড়াতে হিসাবে আমার মডেল biasing, এবং ভবিষ্যতে তা করতে হবে)।

> fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12)

Cox Proportional Hazards Model
Frequencies of Missing Values Due to Each Variable
Surv(time, event)    w    x    y    z 
                0    0    0    0   14 

                Model Tests          Discrimination 
                                            Indexes        
Obs       152   LR chi2      8.33    R2       0.054    
Events     64   d.f.            4    g        0.437    
Center 0.7261   Pr(> chi2) 0.0803    gr       1.548    
                Score chi2   8.07                      
                Pr(> chi2) 0.0891                      

                   Coef    S.E.   Wald Z   Pr(>|Z|)
         w      -0.0133  0.0503    -0.26     0.7914  
         x      -0.0388  0.0351    -1.11     0.2679  
         y      -0.0363  0.0491    -0.74     0.4600  
         z=1     0.3208  0.2540     1.26     0.2067

আমি cox.zphনীচে নীচের কমান্ডটি ব্যবহার করে আনুপাতিক বিপদের ধারণা অনুধাবন করার চেষ্টা করেছি , তবে কীভাবে এর ফলাফলগুলি ব্যাখ্যা করতে হয় তাও জানি না। ফেলে plot()কমান্ড প্রায় একটি ত্রুটির বার্তা দেয়।

 cox.zph(fit, transform="km", global=TRUE)
            rho chisq      p
 w      -0.1125 1.312 0.2520
 x       0.0402 0.179 0.6725
 y       0.2349 4.527 0.0334
 z=1     0.0906 0.512 0.4742
 GLOBAL      NA 5.558 0.2347

প্রথম সমস্যা

  • কেউ কি আমাকে উপরের আউটপুট ফলাফলগুলি সরল ইংরেজিতে ব্যাখ্যা করতে পারে? আমার একটি চিকিত্সা ব্যাকগ্রাউন্ড আছে এবং পরিসংখ্যান সম্পর্কে কোনও আনুষ্ঠানিক প্রশিক্ষণ নেই।

দ্বিতীয় সমস্যা

  • ডঃ হ্যারেলের পরামর্শ অনুসারে, আমি rmsপ্যাকেজটি ব্যবহার করে 10-গুণ ক্রস-বৈধকরণের 100 পুনরাবৃত্তিগুলি সম্পাদন করে অভ্যন্তরীণভাবে আমার মডেলটিকে বৈধতা দিতে চাই (যা আমি বুঝতে পারি তাতে এটি 100 * 10 = 1000বিভিন্ন মডেল তৈরি করতে বাধ্য হবে এবং তারপরে বেঁচে থাকার সময়ের পূর্বাভাস দিতে বলবে) রোগীদের যা তারা কখনও দেখেনি)।

    আমি validateফাংশনটি ব্যবহার করার চেষ্টা করেছি , যেমনটি দেখানো হয়েছে।

    > v1 <- validate(fit, method="crossvalidation", B = 10, dxy=T)
    > v1
          index.orig training    test optimism index.corrected  n
    Dxy      -0.2542  -0.2578 -0.1356  -0.1223         -0.1320 10
    R2        0.0543   0.0565  0.1372  -0.0806          0.1350 10
    Slope     1.0000   1.0000  0.9107   0.0893          0.9107 10
    D         0.0122   0.0128  0.0404  -0.0276          0.0397 10
    U        -0.0033  -0.0038  0.0873  -0.0911          0.0878 10
    Q         0.0155   0.0166 -0.0470   0.0636         -0.0481 10
    g         0.4369   0.4424  0.6754  -0.2331          0.6700 10
    

    আপনি কীভাবে 100x পুনর্নির্মাণের কাজটি করবেন? আমি মনে করি আমার উপরের কোডটি কেবল একবার ক্রস-বৈধকরণ সম্পাদন করে।

  • আমি তখন জানতে চেয়েছিলাম আমার মডেলটি কতটা ভাল ছিল তা পূর্বাভাসে। আমি নিম্নলিখিত চেষ্টা করেছিলাম:

    > c_index <- abs(v1[1,5])/2 + 0.5
    > c_index
    [1] 0.565984
    

    এর অর্থ কি এই যে আমার মডেলটি একটি মুদ্রা উল্টানোর চেয়ে খুব সামান্য ভাল?

তৃতীয় সমস্যা

ডাঃ হ্যারেল উল্লেখ করেছেন যে আমি কোভারিয়েট প্রভাবগুলির জন্য রৈখিকতা ধরে নিয়েছি এবং আমার নমুনায় ইভেন্টের সংখ্যা কেবলমাত্র নির্ভরযোগ্য মডেল ফিট করার পক্ষে যথেষ্ট বড় যদি সমস্ত কোভারিয়েট প্রভাব লিনিয়ার হতে পারে।

  • এর অর্থ কি এই যে আমার মডেলটিতে কোনও ধরণের ইন্টারঅ্যাকশন শব্দটি অন্তর্ভুক্ত করা উচিত? যদি তাই হয় তবে কোন পরামর্শ কী রাখবেন?

2
আমি আমার প্রাথমিক প্রশ্নে কিছু বড় সম্পাদনা করেছি, উপরে, আমি প্রাথমিকভাবে এটি জিজ্ঞাসা করার প্রায় তিন ঘন্টা পরে। আমি ডঃ হ্যারেলের খুব সহায়ক পরামর্শ অনুসরণ করার চেষ্টা করেছি। যদি কেউ cphআমাকে উপরের আউটপুটটি সরল ইংরেজিতে ব্যাখ্যা করার চেষ্টা করে বা আমাকে এমন কোনও রেফারেন্সের দিকে নির্দেশ করে তবে আমি সত্যই এটির প্রশংসা করব। ডাঃ হ্যারেল, এ পর্যন্ত আপনার সহায়তার জন্য অনেক ধন্যবাদ!
আলেকজান্ডার

উত্তর:


13

শুরু করতে, কয়েকটি বিষয় বিবেচনা করুন। প্রথমত, আপনি নিখোঁজ ডেটা সহ অনেকগুলি পর্যবেক্ষণ বাদ দিচ্ছেন এবং এর ফলে পক্ষপাত হবে। একাধিক অনুশাসন বিবেচনা করুন। দ্বিতীয়ত, এখানে একটি প্লট পদ্ধতি রয়েছেcox.zphযা আনুপাতিক বিপদ নির্ধারণে কার্যকর। তৃতীয়ত, আপনি কোভারিয়েট প্রভাবগুলির জন্য রৈখিকতা ধরে নিয়েছেন। চতুর্থত, আপনার প্রশিক্ষণের নমুনায় ইভেন্টগুলির সংখ্যা কেবলমাত্র নির্ভরযোগ্য মডেল ফিট করার পক্ষে যথেষ্ট বড় যদি সমস্ত কোরিয়াট প্রভাবগুলি রৈখিক হয় (যা বিরল)। ভবিষ্যদ্বাণী নির্ভুলতার একটি নির্ভরযোগ্য মূল্যায়ন পাওয়ার আগে আপনার পরীক্ষার নমুনায় সম্ভবত 400 টি ইভেন্ট থাকতে হবে। এটি পরিষ্কার নয় যে আপনার কাছে ডেটা দুটি ভাগে বিভক্ত করার জন্য যথেষ্ট পরিমাণ ডেটা ছিল। পুনঃনির্মাণ বৈধতা (10-ভাঁজ ক্রস-বৈধকরণের 100 পুনরাবৃত্তি, বা বুটস্ট্র্যাপ ব্যবহার করুন) একটি আরও ভাল সমাধান। আপনার মূল বহিরাগত বৈধতা (ফাংশন উভয় rcorr.censএবং val.surv) এবং অভ্যন্তরীণ বৈধতা রীস্যাম্পেলিং (ফাংশন validate, calibrate) আর বাস্তবায়িত হয় rmsপ্যাকেজ। জন্য কেস স্টাডিrms2×2


1
ডাঃ হ্যারেল, আপনার মন্তব্যের জন্য একগুচ্ছ ধন্যবাদ। আমি টাইপ করার চেষ্টা করেছি plot(cox.zph(fit[[1]], transform="km", global=TRUE)), তবে এটির ফল হয়েছে Error in plot.cox.zph(cox.zph(fit[[1]], transform = "km", global = TRUE)) : Spline fit is singular, try a smaller degrees of freedom। আমি কি এই ফাংশনটিকে ভুলভাবে কল করছি?
আলেকজান্ডার

1
যদি আমি আমার প্রশিক্ষণ এবং বৈধতা ডেটা একত্রিত করি, 75 টি ইভেন্টের সাথে আমার 166 টি পর্যবেক্ষণ রয়েছে। আপনার প্রস্তাব অনুসারে, আমি আমার 13 টি পর্যবেক্ষণের জন্য সেই সমস্যাটি দূর করে যারা "ডেটা" অনুপস্থিত রয়েছে তার জন্য আমার পরিবর্তনশীল "z" এর মানগুলি গুনতে পারি। আমি আপনার 100x 10-গুণ ক্রস-বৈধকরণ সম্পাদনের পরামর্শটি পছন্দ করি। আপনার যদি সময় থাকে তবে আমি কীভাবে এটি করতে আরএমএস প্যাকেজগুলি ব্যবহার করতে পারি তার জন্য কোনও কংক্রিট ইঙ্গিতের আরও প্রস্তাব দিতে পারলে আমি সত্যিই এটির প্রশংসা করব। মধ্য সময়ে, আমি আপনার ওয়েবসাইটের মাধ্যমে পড়া চালিয়ে যাব। আমি ভবিষ্যতে আপনার কোর্স গ্রহণ করতে চাই। দুর্ভাগ্যক্রমে, আমি এই মুহুর্তে ইউরোপে আছি, কিছুটা দূরে!
আলেকজান্ডার

2
এককত্ব সমস্যা জন্য, না plot(cox.zph(...), df=2)। উদাহরণস্বরূপ কোর্সের নোটগুলিতে কেস স্টাডি দেখুন rmsবা প্যাকেজটি ইনস্টল করুন (যা Hmiscপ্যাকেজেরও দরকার) এবং সহায়তা ফাইল আনার জন্য এই আদেশগুলি টাইপ করুন:?cph ?validate.cph ?calibrate.cph
ফ্রাঙ্ক হ্যারেল

2
আপনার সাহায্যের জন্য আবার ধন্যবাদ! এই উইকএন্ডে আমি আপনার কোর্স নোটগুলি মুদ্রণ করেছি এবং এই সপ্তাহে সেগুলি পড়তে এবং কেস স্টাডিজের মধ্য দিয়ে কাটিয়ে দেব।
আলেকজান্ডার

4

প্রাসঙ্গিক উদাহরণের ভিত্তিতে আর সিএফএফ ফাংশনটির আউটপুট জে ফক্সের অনুসরণযোগ্য এই পেপারে ব্যাখ্যা করা হয়েছে ।

আপনি যদি ইতিমধ্যে না থাকেন তবে আমি দৃ adv়ভাবে এই কাগজটি পড়ার পরামর্শ দেব।


1
আপনি কী বর্ণনা করতে পারেন যে কীভাবে কাগজ cphআউটপুটকে ব্যাখ্যা করার পরামর্শ দেয় ?
স্মিলিগ

2
+1 রেফারেন্সের জন্য ধন্যবাদ এবং এই সাইটে আপনাকে স্বাগতম! আপনি নিজেরাই দাঁড়াতে পারে এমন উত্তরগুলির জন্য প্রচেষ্টা করার সাথে সাথে আপনি যদি কাগজের বিষয়বস্তুর একটি সংক্ষিপ্ত বিবরণ দিতে পারেন তবে এটি দুর্দান্ত হবে।
গালা

এই লিঙ্কটি সেখানে আর নেই
মার্সিন Kosiński

1
লিঙ্কটি সোশ্যালসিয়েন্সেস.ম্যাকমাস্টার.সিএ / জেফক্স / বইস / কমপ্যানিয়ন -১ ই / currently বর্তমানে কাজ করছে এবং এই উত্তরটিতে উল্লিখিত একই কাগজ বলে মনে হচ্ছে।
dnlbrky
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.