আপডেট : অন্য আপডেটের জন্য দুঃখিত তবে আমি ভগ্নাংশের বহুপদী এবং প্রতিযোগিতামূলক ঝুঁকি-প্যাকেজের সাথে কিছু সম্ভাব্য সমাধান পেয়েছি যার সাথে আমার কিছু সহায়তা দরকার।
সমস্যাটি
আমি কোনও সময় নির্ভর সহগ বিশ্লেষণটি আর এ করার সহজ উপায়টি খুঁজে পাচ্ছি না I
সম্ভাব্য সমাধান
1) ডেটাসেট বিভক্ত করা
আমি তাকিয়েছি এই উদাহরণটি (ল্যাব সেশনের ২ য় অংশ) তবে আলাদা একটি ডেটাসেট তৈরি করা জটিল, গণনা ব্যয়বহুল এবং খুব স্বজ্ঞাত নয় বলে মনে হচ্ছে ...
2) হ্রাস র্যাঙ্কের মডেলগুলি - কক্সভিসি প্যাকেজ
Coxvc প্যাকেজ সমস্যা সাথে ডিল করার একটি মার্জিত উপায় প্রদান করে - এখানে একটি ব্যাপার ম্যানুয়াল । সমস্যাটি হ'ল লেখক আর প্যাকেজটি বিকাশ করছেন না (শেষ সংস্করণটি 05/23/2007 সাল থেকে) কিছু ইমেল কথোপকথনের পরে আমি প্যাকেজটি কাজ করতে পেরেছি তবে আমার ডেটাসেটে এক রান লেগেছিল 5 ঘন্টা (140 000) এন্ট্রি) এবং পিরিয়ড শেষে চরম অনুমান দেয়। আপনি এখানে সামান্য আপডেট প্যাকেজ পেতে পারেন - আমি বেশিরভাগই সবেমাত্র প্লটের কার্যকারিতা আপডেট করেছি।
এটি কেবল টুইট করার প্রশ্ন হতে পারে তবে যেহেতু সফ্টওয়্যারটি সহজেই আত্মবিশ্বাসের ব্যবধান সরবরাহ করে না এবং প্রক্রিয়াটি এতটা সময়সাপেক্ষ তাই আমি অন্যান্য সমাধানে এখনই দেখছি।
3) টাইমরেগ প্যাকেজ
চিত্তাকর্ষক টাইমারেজ প্যাকেজটিও সমস্যার সমাধান করে তবে আমি কীভাবে এটি ব্যবহার করব সে সম্পর্কে আমি নিশ্চিত নই এবং এটি আমাকে একটি মসৃণ প্লট দেয় না।
4) ভগ্নাংশ বহু বহু সময় (এফপিটি) মডেল
আমি "সময়ের মূল্যায়ন - চিকিত্সা এবং প্রগনোস্টিক কারণগুলির দীর্ঘমেয়াদী প্রভাবগুলি" সময়ের উপর অনিকা বুচহলজের দুর্দান্ত গবেষণামূলক সন্ধান পেয়েছি যা বিভিন্ন মডেলকে কভার করে একটি দুর্দান্ত কাজ করে। তিনি উপসংহারে পৌঁছেছেন যে সৌরব্রেই এট আল এর প্রস্তাবিত এফপিটি সময় নির্ভর নির্ভর সহগের জন্য সবচেয়ে উপযুক্ত বলে মনে হচ্ছে:
সময়-পরিবর্তিত প্রভাবগুলি সনাক্ত করতে এফপিটি খুব ভাল, যখন হ্রাস র্যাঙ্কের পদ্ধতির ফলে খুব জটিল মডেল তৈরি হয়, কারণ এতে সময়-পরিবর্তিত প্রভাবগুলির নির্বাচন অন্তর্ভুক্ত নয়।
গবেষণাটি খুব সম্পূর্ণ বলে মনে হচ্ছে তবে এটি আমার কাছে ধরাছোঁয়ার বাইরে। আমিও কিছুটা ভাবছি যেহেতু সে সৌরব্রির সাথে কাজ করতে পারে। যদিও এটির শব্দটি দুর্দান্ত বলে মনে হচ্ছে এবং এমপিপি প্যাকেজটি দিয়ে বিশ্লেষণটি করা যেতে পারে বলে আমি মনে করি তবে কীভাবে তা নিশ্চিত তা আমি নিশ্চিত নই।
5) cmprsk প্যাকেজ
আমি আমার প্রতিযোগিতামূলক ঝুঁকি বিশ্লেষণ করার কথা ভাবছিলাম কিন্তু গণনাগুলি সময় সাপেক্ষ হয়ে যায় তাই আমি নিয়মিত কক্স রিগ্রেশনটিতে চলে যাই। CRR সময় নির্ভরশীল covariates জন্য একটি বিকল্প thoug আছে:
....
cov2 matrix of covariates that will be multiplied
by functions of time; if used, often these
covariates would also appear in cov1 to give
a prop hazards effect plus a time interaction
....
চতুর্ভুজ উদাহরণ আছে কিন্তু আমি সময়টি আসলে উপস্থিত হয় যেখানে আমি পুরোপুরি অনুসরণ না এবং এটি প্রদর্শন করার জন্য আমি নিশ্চিত নই। আমি টেস্ট.আর ফাইলটিও দেখেছি তবে উদাহরণটি মূলত একই ...
আমার উদাহরণ কোড
এখানে একটি উদাহরণ যা আমি বিভিন্ন সম্ভাবনার পরীক্ষার জন্য ব্যবহার করি
library("survival")
library("timereg")
data(sTRACE)
# Basic cox regression
surv <- with(sTRACE, Surv(time/365,status==9))
fit1 <- coxph(surv~age+sex+diabetes+chf+vf, data=sTRACE)
check <- cox.zph(fit1)
print(check)
plot(check, resid=F)
# vf seems to be the most time varying
######################################
# Do the analysis with the code from #
# the example that I've found #
######################################
# Split the dataset according to the splitSurv() from prof. Wesley O. Johnson
# http://anson.ucdavis.edu/~johnson/st222/lab8/splitSurv.ssc
new_split_dataset = splitSuv(sTRACE$time/365, sTRACE$status==9, sTRACE[, grep("(age|sex|diabetes|chf|vf)", names(sTRACE))])
surv2 <- with(new_split_dataset, Surv(start, stop, event))
fit2 <- coxph(surv2~age+sex+diabetes+chf+I(pspline(stop)*vf), data=new_split_dataset)
print(fit2)
######################################
# Do the analysis by just straifying #
######################################
fit3 <- coxph(surv~age+sex+diabetes+chf+strata(vf), data=sTRACE)
print(fit3)
# High computational cost!
# The price for 259 events
sum((sTRACE$status==9)*1)
# ~240 times larger dataset!
NROW(new_split_dataset)/NROW(sTRACE)
########################################
# Do the analysis with the coxvc and #
# the timecox from the timereg library #
########################################
Ft_1 <- cbind(rep(1,nrow(sTRACE)),bs(sTRACE$time/365,df=3))
fit_coxvc1 <- coxvc(surv~vf+sex, Ft_1, rank=2, data=sTRACE)
fit_coxvc2 <- coxvc(surv~vf+sex, Ft_1, rank=1, data=sTRACE)
Ft_3 <- cbind(rep(1,nrow(sTRACE)),bs(sTRACE$time/365,df=5))
fit_coxvc3 <- coxvc(surv~vf+sex, Ft_3, rank=2, data=sTRACE)
layout(matrix(1:3, ncol=1))
my_plotcoxvc <- function(fit, fun="effects"){
plotcoxvc(fit,fun=fun,xlab='time in years', ylim=c(-1,1), legend_x=.010)
abline(0,0, lty=2, col=rgb(.5,.5,.5,.5))
title(paste("B-spline =", NCOL(fit$Ftime)-1, "df and rank =", fit$rank))
}
my_plotcoxvc(fit_coxvc1)
my_plotcoxvc(fit_coxvc2)
my_plotcoxvc(fit_coxvc3)
# Next group
my_plotcoxvc(fit_coxvc1)
fit_timecox1<-timecox(surv~sex + vf, data=sTRACE)
plot(fit_timecox1, xlab="time in years", specific.comps=c(2,3))
কোডগুলি এই গ্রাফগুলিতে ফলাফল: coxvc এবং coxvc এবং টাইমকক্স প্লটের বিভিন্ন সেটিংসের তুলনা । আমার ধারণা ফলাফলগুলি ঠিক আছে তবে আমি মনে করি না আমি টাইমকক্স গ্রাফটি ব্যাখ্যা করতে সক্ষম হব - এটি জটিল বলে মনে হচ্ছে ...
আমার (বর্তমান) প্রশ্ন
- আমি কীভাবে এফপিটি বিশ্লেষণ করব?
- আমি cmprsk এ সময় covariate কীভাবে ব্যবহার করব?
- আমি কীভাবে ফলাফলটি প্লট করব (অগ্রাধিকারের আত্মবিশ্বাসের অন্তর দিয়ে)?
y~x
y~x*(t+t^2)-t
y~x+x:t+x:t^2