পৃথক সময় বেঁচে থাকার বিশ্লেষণ সম্পর্কে প্রাথমিক প্রশ্ন


18

আমি একটি লজিস্টিক রিগ্রেশন মডেল ব্যবহার করে একটি বিচ্ছিন্ন সময় বেঁচে থাকার বিশ্লেষণ চালিয়ে যাওয়ার চেষ্টা করছি এবং আমি নিশ্চিত না যে আমি প্রক্রিয়াটি পুরোপুরি বুঝতে পেরেছি। আমি কয়েকটি প্রাথমিক প্রশ্ন সহ সহায়তার প্রশংসা করব।

এখানে সেট আপ করা হয়েছে:

আমি পাঁচ বছরের সময় উইন্ডোর মধ্যে একটি গ্রুপে সদস্যতার দিকে তাকিয়ে আছি। প্রতিটি সদস্যের প্রতি মাসে সদস্যের একটি মাসিক রেকর্ড থাকে যে সদস্য দলে থাকে। আমি পাঁচ সদস্যের উইন্ডোয়ের সময় যাদের সদস্যপদ শুরু হয়েছিল তাদের সমস্ত সদস্য বিবেচনা করছি (যারা আগে যোগ দিয়েছিলেন তাদের সাথে "বাম সেন্সরশিপ" সমস্যা এড়াতে)। প্রতিটি রেকর্ড সময় অনুসারে সূচীকরণ করা হবে, সময়টির সাথে সাথে সদস্যটি যোগদানের এক মাস হবে। সুতরাং, যে সদস্যটি আড়াই বছর অবস্থান করবেন তার ত্রিশ মাসিক রেকর্ড থাকবে, যার সংখ্যা এক থেকে ত্রিশ পর্যন্ত। প্রতিটি রেকর্ডকে বাইনারি ভেরিয়েবলও দেওয়া হবে, যার সদস্যতার শেষ মাসের জন্য একটির মান এবং অন্যথায় শূন্য থাকবে; বাইনারি ভেরিয়েবলের জন্য একটির মান সেই ইভেন্টটিকে চিহ্নিত করে যে সদস্যটি গ্রুপটি রেখে গেছে। প্রত্যেক সদস্যের জন্য যার সদস্যপদ পাঁচ বছরের বিশ্লেষণ উইন্ডো ছাড়িয়ে চলেছে,

সুতরাং, লজিস্টিক রিগ্রেশন মডেল বাইনারি ইভেন্ট ভেরিয়েবলের মানগুলি পূর্বাভাস দেওয়ার জন্য নির্মিত। এ পর্যন্ত সব ঠিকই. বাইনারি ভবিষ্যদ্বাণীপূর্ণ মডেলটি মূল্যায়নের অন্যতম সাধারণ উপায় হোল্ডআউট নমুনায় লিফটটি পরিমাপ করা। লজিস্টিক রিগ্রেশন মডেলটির জন্য আমি সদস্যতা সমাপ্ত ইভেন্টটির পূর্বাভাস তৈরি করেছি, ইভেন্টগুলিতে অ ইভেন্টগুলির পাঁচ থেকে এক অনুপাত সহ একটি হোল্ডআউট ডেটা সেট আমি লিফটটি গণনা করেছি। আমি পূর্বাভাসিত মানকে ডেস্কলসে স্থান দিয়েছি। সর্বাধিক পূর্বাভাসিত মানগুলির সাথে ডেসিলিতে সত্তর শতাংশ রয়েছে, চারটিরও বেশি লিফট। মিলিত প্রথম দুটি ডেসিল হোল্ডআউটে থাকা সমস্তগুলির মধ্যে পঁয়ত্রিশ শতাংশ থাকে। কিছু নির্দিষ্ট প্রসঙ্গে এটি একটি মোটামুটি শালীন ভবিষ্যদ্বাণীমূলক মডেল হিসাবে বিবেচিত হবে, তবে আমি অবাক হয়েছি যে বেঁচে থাকার বিশ্লেষণ চালানোর পক্ষে এটি যথেষ্ট ভাল কিনা।

যাক ব্যক্তির জন্য বিপত্তি ফাংশন হবে মাসে , এবং দিন সম্ভাব্যতা হতে পৃথক মাস মাধ্যমে জীবিত থাকেন ।কে এস [ জে , কে ] কেh[j,k]jkS[j,k]jk

আমার মৌলিক প্রশ্নগুলি এখানে:

  1. পৃথক ঝুঁকি ফাংশন, , প্রতি মাসে অস্তিত্ব থেকে বেঁচে থাকার (গ্রুপ ছেড়ে চলে যাওয়ার) শর্তযুক্ত সম্ভাবনা কি?h[j,k]

  2. ঝুঁকি ফাংশনের লজিস্টিক রিগ্রেশন মডেল অনুমান থেকে ভবিষ্যদ্বাণী করা মানগুলি কি? (যেমন, মাসে পৃথক জন্য পূর্বাভাসিত মানের সমান , বা বিপদ কার্যকারিতা অনুমানের জন্য আরও কিছু করা দরকার?)জে কেh[j,k]jk

  3. পৃথক জন্য মাসের Q 'র বেঁচে থাকা পর্যন্ত সম্ভাব্যতা এক গুণফল বিয়োগ মাস এক আপ থেকে বিপত্তি ফাংশন সমান , যে করে ?q এসjqS[j,q]=(1h[j,1])(1h[j,2])(1h[j,q])

  4. গড় মান সব ব্যক্তিদের উপর প্রতিটি সময় জন্য সামগ্রিক জনসংখ্যার গড় বেঁচে থাকার সম্ভাবনা একটি যুক্তিসঙ্গত অনুমান?কেS[j,k]jk

  5. সামগ্রিক জনসংখ্যার একটি প্লট মাসিক কাপলান-মিয়ার গ্রাফের সাথে মাসিকের মতো বেঁচে থাকার সম্ভাবনাটি কি মিলবে?

যদি এই প্রশ্নের কোনওটির উত্তর না হয় তবে আমার একটি গুরুতর ভুল বোঝাবুঝি হচ্ছে এবং আমি কিছুটা সহায়তা / ব্যাখ্যা ব্যবহার করতে পারি। এছাড়াও, একটি সঠিক বেঁচে থাকার প্রোফাইল তৈরি করার জন্য বাইনারি প্রেডিকটিভ মডেলটির কতটা ভাল হওয়া দরকার তার কোনও থাম্বের কোনও নিয়ম আছে?


হয়তো এই আপনার কিছু প্রশ্নের সঙ্গে আপনি সাহায্য করতে পারেন
jujae

উত্তর:


7

ধরে K সর্ববৃহৎ মান k (অর্থাত বৃহত্তম মাস / সময়সীমা আপনার ডেটা পরিলক্ষিত)।

  1. এখানে একটি সময় সম্পূর্ণরূপে বিযুক্ত parametrization সঙ্গে বিপত্তি ফাংশন, এবং প্যারামিটার একটি ভেক্টর দিয়ে B কন্ডিশনার ভেরিয়েবল একটি ভেক্টর X : hj,k=eαk+BX1+eαk+BX । বিপদ ফাংশনটি সময়ের বিকল্প প্যারামিটারাইজেশন (যেমন,kবা মডেলের একটি ভেরিয়েবল হিসাবে এর ফাংশনগুলিঅন্তর্ভুক্ত) বা উভয়ের একটি হাইব্রিডের আশেপাশে নির্মিত হতে পারে।

    বেসলাইন logit বিপত্তি ফাংশন টাইমে ইভেন্টের সংঘটন সম্ভাবনা বর্ণনা k , সময় বেঁচে থাকার উপর শর্তাধীন k । মডেলটিতে ভবিষ্যদ্বাণীকারীদের ( X ) যুক্ত করা এই শর্তটিকে আরও সীমাবদ্ধ করে।

  2. না, লজিস্টিক রিগ্রেশন অনুমান α^1 , , α কে , বি ) হয় না বিপত্তি ফাংশন নিজেদের। লজিস্টিক রিগ্রেশন মডেল: লজিট ( এইচ জে , কে ) = α কে + বি এক্স , এবং বিপদের প্রাক্কলনগুলি পেতে আপনাকে উপরের (1) এন্টি-লজিট ট্রান্সফর্মটি সম্পাদন করতে হবে।α^KB^(hj,k)=αk+BX

  3. হ্যাঁ. যদিও আমি এটা notate হবে এস, কুই = Π কুই আমি = 1 ( 1 - , আমি ) । বেঁচে থাকার কাজটি সময় কে দ্বারা ইভেন্টটি অনুভব না করার সম্ভাবনা এবং সম্ভবত এক্স- এও শর্তযুক্ত হতে পারে ।S^j,q=i=1q(1hj,i)kX

  4. এটি একটি সূক্ষ্ম প্রশ্ন, আমার উত্তর আছে তা নিশ্চিত নয়। যদিও আমার কাছে প্রশ্ন আছে। :) প্রতিটি সময় পিরিয়ডে নমুনার আকার ডান-সেন্সরিংয়ের কারণে এবং ইভেন্টের কারণে সময়ের সাথে সাথে হ্রাস পায়: আপনি কীভাবে বেঁচে থাকার সময় গণনা করে এই জন্য অ্যাকাউন্ট করবেন? কিভাবে? "জনসংখ্যা" বলতে কী বোঝ? আপনার অধ্যয়নের জন্য ব্যক্তিরা কোন জনসংখ্যায় সাধারণীকরণ করছেন? বা আপনি কিছু পরিসংখ্যান "সুপার-জনসংখ্যা" ধারণা বোঝাতে চান? অনুমান একটি হল বড় , এই মডেল চ্যালেঞ্জ কারণ আমরা অনুমান β s এবং তাদের মান ত্রুটি কিন্তু ব-দ্বীপ-পদ্ধতি যা করতে প্রয়োজন ব্যাক ফ্লিপ জন্য মান ত্রুটি পেতে , , এবং (আমার নিজের কাজ থেকে) বৈধ মান আহরিত জন্য ত্রুটি এসh^j,kS^j,k শুধুমাত্র কাগজে কাজ করে (আমি সঠিক সি আই coverages পেতে পারে না এস, শর্তসাপেক্ষ মডেল)।S^j,k

  5. আপনি কাপ্লান-মেয়ের মতো ধাপে-ফাংশন গ্রাফগুলি ব্যবহার করতে পারেন এবং আপনি সরাসরি লাইন গ্রাফগুলিও ব্যবহার করতে পারেন (অর্থাত্ একটি লাইনের সাথে সময়সীমার মধ্যে বিন্দুগুলি সংযুক্ত করুন)। আপনার পরবর্তী ক্ষেত্রে কেবল তখনই ব্যবহার করা উচিত যখন "বিচ্ছিন্ন সময়" ধারণাটি নিজেই বিভক্ত সময়কালের সম্ভাবনা স্বীকার করে। আপনি ক্রমবর্ধমান ঘটনাগুলির অনুমানেরও পরিকল্পনা / যোগাযোগ করতে পারেন (যা 1Sj,k ... কমপক্ষে মহামারীবিজ্ঞানীরা প্রায়শই "ক্রমসংক্রান্ত ঘটনা" সংজ্ঞায়িত করবেন, শব্দটি প্রতিযোগিতামূলক ঝুঁকির মডেলগুলিতে পৃথকভাবে ব্যবহৃত হয়। শব্দটি আপটেকও হতে পারে এখানে ব্যবহার করা হবে।)।


আমি মনে করি প্রশ্ন 2-এ, ওপি লজিস্টিকাল মডেল থেকে পূর্বাভাসিত মান সম্পর্কে জিজ্ঞাসা করছে, রিগ্রেশন সহগের অনুমানগুলি নয়। এই প্রাসঙ্গিক হতে পারে
jujae

@jujae আমি স্পষ্টভাবে # 2 আমার উত্তর লজিস্টিক ফাংশন দিয়েছে, এবং বিরোধী logit ব্যবহারের ওপি মনোযোগ নির্দেশ মধ্যে logit পরামিতি অনুমান রুপান্তর ( T ) , তাই আমি আপনার মন্তব্যের বুঝতে করছি না। h^(t)
অ্যালেক্সিস

কোনও লজিস্টিক মডেলের পূর্বাভাসকৃত মানটি বাইনারি আরভির সাফল্যের সম্ভাবনা যেমন এমন হয় না যে কোনও পিঁপড়া-লগিটের প্রয়োজন হয় না। তা কি ? ypred=exp(βTx)/(1+exp(βTx))
jujae

মূল প্রশ্ন 2 এ ফিরে, ওপি জিজ্ঞাসা করেছিল: "বিপদ কার্যকারিতার লজিস্টিক রিগ্রেশন মডেল অনুমানের দ্বারা অনুমান করা মানগুলি কি?" আমি হ্যাঁ বলব (যদি আমার পূর্বাভাসীকৃত মানটি সঠিক হয়)। এবং আপনি না বলছেন এবং যুক্তি দিন যে অনুমানের সহগগুলি বিপদ অনুমানের মতো নয়। আমি আপনার বক্তব্যের সাথে একমত, এগুলি সঠিক তবে ওপি আমার বোধগম্যতা থেকে যা চেয়েছিল তা নয়।
jujae

And for questions 4, I think OP is asking about the survival probability at each interval k and the average of the estimated S^j(k) is indeed a reasonable estimator for S(k). In your answer, you are first referring to mean survival time which is confusing to me as a reader. Meanwhile, I also believe that the estimator we are discussing is essentially Kaplan-meier, and (for instance) Greenwood's variance estimator for KM can be directly used and I fail to appreciate the difficulties you stated above about the calculation of the variances.
jujae
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.