গ্রুপগুলির মধ্যে মধ্যবর্তী বেঁচে থাকার তুলনা কীভাবে?


12

আমি এক ধরণের ক্যান্সারের জন্য বিভিন্ন রাজ্যে ক্যাপলান-মেয়ের ব্যবহার করে মধ্যস্থতা বেঁচে থাকি। রাজ্যগুলির মধ্যে বেশ বড় পার্থক্য রয়েছে। আমি কীভাবে সমস্ত রাজ্যের মধ্যবর্তী বেঁচে থাকার তুলনা করতে পারি এবং এটি নির্ধারণ করতে পারি যে সারা দেশ জুড়ে মধ্যযুগীয় বেঁচে থাকার চেয়ে গুরুত্বপূর্ণ কোনটি?


আপনি কি নমুনা আকার, সময় ফ্রেম,% বেঁচে থাকা ইত্যাদি সম্পর্কে কিছু ইঙ্গিত দিতে পারেন যাতে আমরা আপনার অধ্যয়নের নকশা সম্পর্কে আরও ভাল ধারণা পেতে পারি?
সিএল

বৃহত্তম মান ছাড়াও ডেটাতে সেন্সর করা মান আছে?
রোনাফ

ডেটাতে প্রকৃতপক্ষে সেন্সর করা মান রয়েছে এবং মোট জনসংখ্যা প্রায় 1500, মাঝারি সামগ্রিক বেঁচে থাকার বয়স 18 মাস (পরিসীমা 300-600 দিন) ... সময়সীমা 2000-2007 এর সময়কাল is
মিশা

উত্তর:


6

ক্যাপলান-মেয়ের বেঁচে থাকার বক্ররেখার সাথে একটি জিনিস মনে রাখতে হবে তা মূলত বর্ণনামূলক এবং অনুমানমূলক নয় । এটি কেবলমাত্র ডেটার একটি ফাংশন, এটির পিছনে রয়েছে অবিশ্বাস্যভাবে নমনীয় মডেল। এটি একটি শক্তি, কারণ এর অর্থ কার্যত এমন কোনও অনুমান যা ভেঙে যেতে পারে না, তবে একটি দুর্বলতা কারণ এটি সাধারণীকরণ করা শক্ত, এবং এটি "শব্দ" পাশাপাশি "সংকেত" ফিট করে। আপনি যদি একটি অনুমান করতে চান, তবে আপনাকে প্রাথমিকভাবে এমন কিছু উপস্থাপন করতে হবে যা আপনি জানতে চান এটি অজানা।

মধ্যবর্তী বেঁচে থাকার সময়ের তুলনা করার এখন একটি উপায় নিম্নলিখিত অনুমানগুলি করা:

  1. আমি মধ্যমা বেঁচে থাকার সময় একটি অনুমান আছে প্রত্যেকের জন্য রাজ্যের কাপলান Meier বক্ররেখা কাছ থেকে। itii
  2. আমি আশা করি সত্যিকারের মধ্যবর্তী বেঁচে থাকার সময়, this এই অনুমানের সমান হবে। E ( T i | t i ) = t iTiE(Ti|ti)=ti
  3. আমি 100% নিশ্চিত যে সত্যিকারের বেঁচে থাকার সময়টি ইতিবাচক। Pr(Ti>0)=1

এখন এই অনুমানগুলি ব্যবহার করার "সর্বাধিক রক্ষণশীল" উপায়টি সর্বাধিক এনট্রপির মূলনীতি, তাই আপনি পান:

p(Ti|ti)=Kexp(λTi)

কোথায় এবং যেমন নির্বাচিত হয় যে পিডিএফ স্বাভাবিক করা হয়, এবং প্রত্যাশিত মান । এখন আমাদের আছে:λ টি আমিKλti

= কে [ - এক্স পি ( - λ টি আমি )

1=0p(Ti|ti)dTi=K0exp(λTi)dTi
( টি আই ) = 1
=K[exp(λTi)λ]Ti=0Ti==KλK=λ
এবং এখন আমাদের কাছেE(Ti)=1λλ=ti1

এবং তাই আপনার কাছে প্রতিটি রাজ্যের জন্য সম্ভাবনা বিতরণের একটি সেট রয়েছে।

p(Ti|ti)=1tiexp(Titi)(i=1,,N)

যা এর যৌথ সম্ভাবনা বিতরণ দেয়:

p(T1,T2,,TN|t1,t2,,tN)=i=1N1tiexp(Titi)

এখন মনে হচ্ছে আপনি অনুমানটি পরীক্ষা করতে চান , যেখানে মাঝারি বেঁচে থাকার সময়। এর বিরুদ্ধে পরীক্ষা করার জন্য কঠোর বিকল্প অনুমানটি হ'ল "প্রতিটি এক অনন্য এবং সুন্দর তুষারকণা" হাইপোথিসিস কারণ এটি সর্বাধিক সম্ভাব্য বিকল্প, এবং এইভাবে সহজ অনুমানের ("" মিনিম্যাক্স "পরীক্ষা) এ যাওয়ার জন্য হারিয়ে যাওয়া তথ্যের প্রতিনিধিত্ব করে। সহজ অনুমানের বিরুদ্ধে প্রমাণের পরিমাপটি প্রতিক্রিয়া অনুপাত দ্বারা দেওয়া হয়:H0:T1=T2==TN=t¯t¯=1Ni=1NtiHA:T1=t1,,TN=tN

O(HA|H0)=p(T1=t1,T2=t2,,TN=tN|t1,t2,,tN)p(T1=t¯,T2=t¯,,TN=t¯|t1,t2,,tN)
=[i=1N1ti]exp(i=1Ntiti)[i=1N1ti]exp(i=1Nt¯ti)=exp(N[t¯tharm1])

কোথায়

tharm=[1Ni=1Nti1]1t¯

সুরেলা মানে। মনে রাখবেন যে বৈষম্যগুলি সর্বদা নিখুঁত ফিটের পক্ষে হবে, তবে মধ্যের বেঁচে থাকার সময়গুলি যথাযথভাবে কাছাকাছি থাকলে খুব বেশি নয়। আরও, এটি আপনাকে এই নির্দিষ্ট অনুমানের পরীক্ষার প্রমাণ দেওয়ার সরাসরি উপায় দেয়:

অনুমানগুলি 1-3 সর্বনিম্ন সমস্ত রাজ্যে জুড়ে সমান বেঁচে থাকার সময়ের বিরুদ্ধেO(HA|H0):1

এটিকে সিদ্ধান্তের নিয়ম, ক্ষতির ফাংশন, ইউটিলিটি ফাংশন ইত্যাদির সাথে একত্র করুন যা বলে যে সহজ অনুমানটি গ্রহণ করা কতটা সুবিধাজনক এবং আপনি নিজের উপসংহারটি পেয়েছেন!

আপনি যে হাইপোথিসিসের জন্য পরীক্ষা করতে পারেন তার পরিমাণের কোনও সীমা নেই এবং এর জন্য বৈষম্যও দিতে পারেন। সম্ভব "সত্য মান" এর একটি আলাদা সেট নির্দিষ্ট করতে কেবল change পরিবর্তন করুন । অনুমান হিসাবে বেছে নিয়ে আপনি "তাৎপর্য পরীক্ষা" করতে পারেন:H0

HS,i:Ti=ti,Tj=T=t¯(i)=1N1jitj

সুতরাং এই হাইপোথিসিসটি মৌখিকভাবে "রাষ্ট্র মধ্যে বিভিন্ন বেঁচে থাকার হার রয়েছে তবে অন্যান্য সমস্ত রাজ্য একই"। এবং তারপরে আমি উপরের মতবিরোধের অনুপাতের গণনাটি আবার করব। যদিও বিকল্প অনুমান কী তা সম্পর্কে আপনার সতর্ক হওয়া উচিত careful নীচেরগুলির মধ্যে যে কোনও একটির পক্ষে "যুক্তিযুক্ত" এই অর্থে যে এগুলি হতে পারে যে আপনি যে প্রশ্নের উত্তর দিতে আগ্রহী সেগুলি হতে পারে (এবং তাদের সাধারণত পৃথক উত্তর থাকতে পারে)i

  • আমার above উপরে বর্ণিত - নিখুঁত ফিটের তুলনায় the how কত খারাপ ? এইচ এস , আইHAHS,i
  • আমার above উপরে সংজ্ঞায়িত - গড় ফিটের তুলনায় how কতটা ভাল ? এইচ এস , iH0HS,i
  • একটি আলাদা - রাজ্য তুলনায় রাজ্য "আরও বেশি" আলাদা ? কে আইHS,kki

এখন এখানে একটি বিষয় যা অতিমাত্রায় লক্ষ্য করা গেছে তা হল রাজ্যগুলির মধ্যে পারস্পরিক সম্পর্ক this এই কাঠামোটি ধরে নিয়েছে যে এক রাজ্যে মধ্যম বেঁচে থাকার হার জানলে আপনাকে অন্য রাজ্যে মধ্যবর্তী বেঁচে থাকার হার সম্পর্কে কিছুই বলা যায় না। যদিও এটি "খারাপ" বলে মনে হচ্ছে এটি উন্নতি করা কঠিন নয় এবং উপরের গণনাগুলি ভাল প্রাথমিক ফলাফল যা গণনা করা সহজ।

রাজ্যগুলির মধ্যে সংযোগ যুক্ত করা সম্ভাবনার মডেলগুলিকে পরিবর্তন করবে এবং আপনি কার্যকরভাবে বেঁচে থাকার সময়ের কিছু "পুলিং" দেখতে পাবেন। বিশ্লেষণে পারস্পরিক সম্পর্ককে একত্রিত করার একটি উপায় হ'ল বেঁচে থাকার সময়কে দুটি উপাদান, একটি "সাধারণ অংশ" বা "প্রবণতা" এবং একটি "স্বতন্ত্র অংশ" হিসাবে বিভক্ত করা:

Ti=T+Ui

এবং তারপরে পৃথক অংশ all সমস্ত ইউনিটের গড় গড় শূন্য এবং অজানা বৈচিত্র পৃথক পরিবর্তনশীলতা সম্পর্কে আপনার কী জ্ঞান রয়েছে তা বর্ণনা করার পূর্বে একীকরণের জন্য সংহত করুন, ডেটা পর্যবেক্ষণ করার আগে (বা জেফরি যদি আপনি আগে থাকেন তবে কিছুই জানেন না, এবং জেফরির সমস্যার কারণ হলে অর্ধবৃত্তাকার)। σUiσ


(+1) খুব আকর্ষণীয়। আপনার পোস্টটি আমার উত্তরে একটি মন্তব্য সন্নিবেশ করিয়েছে।
গাবার্গুলিয়া

সম্ভবত আমি এটি মিস করেছি তবে সংজ্ঞায়িত কোথায়? M1
কার্ডিনাল

@ কার্ডিনাল, আমার ক্ষমা - এটি একটি টাইপ। অপসারণ করা হবে
সম্ভাব্যতা ব্লগ

কোন ক্ষমা প্রয়োজন। পড়ার সময় আমি এটি থেকে এড়িয়ে গেছি বা স্পষ্টত কোনও স্পষ্ট অনুপস্থিত ছিল কিনা তা নিশ্চিত ছিল না।
কার্ডিনাল

4

ভেবেছিলাম আমি কেবল এই বিষয়টিতে যুক্ত করেছি যে আপনি সেন্সর দিয়ে কোয়ান্টাইল রিগ্রেশনটিতে আগ্রহী হতে পারেন। Bottai & ঝাঙ 2010 প্রস্তাবিত একটি "Laplace রিগ্রেশন" যে শুধু এই কাজের করতে পারেন, আপনি এই একটি PDF জানতে পারেন এখানে । স্টাটার জন্য এটির জন্য একটি প্যাকেজ রয়েছে, এটি আর তে অনুবাদ করা যায় নি যদিও আর কোয়ার্ট্রিল প্যাকেজে সেন্সরযুক্ত কোয়ান্টাইল রিগ্রেশন, ক্রাক , যা কোনও বিকল্প হতে পারে for

আমি মনে করি যে পদ্ধতিটি অত্যন্ত আকর্ষণীয় এবং রোগীদের ক্ষেত্রে অনুপাতের পক্ষে ঝুঁকির চেয়ে আরও স্বজ্ঞাত হতে পারে। উদাহরণস্বরূপ জানা গেল যে ড্রাগের 50% ড্রাগ ওষুধ গ্রহণ করে না তার চেয়ে আরও 2 মাস বেঁচে থাকে এবং পার্শ্ব প্রতিক্রিয়াগুলি আপনাকে হাসপাতালে 1-2 মাস থাকতে বাধ্য করে চিকিত্সার পছন্দটি আরও সহজ করে তুলতে পারে।


আমি "ল্যাপ্লেস রিগ্রেশন" জানি না, তবে আপনার ২ য় অনুচ্ছেদের বিষয়ে আমি ভাবছি যে আমি এটি সঠিকভাবে বুঝতে পারছি কিনা। সাধারণত বেঁচে থাকার বিশ্লেষণে (তীব্র ব্যর্থতার সময় বিবেচনা করে) আমরা বলব যে 'ড্রাগ গ্রুপের জন্য পঞ্চাশতম পার্সেন্টাইল নিয়ন্ত্রণ গ্রুপের জন্য 50 তম% এর চেয়ে 2 মাস পরে আসে'। আপনার অর্থ কি এটিই বা এলআর আউটপুটটির একটি আলাদা ব্যাখ্যা দেওয়া যায়?
গুং - মনিকা পুনরায়

@ গুং: আমার মনে হয় আপনি আপনার ব্যাখ্যায় ঠিক বলেছেন - পাঠ্য বদলেছেন, আরও ভাল? সাম্প্রতিক সময়ে আমি একটি কোর্সে তাদের মুখোমুখি হওয়া সত্ত্বেও আমি নিজেই রিগ্রেশন মডেলগুলি ব্যবহার করি নি। টিটি হ'ল নিয়মিত কক্স-মডেলের একটি আকর্ষণীয় বিকল্প যা আমি প্রচুর ব্যবহার করেছি। যদিও আমার সম্ভবত ধারণাটি হজম করার জন্য আরও বেশি সময় ব্যয় করা প্রয়োজন বলে আমি মনে করি যে আমার রোগীদের কাছে ব্যাখ্যা দেওয়ার সময় আমি প্রায়শই কেএম বক্ররেখা ব্যবহার করি সেহেতু আমার পক্ষে আমার রোগীদের কাছে ব্যাখ্যা করা সম্ভবত সহজ। এইচআর দাবি করে যে আপনি আপেক্ষিক এবং নিখুঁত ঝুঁকির মধ্যে পার্থক্যটি সত্যই বুঝতে পারবেন - এমন একটি ধারণা যা ব্যাখ্যা করতে কিছুটা সময় নিতে পারে ...
ম্যাক্স গর্ডন


লিঙ্কটির জন্য আপনাকে @ মিশা ধন্যবাদ। লেখকের এখানে একটি জবাব আছে: onlinelibrary.wiley.com/doi/10.1002/bimj.20110010033
ম্যাক্স গর্ডন

3

প্রথমে আমি ডেটাটি ভিজ্যুয়ালাইজ করব: প্রতিটি রাজ্যে মধ্যস্থদের বেঁচে থাকার জন্য আত্মবিশ্বাসের ব্যবধান এবং মান ত্রুটিগুলি গণনা করুন এবং একটি ফানেল প্লট ব্যবহার করে বনের প্লট, মিডিয়ান এবং তাদের এসইগুলিতে সিআই দেখান।

"সারা দেশে মিডিয়ান বেঁচে থাকার অর্থ" এমন একটি পরিমাণ যা ডেটা থেকে অনুমান করা হয় এবং এর ফলে অনিশ্চয়তা থাকে তাই আপনি তাৎপর্য পরীক্ষার সময় তীব্র রেফারেন্স মান হিসাবে নিতে পারেন না। গড়পড়তা পদ্ধতির সাথে অন্য একটি অসুবিধা হ'ল আপনি যখন কোনও রাষ্ট্রীয় মাঝারিটিকে এর সাথে তুলনা করেন আপনি মাঝারিটিকে একটি পরিমাণের সাথে তুলনা করছেন যা ইতিমধ্যে উপাদানটিকে এই পরিমাণটি অন্তর্ভুক্ত করে। সুতরাং প্রতিটি রাজ্যের সাথে মিলিত অন্যান্য সমস্ত রাজ্যের সাথে তুলনা করা সহজ । এটি প্রতিটি রাজ্যের জন্য লগ র‌্যাঙ্ক পরীক্ষা (বা এর বিকল্প) সম্পাদন করে করা যেতে পারে।
(সম্ভাব্যতা সম্পর্কিত উত্তরটি পড়ার পরে সম্পাদনা করুন: লগ র‌্যাঙ্ক পরীক্ষাটি দুটি (বা আরও বেশি) গ্রুপে বেঁচে থাকার তুলনা করে তবে এটি যে তুলনা করছেন এটি কঠোরভাবে মিডিয়ান নয় you আপনি যদি নিশ্চিত হন যে এটি মধ্যমা যা আপনি তুলনা করতে চান, আপনি তার সমীকরণের উপর নির্ভর করতে পারেন বা এখানে পুনরায় মডেলিং ব্যবহার করতে পারেন)

আপনি আপনার প্রশ্নকে [একাধিক তুলনা] লেবেল করেছেন, সুতরাং আমি ধরে নিয়েছি আপনিও আপনার পি মানগুলি এমনভাবে সামঞ্জস্য করতে (বৃদ্ধি) করতে চান যাতে আপনি যদি কমপক্ষে একটি সমন্বিত পি মান 5% এরও কম দেখেন তবে আপনি এই সিদ্ধান্তে আসতে পারেন যে "রাজ্যজুড়ে মধ্যস্থতা বেঁচে থাকার জন্য সমান নয় "5% তাত্পর্য স্তরে। আপনি বনফেরনির মতো জেনেরিক এবং অত্যধিক রক্ষণশীল পদ্ধতি ব্যবহার করতে পারেন, তবে অনুকূল সংশোধন প্রকল্পটি পি মানগুলির পারস্পরিক সম্পর্ককে বিবেচনায় নেবে। আমি ধরে নিয়েছি যে আপনি সংশোধন প্রকল্পে কোনও পূর্বের জ্ঞান তৈরি করতে চান না, তাই আমি এমন একটি স্কিম নিয়ে আলোচনা করব যেখানে সমন্বয়টি প্রতিটি সি মানকে একই সি ধ্রুবক দ্বারা গুণিত করে।

যেহেতু আমি জানি না যে কীভাবে অনুকূল সি মাল্টিপ্লায়ার প্রাপ্ত করার জন্য সূত্রটি বানাতে হয় , আমি পুনরায় মডেলিং ব্যবহার করব । নাল অনুমানের অধীনে যে বেঁচে থাকার বৈশিষ্ট্যগুলি সমস্ত রাজ্য জুড়ে একই, তাই আপনি ক্যান্সারের ক্ষেত্রে রাষ্ট্রীয় লেবেলগুলিকে নিষ্ক্রিয় করতে পারেন এবং মধ্যস্থদের গণনা করতে পারেন। রাষ্ট্রীয় পি মানগুলির অনেকগুলি পুনরায় মডেল ভেক্টর প্রাপ্তির পরে আমি সংখ্যায় নীচে সি গুণিতকটি খুঁজে পেতে পারি যার নীচে ভেক্টরগুলির 95% এর চেয়ে কম উল্লেখযোগ্য পি মান থাকে না এবং তারপরে 95% এরও বেশি থাকে। যদিও পরিসীমাটি প্রশস্ত দেখায় আমি বারবার আকারের ক্রম দ্বারা রেসামগুলির সংখ্যা বাড়িয়ে দেব।


ডেটা ভিজ্যুয়ালাইজিং সম্পর্কে ভাল পরামর্শ। (+1)
সম্ভাব্যতা ব্লগ

ধন্যবাদ আমি সমালোচনাকেও স্বাগত জানাই, বিশেষত যদি গঠনমূলক।
গাবার্গুলিয়া

আমার কাছে কেবল সমালোচনা হ'ল পি-ভ্যালু ব্যবহার করা, তবে এটি আপনার উত্তরের যে কোনও কিছুর চেয়ে "আমার কাঁধে চিপ" - মনে হয় আপনি যদি পি-মানগুলি ব্যবহার করতে চলেছেন তবে আপনার প্রস্তাবটি ভাল। আমি কেবল পি-ভ্যালু ব্যবহার করা ভাল বলে মনে করি না। পি-ভ্যালু সম্পর্কে মন্তব্যে @ অ্যাডার্ডোর সাথে আমার এক্সচেঞ্জের জন্য এখানে দেখুন
সম্ভাব্যতা ব্লগ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.