কক্স আনুপাতিক বিপদ মডেল দিয়ে ক্রস-বৈধকরণ কীভাবে করবেন?


15

ধরুন আমি একটি ডেটাসেটে (মডেল বিল্ডিং ডেটাসেট) কোনও নির্দিষ্ট রোগের সংঘটিত হওয়ার জন্য একটি পূর্বাভাস মডেল তৈরি করেছি এবং এখন একটি নতুন ডেটাসেটে (বৈধকরণ ডেটাসেট) মডেলটি কতটা ভাল কাজ করে তা পরীক্ষা করে দেখতে চাই want লজিস্টিক রিগ্রেশন দিয়ে নির্মিত একটি মডেলের জন্য, আমি মডেল বিল্ডিং ডেটাসেট থেকে প্রাপ্ত মডেল সহগের উপর ভিত্তি করে বৈধতা ডেটাসেটের প্রতিটি ব্যক্তির জন্য পূর্বাভাসযুক্ত সম্ভাবনাটি গণনা করব এবং তারপরে, কিছু কাটঅফ মানে সেই সম্ভাব্যতাগুলিকে দ্বিগুণ করার পরে, আমি একটি 2x2 টেবিল তৈরি করতে পারি এটি আমাকে সত্যিকারের ইতিবাচক হার (সংবেদনশীলতা) এবং সত্য নেতিবাচক হার (নির্দিষ্টতা) গণনা করতে দেয়। তদুপরি, আমি কাটঅফকে পৃথক করে পুরো আরওসি বক্ররেখা তৈরি করতে পারি এবং তারপরে আরওসি গ্রাফের জন্য এটিসি পেতে পারি।

এখন ধরুন যে আমার কাছে বেঁচে থাকার ডেটা আছে। সুতরাং, আমি মডেল বিল্ডিং ডেটাসেটে একটি কক্স আনুপাতিক বিপত্তি মডেল ব্যবহার করেছি এবং এখন যাচাইকরণ ডেটাসেটে মডেলটি কতটা ভাল কাজ করে তা পরীক্ষা করে দেখতে চাই। যেহেতু বেসলাইন ঝুঁকিটি কক্স মডেলগুলিতে কোনও প্যারাম্যাট্রিক ফাংশন নয়, তাই মডেল বিল্ডিং ডেটাসেটে প্রাপ্ত মডেল সহগের উপর ভিত্তি করে বৈধতা ডেটাসেটে প্রতিটি ব্যক্তির জন্য ভবিষ্যদ্বাণী করা বেঁচে থাকার সম্ভাবনাটি কীভাবে পেতে পারি তা আমি দেখতে পাই না। সুতরাং, আমি যাচাইকরণের ডেটাসেটে মডেলটি কতটা ভাল কাজ করে তা যাচাই করতে কীভাবে যেতে পারি? এটি করার জন্য কি কোনও প্রতিষ্ঠিত পদ্ধতি রয়েছে? এবং যদি হ্যাঁ হয় তবে সেগুলি কি কোনও সফ্টওয়্যার এ প্রয়োগ করা হয়েছে? আপনার পরামর্শের জন্য ধন্যবাদ!

উত্তর:


9

একটি আরওসি বক্ররেখা এই সেটিংটিতে কার্যকর নয়, যদিও সাধারণীকরণ করা আরওসি অঞ্চল (সি-ইনডেক্স, যার জন্য কোনও দ্বিখণ্ডকরণের প্রয়োজন হয় না) is আর rmsপ্যাকেজটি সি-সূচক এবং ক্রস-বৈধ বা বুটস্ট্র্যাপের ওভারফিটিং-সংশোধিত সংস্করণগুলি গণনা করবে। আপনি যদি কোনও মডেল পুরোপুরি নির্দিষ্ট করে থাকেন বা প্রতিটি রেজাল্টে পিছনের স্টেপডাউন অ্যালগরিদমের পুনরাবৃত্তি করেন তবে কোনও ডেটা ধরে না রেখে আপনি এটি করতে পারেন। আপনি যদি সত্যই বাহ্যিক বৈধতা করতে চান, যেমন, যদি আপনার বৈধতার নমুনা প্রচুর হয় তবে আপনি নিম্নলিখিত rmsফাংশনগুলি ব্যবহার করতে পারেন : rcorr.cens, val.surv


উত্তরের জন্য ধন্যবাদ. আপনি কী ব্যাখ্যা করতে পারেন যে একটি আরওসি বক্ররেখা কেন এই সেটিংয়ে কার্যকর নয়? আমি কিছু বিশিষ্ট অ্যাপ্লিকেশন দেখেছি যেখানে এই জাতীয় পদ্ধতির ব্যবহার করা হয়েছিল (যেমন, হিপ্পিসলে-কক্স এট আল। (২০০ 2007)। যুক্তরাজ্যের জন্য নতুন কার্ডিওভাসকুলার রোগের ঝুঁকি স্কোর কিউআরআইএসকে আবিষ্কার এবং বৈধকরণ: সম্ভাব্য ওপেন কোহোর্ট স্টাডি। ব্রিটিশ মেডিকেল জার্নাল , 335 (7611): 136), তাই এখন আমি তাদের পদ্ধতিগুলি নিয়ে ভাবছি।
ওল্ফগ্যাং

1
এখানে একটি সাদৃশ্য। ধরা যাক, বয়স বাড়ানো কীভাবে চলমান সক্ষমতার সাথে সম্পর্কিত assess আরওসি পদ্ধতির কারও দৌড়ানোর ক্ষমতা দেওয়া প্রশ্নটি জিজ্ঞাসা করবে যে তারা একটি নির্দিষ্ট (স্বেচ্ছাসেবী) বয়সের চেয়ে বেশি হওয়ার সম্ভাবনা কী? একটি সমীক্ষায় এটি কেবল স্বতন্ত্র এবং নির্ভরশীল ভেরিয়েবলের ভূমিকাগুলি বিপরীতে বিভ্রান্তি যুক্ত করে এবং আরওসি বক্ররেখাও একজন ভবিষ্যদ্বাণীকে কাট অফ করতে প্ররোচিত করে, যা খারাপ পরিসংখ্যান অনুশীলন হিসাবে পরিচিত - দেখুন biostat.mc.vanderbilt.edu/ ক্যাটকন্টিনিয়াস । হ্যাভক তৈরির পাশাপাশি কাটপয়েন্টগুলি অবশ্যই অন্যান্য সকল ভবিষ্যদ্বাণীকের কাজ।
ফ্রাঙ্ক হ্যারেল

আবার, জবাব দেওয়ার জন্য ধন্যবাদ। যদিও আমি পুরোপুরি নিশ্চিত নই। আমি সম্পূর্ণরূপে সম্মত হই যে একটি অবিচ্ছিন্ন পরিবর্তনশীলকে স্বেচ্ছাসেবী শ্রেণিবদ্ধকরণ খারাপ অভ্যাস, তবে আরওসি পদ্ধতির সমস্ত সম্ভাব্য কাটঅফগুলিকে শ্রেণিবদ্ধ করে এবং এওসি-র মাধ্যমে সেই তথ্যের সংক্ষিপ্তসার জানানো হয়। সুতরাং তাতে কোনও সালিশ নেই। এটি লজিস্টিক রিগ্রেশন মডেলগুলির জন্য একটি স্ট্যান্ডার্ড এবং স্বীকৃত অনুশীলনের মতো বলে মনে হয়। তাহলে আপনি কি সাধারণভাবে বা কেবল বেঁচে থাকার মডেলগুলির প্রসঙ্গে আরওসি বক্ররেখা ব্যবহারের বিরুদ্ধে?
ওল্ফগ্যাং

2
এক্স=এক্সএক্স>

আমার অভিজ্ঞতা আমাকে বলেছে যে প্রচুর গবেষক / অনুশীলনকারীরা আসলে দ্বন্দ্বমূলক সিদ্ধান্তের নিয়ম চান (এটি কার্যকর কিনা তা বাদ দিয়ে)। যে কোনও হারে, আমি সেই কয়েকটি আর ফাংশন অনুসরণ করব এবং দেখি এটি আমাকে কোথায় পেয়েছে। আলোচনার জন্য ধন্যবাদ।
ওল্ফগ্যাং

0

আমি জানি যে এই প্রশ্নটি বেশ পুরানো তবে যখন আমি একই সমস্যার মুখোমুখি হলাম তখন যা করেছি তা হ'ল বৈধতা সেটটিতে প্রতিটি বিষয়ের জন্য "স্কোর" পাওয়ার জন্য পূর্বাভাস ফাংশনটি ব্যবহার করা। এরপরে স্কোরগুলি মধ্যকারের চেয়ে উচ্চতর বা কম ছিল এবং কাপলান-মেয়ের বক্ররেখা প্লট করা উচিত অনুসারে বিষয়গুলিকে বিভক্ত করা হয়েছিল। যদি আপনার মডেলটি ভবিষ্যদ্বাণীপূর্ণ হয় তবে এটি বিষয়গুলির একটি পৃথকীকরণ প্রদর্শন করবে। আমি আর এর বেঁচে থাকা প্যাকেজ থেকে কক্স্ফ ফাংশনটি ব্যবহার করে বেঁচে থাকার সাথে স্কোরের (আসলে তার সাধারণ লোনার [স্বাভাবিক বিতরণের জন্য) পারস্পরিক সম্পর্কও পরীক্ষা করেছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.