বেঁচে থাকার বিশ্লেষণের জন্য কীভাবে মেশিন লার্নিং মডেলগুলি (জিবিএম, এনএন ইত্যাদি) ব্যবহার করা যেতে পারে?


13

আমি জানি যে প্রথাগত পরিসংখ্যানের মডেলগুলি যেমন কক্স প্রপোরেনশনাল হ্যাজার্ডস রিগ্রেশন এবং কিছু কাপলান-মেয়ার মডেলগুলি কোনও ইভেন্টের ব্যর্থতা ইত্যাদি হওয়ার আগ মুহুর্ত পর্যন্ত দিনের ভবিষ্যদ্বাণী করতে ব্যবহার করা যেতে পারে অর্থাৎ বেঁচে থাকার বিশ্লেষণ

প্রশ্নাবলি

  1. জিবিএম, নিউরাল নেটওয়ার্ক ইত্যাদির মতো মেশিন লার্নিং মডেলের রিগ্রেশন সংস্করণ কীভাবে ঘটনার আগ পর্যন্ত দিনের পূর্বাভাস দিতে পারে?
  2. আমি বিশ্বাস করি যে টার্গেট ভেরিয়েবল হিসাবে উপস্থিত হওয়া পর্যন্ত কেবল দিনগুলি ব্যবহার করা এবং কোনও রিগ্রেশন মডেল চালানো সহজভাবে কাজ করবে না? এটি কেন কাজ করবে না এবং কীভাবে এটি স্থির করা যায়?
  3. আমরা কি বেঁচে থাকার বিশ্লেষণ সমস্যাটিকে একটি শ্রেণিবিন্যাসে রূপান্তর করতে পারি এবং তারপরে বেঁচে থাকার সম্ভাবনাগুলি পেতে পারি? তাহলে কীভাবে বাইনারি টার্গেট ভেরিয়েবল তৈরি করবেন?
  4. মেশিন লার্নিং পদ্ধতির বনাম কক্স প্রপোরশনাল হ্যাজার্ডস রিগ্রেশন এবং কাপলান-মিয়ার মডেল ইত্যাদির উপকারিতা কি?

নমুনা ইনপুট ডেটা নীচের বিন্যাসে কল্পনা করুন

এখানে চিত্র বর্ণনা লিখুন

বিঃদ্রঃ:

  • সেন্সরটি 10 ​​মিনিটের ব্যবধানে ডেটা দেয় তবে অনেক সময় এনএ সহ সারি দ্বারা প্রতিনিধিত্ব করা নেটওয়ার্ক ইস্যু ইত্যাদির কারণে ডেটা হারিয়ে যেতে পারে।
  • var1, var2, var3 হ'ল ভবিষ্যদ্বাণীকারী, ব্যাখ্যামূলক ভেরিয়েবল।
  • ব্যর্থতা_ফ্ল্যাগ মেশিনটি ব্যর্থ হয়েছে কিনা তা জানায়।
  • আমাদের কাছে প্রতিটি মেশিন আইডির জন্য প্রতি 10 মিনিটের ব্যবধানে গত 6 মাসের ডেটা রয়েছে

সম্পাদনা করুন:

প্রত্যাশিত আউটপুট পূর্বাভাস নীচের বিন্যাসে হওয়া উচিত এখানে চিত্র বর্ণনা লিখুন

দ্রষ্টব্য: আমি প্রতিদিনের স্তরে পরবর্তী 30 দিনের জন্য প্রতিটি মেশিনের জন্য ব্যর্থতার সম্ভাবনা পূর্বাভাস দিতে চাই।


1
আমি মনে করি এটি সময়োপযোগী ইভেন্টের ডেটা কেন তা আপনি ব্যাখ্যা করতে পারলে সহায়তা করবে ; ঠিক কী, আপনি প্রতিক্রিয়াটি মডেল করতে চান?
ক্লিফ এবি

এটিকে পরিষ্কার করার জন্য আমি প্রত্যাশিত আউটপুট পূর্বাভাস সারণি সম্পাদনা করেছি এবং যুক্ত করেছি। আপনার আরও কিছু প্রশ্ন থাকলে আমাকে জানান Let
জর্জেফএফআরএফ

1
আছে: কিছু কিছু ক্ষেত্রে, যেমন, বিযুক্ত সময় বিপত্তি মডেল বাইনারি ফলাফলের ক্ষেত্রে বেঁচে থাকার তথ্য রূপান্তর উপায় আছে statisticalhorizons.com/wp-content/uploads/Allison.SM82.pdf । কিছু মেশিন লার্নিং পদ্ধতি যেমন এলোমেলো বনগুলি উদাহরণস্বরূপ, লগ র‌্যাঙ্কের পরিসংখ্যানকে বিভক্ত মানদণ্ড হিসাবে ব্যবহার করে ইভেন্টের ডেটাতে সময়ের মডেল করতে পারে।
dsaxton

ধন্যবাদ @ ডিএসএক্সটন উপরের বেঁচে থাকা ডেটাগুলিকে বাইনারি ফলাফলগুলিতে রূপান্তর করতে কীভাবে আপনি ব্যাখ্যা করতে পারেন?
জর্জেফএফআরএফ

ঘনিষ্ঠভাবে দেখার পরে মনে হচ্ছে আপনার ইতিমধ্যে এর সাথে বাইনারি ফলাফল রয়েছে failure_flag
dsaxton

উত্তর:


6

নিউরাল নেটওয়ার্কগুলির ক্ষেত্রে এটি একটি প্রতিশ্রুতিবদ্ধ পদ্ধতির: ডাব্লুটিটিই-আরএনএন - কম হ্যাকি মন্থের পূর্বাভাস

এই পদ্ধতির সারমর্মটি হ'ল প্রতিবার-ধাপে ওয়েবুল বিতরণের পরামিতিগুলির পূর্বাভাস দেওয়ার জন্য একটি পুনরাবৃত্ত নিউরাল নেটওয়ার্ক ব্যবহার করা এবং অ্যাকাউন্টে সেন্সরিংয়ের ক্ষেত্রে ক্ষতির ফাংশন ব্যবহার করে নেটওয়ার্কটি অনুকূলকরণ করা।

লেখক গিথুবের উপর তাঁর বাস্তবায়নও প্রকাশ করেছিলেন


2

এই উল্লেখগুলি দেখুন:

https://www.stats.ox.ac.uk/pub/bdr/NNSM.pdf

http://pcwww.liv.ac.uk/~afgt/eleuteri_lyon07.pdf

আরো উল্লেখ্য কক্সবাজার সমানুপাতিক হ্যাজার্ডস (CPH) -এর মত ঐতিহ্যগত বিপদ-ভিত্তিক মডেলের সময়-টু-ঘটনা ভবিষ্যদ্বাণী করা করার জন্য ডিজাইন করা হয় না, কিন্তু বরং আভাসিত করা ভেরিয়েবল 'প্রভাব (পারস্পরিক সম্পর্ক) ঝ) ঘটনা পর্যবেক্ষণ এবং, অত আ) বেঁচে থাকার বক্ররেখা বিরুদ্ধে । কেন? সিপিএইচ এর এমএলই দেখুন।

অতএব, যদি আপনি "উপস্থিতি অবধি দিনগুলি" এর মতো কোনও কিছুকে আরও সরাসরি ভবিষ্যদ্বাণী করতে চান তবে সিপিএইচ উপযুক্ত নয়; উপরের দুটি রেফারেন্সে উল্লিখিত হিসাবে অন্যান্য মডেলগুলি আপনার কাজটি আরও ভালভাবে পরিবেশন করতে পারে।


1

যেমন @ ডিএসএক্সটন বলেছেন, আপনি একটি পৃথক সময় মডেল তৈরি করতে পারেন। আপনি এটি পূর্বাভাস দেওয়ার জন্য সেট আপ করেছেন (আগের দিন পর্যন্ত বেঁচে থাকা এই দিনে ব্যর্থ হন)। আপনার ইনপুটগুলি আজকের দিন (আপনি যা যা উপস্থাপন করতে চান) যেমন একটি হট এনকোডিং, পূর্ণসংখ্যা, .. স্প্লাইন ... পাশাপাশি অন্য যে কোনও স্বাধীন ভেরিয়েবল আপনি চান

সুতরাং আপনি সারি সারি ডেটা তৈরি করেন, প্রতিটি নমুনার জন্য যে টি -1 অবধি বেঁচে ছিল, এটি কি সময়মতো মারা যায় (0/1)?

তাই এখন টি-টু পর্যন্ত বেঁচে থাকার সম্ভাবনা হ'ল পি-এর উত্পাদক (টি -1-তে মরেন না এমন সময়ে মারা যাবেন না) টি = 1 থেকে টি-এর জন্য আপনি নিজের মডেল থেকে টি ভবিষ্যদ্বাণী করেন এবং তারপরে একসাথে গুণ

আমি বলব যে এটির ব্যর্থতার সরাসরি অনুমান করার মতো ধারণাটি না হওয়ার কারণ এটি সমস্যার লুকানো কাঠামো। যেমন ব্যর্থ হয়নি এমন মেশিনগুলির জন্য আপনি কী ইনপুট দেন। অন্তর্নিহিত কাঠামো কার্যকরভাবে স্বাধীন ইভেন্টগুলি: প্রদত্ত সময়ে ব্যর্থ হয় টি -1 পর্যন্ত ব্যর্থ হয় না। সুতরাং উদাহরণস্বরূপ যদি আপনি ধরে নেন যে এটি ধ্রুবক, তবে আপনার বেঁচে থাকার বক্ররেখাটি ঘনিষ্ঠ হয়ে যায় (ঝুঁকিপূর্ণ মডেলগুলি দেখুন)

আপনার ক্ষেত্রে দ্রষ্টব্য আপনি 10 মিনিটের ব্যবধানে মডেল করতে পারেন বা দিনের স্তর পর্যন্ত শ্রেণিবিন্যাসের সমস্যাটিকে একত্রিত করতে পারেন ..

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.