এই প্রক্রিয়াটির সম্ভাবনা কী?


10

একজন রোগীকে হাসপাতালে ভর্তি করা হয়। তাদের থাকার দৈর্ঘ্য 2 টি বিষয়ের উপর নির্ভর করে: তাদের আঘাতের তীব্রতা এবং তাদের বীমা হাসপাতালে রাখার জন্য তাদের বীমা কতটা দিতে আগ্রহী। কিছু রোগী যদি তাদের বীমা তাদের থাকার জন্য অর্থ প্রদান বন্ধ করার সিদ্ধান্ত নেন তবে অকালমে চলে যাবেন।

নিম্নলিখিতটি ধরে নিন:

1) থাকার দৈর্ঘ্যটি পিসন বিতরণ করা হয়েছে (এখনই এটি ধরে নিন, এটি বাস্তবিক অনুমান বা নাও হতে পারে) প্যারামিটার- ।λ

2) বিভিন্ন বীমা পরিকল্পনা 7, 14, এবং 21 দিনের অবস্থান কভার করে। অনেক রোগী 7,14 বা 21 দিনের অবস্থানের পরে চলে যাবেন (কারণ তাদের বীমা শেষ হয়ে গেছে এবং তাদের অবশ্যই চলে যেতে হবে)।

যদি আমি এই প্রক্রিয়াটি থেকে ডেটা পেতে পারি তবে এটি নীচের মত দেখতে পারে:

এখানে চিত্র বর্ণনা লিখুন

আপনি দেখতে পাচ্ছেন, এখানে স্পাইকগুলি 7, 14 এবং 21 দিনের চিহ্নে রয়েছে। এগুলি এমন রোগী যা তাদের বীমা শেষ হওয়ার পরে চলে যায়।

স্পষ্টতই, ডেটা একটি মিশ্রণ হিসাবে মডেল করা যেতে পারে। এই বিতরণের সম্ভাবনাটি লিখতে আমার খুব কষ্ট হচ্ছে। এটি একটি শূন্য স্ফীত পোষকের মতো, তবে মূল্যস্ফীতি,, ১৪ এবং ২১ এ রয়েছে।

এই ডেটা হওয়ার সম্ভাবনা কী? সম্ভাবনার পিছনে চিন্তার প্রক্রিয়াটি কী?


শুরু করার জন্য, আপনাকে 7, 14 এবং 21-দিনের বাধ্যতামূলক সময় ছাড়ার সম্ভাবনাগুলি জানতে হবে।
ব্রুসেট

1
আমার কাছে এটি পয়েসনের মিশ্রণের মতো এবং তিনটি ডান-কাটা (7, 14 এবং 21 এ) পোয়েসন বিতরণগুলির মতো শোনাচ্ছে। এগুলি লিখে পুরোপুরি আরেকটি পদক্ষেপ।
কার্স্টেন

@ ব্রুসেট আমি এই মডেলটিতে বায়েশিয়ান অনুমান করতে যাচ্ছি, তাই আমি এটি সবচেয়ে সাধারণ ক্ষেত্রে লিখতে চাই।
দেমেট্রি প্যানানোস

উত্তর:


9

এই ক্ষেত্রে, আমি বিশ্বাস করি যে যদি আমরা আমাদের বেঁচে থাকার বিশ্লেষণের টুপিটি রাখি তবে একটি সমাধানের পথ বিদ্যমান। মনে রাখবেন যে এই মডেলটির কোনও সেন্সরযুক্ত বিষয় না থাকলেও (প্রচলিত অর্থে) আমরা এখনও বেঁচে থাকা বিশ্লেষণ এবং বিষয়গুলির বিপদ সম্পর্কে কথা বলতে পারি।

আমাদের এই ক্রমে তিনটি জিনিস মডেল করতে হবে: i) ক্রমসংক্রান্ত বিপত্তি, ii) বিপত্তি, iii) লগ হওয়ার সম্ভাবনা।

i) আমরা অংশ নেব i) পদক্ষেপে। পইসন র্যান্ডম ভেরিয়েবলের ক্রমবর্ধমান বিপদ, কী? একটি বিযুক্ত বন্টন, সেখানে it¹ সংজ্ঞায়িত করার দুটি উপায় আছে, কিন্তু আমরা সংজ্ঞা ব্যবহার করবে । তাই জন্য ক্রমবর্ধমান বিপত্তি হয়এইচ(টি)এইচ(টি)=-লগএস(টি)টি~পিআমি(λ)

এইচটি(টি)=-লগ(1-প্রশ্নঃ(টি,λ))=-লগপি(টি,λ)

যেখানে যথাক্রমে উপরের, নিম্ন নিয়মিত গামা ফাংশন।প্রশ্নঃ,পি

এখন আমরা শেষ হওয়া বীমাগুলির "বিপত্তি" যুক্ত করতে চাই। ক্রমবর্ধমান বিপদ সম্পর্কে দুর্দান্ত জিনিস হ'ল এগুলি সংযোজনীয়, তাই আমাদের কেবল 7, 14, 21 বারে "ঝুঁকি" যুক্ত করতে হবে:

এইচটি'(টি)=-লগপি(টি,λ)+ +একটি1(টি>7)+ +1(টি>14)+ +1(টি>21)

Heuristically, রোগীর একটি ব্যাকগ্রাউন্ড "পইসন" ঝুঁকি সাপেক্ষে 14, এবং 21 হয়, এবং তারপর 7 পয়েন্ট-জ্ঞানী ঝুঁকি, (কারণ এই একটি হল ক্রমসঞ্চিত বিপত্তি, আমরা সেইসব পয়েন্ট-জ্ঞানী ঝুঁকি, অত: পর জমা ।) আমরা এবং কী তা জানেন না তবে আমরা পরে তাদের বীমা শেষ হওয়ার সম্ভাবনাগুলির সাথে সংযুক্ত করব।>একটি,

আসলে, যেহেতু আমরা জানি 21 সর্বোচ্চ সীমা নেই এবং সব রোগীদের যে পরে সরিয়ে ফেলা হয়, আমরা সেট করতে পারেন অনন্ত যাবে।

এইচটি'(টি)=-লগপি(টি,λ)+ +একটি1(টি>7)+ +1(টি>14)+ +1(টি>21)

ii) এরপরে আমরা বিপত্তিটি পেতে সংশ্লেষমূলক বিপত্তিটি ব্যবহার করি । এর সূত্রটি হ'ল:(টি)

(টি)=1-মেপুঃ(এইচ(টি)-এইচ(টি+ +1))

আমাদের জমে থাকা বিপদটি প্লাগ ইন করা এবং সরলীকরণ করা:

টি'(টি)=1-পি(টি+ +1,λ)পি(টি,λ)মেপুঃ(-একটি1(টি=7)-1(টি=14)-1(টি=21))

iii) অবশেষে, আমাদের যখন ঝুঁকি এবং ক্রমবর্ধমান বিপত্তি ঘটেছে তখন অবশেষে বেঁচে থাকার মডেলগুলির (লগকে সেন্সর ছাড়াই) লগ লেখার সম্ভাবনা খুব সহজ:

(λ,একটি,|টি)=Σআমি=1এন(লগ(টিআমি)-এইচ(টিআমি))

এবং এটা আছে!

এমন সম্পর্ক রয়েছে যা আমাদের পয়েন্ট-ভিত্তিক ঝুঁকি সহগ এবং বীমা দৈর্ঘ্যের সম্ভাবনার সাথে সংযোগ করে: ।একটি=-লগ(1-পিএকটি),=-লগ(1-পিএকটি-পি)-লগ(1-পিএকটি),পি=1-(পিএকটি+ +পি)


প্রমাণটি পুডিংয়ে রয়েছে। লাইফলাইনগুলির কাস্টম মডেল শব্দার্থক শব্দ ব্যবহার করে কিছু সিমুলেশন এবং অনুমান করি ।

from lifelines.fitters import ParametericUnivariateFitter
from autograd_gamma import gammaincln, gammainc
from autograd import numpy as np

MAX = 1e10

class InsuranceDischargeModel(ParametericUnivariateFitter):
    """
    parameters are related by
    a = -log(1 - p_a)
    b = -log(1 - p_a - p_b) - log(1 - p_a)
    p_c = 1 - (p_a + p_b)
    """
    _fitted_parameter_names = ["lbd", "a", "b"]
    _bounds = [(0, None), (0, None), (0, None)]

    def _hazard(self, params, t):
        # from (1.64c) in http://geb.uni-giessen.de/geb/volltexte/2014/10793/pdf/RinneHorst_hazardrate_2014.pdf
        return 1 - np.exp(self._cumulative_hazard(params, t) - self._cumulative_hazard(params, t+1))

    def _cumulative_hazard(self, params, t):
        lbd, a, b = params
        return -gammaincln(t, lbd) + a * (t > 7) + b * (t > 14) + MAX * (t > 21)


def gen_data():
    p_a, p_b = 0.4, 0.2
    p = [p_a, p_b, 1 - p_a - p_b]
    lambda_ = 18
    death_without_insurance = np.random.poisson(lambda_)
    insurance_covers_until = np.random.choice([7, 14, 21], p=p)
    if death_without_insurance < insurance_covers_until:
        return death_without_insurance
    else:
        return insurance_covers_until


durations = np.array([gen_data() for _ in range(40000)])
model = InsuranceDischargeModel()
model.fit(durations)
model.print_summary(5)
"""
<lifelines.InsuranceDischargeModel: fitted with 40000 observations, 0 censored>
number of subjects = 40000
  number of events = 40000
    log-likelihood = -78845.10392
        hypothesis = lbd != 1, a != 1, b != 1

---
        coef  se(coef)  lower 0.95  upper 0.95      p  -log2(p)
lbd 18.05026   0.03353    17.98455    18.11598 <5e-06       inf
a    0.50993   0.00409     0.50191     0.51794 <5e-06       inf
b    0.40777   0.00557     0.39686     0.41868 <5e-06       inf
"""

Section বিভাগটি এখানে দেখুন 1.2

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.