লজিস্টিক রিগ্রেশনে অ্যাডজাস্টড বিজোড় অনুপাত বুঝতে আমাকে সহায়তা করুন


20

আমি একটি কাগজে লজিস্টিক রিগ্রেশন ব্যবহার বুঝতে চেষ্টা করে খুব কষ্ট করে যাচ্ছি। কাগজ প্রাপ্তিসাধ্য এখানে ছানি অস্ত্রোপচারের সময় জটিলতার সম্ভাবনা ভবিষ্যদ্বাণী করা লজিস্টিক রিগ্রেশন ব্যবহার করে।

আমাকে বিভ্রান্ত করার মতো বিষয়টি হ'ল কাগজটি এমন একটি মডেল উপস্থাপন করে যা নীচে বর্ণিত বেসলাইনটিকে 1 এর বিজোড় অনুপাত নির্ধারণ করে:

যে সকল রোগীর ঝুঁকি প্রোফাইলটি সমস্ত ঝুঁকি সূচকগুলির জন্য রেফারেন্স গ্রুপে ছিল (যেমন টেবিল 1 এর সকলের জন্য অ্যাডজাস্টেড OR = 1.00) এটি একটি 'বেসলাইন ঝুঁকি প্রোফাইল' হিসাবে বিবেচিত হতে পারে এবং লজিস্টিক রিগ্রেশন মডেলটি একটি 'বেসলাইন পূর্বাভাস সম্ভাব্যতা' নির্দেশ করে পিসিআর বা ভিএল বা উভয় = 0.736% এর জন্য।

সুতরাং 0,00736 সম্ভাবনা 1. মতভেদ অনুপাত সম্ভাব্যতা থেকে মতভেদ অনুপাত রূপান্তর উপর ভিত্তি করে সঙ্গে উপস্থাপন করা হয়: o=p1p , এটি 1:0.00741=0.00736 এরসমান হতে পারে না 0.00741=0.0073610.00736

এটি আরও বিভ্রান্ত হয়। বেসলাইন থেকে পৃথক মানের একাধিক covariates প্রতিনিধিত্বকারী যৌগিক প্রতিক্রিয়া অনুপাত পূর্বাভাসযুক্ত ঝুঁকি গণনা করতে ব্যবহৃত হয়।

... সারণী 1 থেকে যৌগিক OR বা হবে 1.28 এক্স 1.58 এক্স 2.99 এক্স 2.46 এক্স 1.45 এক্স 1.60 = 34.5, এবং চিত্র 1-এর গ্রাফ থেকে আমরা দেখতে পাচ্ছি যে এই ওআর পিসিআর বা ভিএল বা উভয়ের উভয়েরই সম্ভাব্য সম্ভাবনার সাথে সামঞ্জস্য করে প্রায় 20%

উদাহরণ হিসাবে কাগজগুলি যে মূল্যগুলি দিচ্ছে তাতে পৌঁছানোর একমাত্র উপায় হ'ল এইরকম সংমিশ্রিত প্রতিক্রিয়াগুলির সাথে বেসলাইন সম্ভাবনার গুণন করা : 0.2025=(34.50 × 0.00736)1 + (34.50 × 0.00736)

তাহলে এখানে কি চলছে? বেডলাইন অনুপাত 1 এর বেসলাইন সম্ভাব্যতা 0.5 না হওয়ার জন্য যুক্তিটি কী? উপরে আমি যে আপডেটের সূত্রটি নিয়ে এসেছি তা কাগজে উদাহরণগুলির জন্য সঠিক সম্ভাবনাগুলি নিয়ে আসে তবে এটি যে বৈষম্যের অনুপাতের আমি প্রত্যাশা করতাম এটি সরাসরি গুণ নয়। এটা কি হয় তারপর?


8
পরিভাষা সম্পর্কে আপনার একটি সাধারণ বিভ্রান্তি থাকতে পারে: একটি প্রতিকূলতা , কোনও প্রতিকূল অনুপাত নয়। একটি বিজোড় অনুপাত হ'ল এইরকম একের দ্বারা অন্যের দ্বারা প্রকাশের বিভাজন। p/(1p)
whuber

উত্তর:


35

প্রতিকূলতা সম্ভাবনা প্রকাশ করার একটি উপায়। বৈষম্যের অনুপাতটি কেবল এটিই : একের মধ্যে অন্যের দ্বারা বিভেদগুলি। এর অর্থ একটি বিজোড় অনুপাত হ'ল যা আপনি একটি বিভেদকে অন্য উত্পাদন করে গুণান। আসুন দেখুন তারা কীভাবে এই সাধারণ পরিস্থিতিতে কাজ করে।

প্রতিকূলতা এবং সম্ভাবনার মধ্যে রূপান্তর করা

একটি বাইনারি প্রতিক্রিয়া মতভেদ সুযোগ ঘটনাচক্রে (সঙ্গে কোডেড অনুপাত হয় 1 ), লিখিত Pr ( ওয়াই = 1 ) সুযোগ করে (সঙ্গে কোডেড করে না, 0 ), লিখিত Pr ( ওয়াই = 0 ) :Y1Pr(Y=1)0Pr(Y=0)

Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1Pr(Y=1).

ডানদিকে সমমানের অভিব্যক্তিটি প্রতিক্রিয়াগুলি সন্ধান করার জন্য মডেল পক্ষে যথেষ্ট ices বিপরীতে, নোট করুন যে আমরা সমাধান করতে পারিPr(Y=1)

Pr(Y=1)=Odds(Y)1+Odds(Y)=111+Odds(Y).

পণ্য সরবরাহ সংশ্লেষণ

পণ্য সরবরাহ রিগ্রেশন মডেল লগারিদম মধ্যে মতভেদ এর ব্যাখ্যামূলক ভেরিয়েবল একটি রৈখিক ফাংশন হিসাবে। বেশিরভাগ ক্ষেত্রে, এই ভেরিয়েবলগুলি x 1 , , এক্স পি হিসাবে লিখতে এবং লিনিয়ার ফাংশনে একটি সম্ভাব্য ধ্রুবক শব্দ সহ, আমরা সহগের (যা ডেটা থেকে অনুমান করা যায়) নামকরণ করতে পারি β 1 , , β p এবং β 0 । সাধারণত এটি মডেল উত্পাদন করেYx1,,xpβ1,,βpβ0

log(Odds(Y))=β0+β1x1++βpxp.

প্রতিকৃতিগুলি লোগারিদমকে পূর্বাবস্থায় ফেরানোর মাধ্যমে পুনরুদ্ধার করা যেতে পারে:

Odds(Y)=exp(β0+β1x1++βpxp).

শ্রেণিবদ্ধ ভেরিয়েবল ব্যবহার করে

শ্রেণীবদ্ধ ভেরিয়েবল, যেমন বয়স গ্রুপ, লিঙ্গ, গ্লোকোমার উপস্থিতি ইত্যাদি "ডামি কোডিং" এর মাধ্যমে সংযুক্ত করা হয়। ভেরিয়েবলটি কোডিং করে কীভাবে তা বোঝায় না, আমি একটি ছোট গ্রুপের একটি সহজ উদাহরণ সরবরাহ করব; একাধিক গ্রুপে এর সাধারণীকরণ সুস্পষ্ট হওয়া উচিত। এই গবেষণায় একটি পরিবর্তনশীল হ'ল "পুতুল আকার," তিনটি বিভাগ সহ "বড়", "মাঝারি" এবং "ছোট"। (গবেষণার একইরূপে এই বিশুদ্ধরূপে শ্রেণীগত, দৃশ্যত তাদের সহজাত অর্ডার করার কোন মনযোগ। হিসাবে) স্বজ্ঞা, প্রতিটি বিভাগের নিজস্ব মতভেদ আছে, বলতে "লার্জ" জন্য, α এম "মাঝারি", এবং জন্য α এস "ক্ষুদ্র" জন্য । এর অর্থ এই যে, অন্যান্য সমস্ত জিনিস সমান,αLαMαS

Odds(Y)=exp(αL+β0+β1x1++βpxp)

"বৃহত্তর" বিভাগের যে কারও জন্য,

Odds(Y)=exp(αM+β0+β1x1++βpxp)

"মিডিয়াম" বিভাগের যে কারও জন্য, এবং

Odds(Y)=exp(αS+β0+β1x1++βpxp)

"ক্ষুদ্র" বিভাগে তাদের জন্য।

শনাক্তযোগ্য সহগ তৈরি করা

আমি তাদের হাইলাইট করতে, কারণ আমি আপনি নোটিশ করতে চান যে তারা একটি সহজ পরিবর্তন ঘটতে করার অনুমতি দেয় প্রথম দুই কোফিসিয়েন্টস রঙ্গিন আছে: আমরা কোন সংখ্যা বাছাই পারে এটি যোগ করে এবং, বিটা 0 এবং প্রতিটি থেকে এটা বিয়োগ α এল , α এম , এবং α এস , আমরা কোনও পূর্বাভাসযুক্ত প্রতিক্রিয়া পরিবর্তন করব না। এটি ফর্মের সুস্পষ্ট সমতার কারণে isγβ0αLαMαS

αL+β0=(αLγ)+(γ+β0),

ইত্যাদি যদিও এটি মডেলটির জন্য কোনও সমস্যা উপস্থাপন করে না - এটি এখনও একই জিনিসগুলির পূর্বাভাস দেয় - এটি দেখায় যে পরামিতিগুলি নিজের মধ্যে ব্যাখ্যামূলক নয়। আমরা যখন এই সংযোজন-বিয়োগের কৌশলগুলি করি তখন কী একই থাকে s এটি সহগের মধ্যে পার্থক্য । প্রচলিতভাবে, সনাক্তকরণের এই অভাবটি সমাধান করার জন্য, লোকেরা (এবং ডিফল্টরূপে, সফ্টওয়্যার) প্রতিটি ভেরিয়েবলের একটি বিভাগকে "বেস" বা "রেফারেন্স" হিসাবে বেছে নেয় এবং কেবল শর্ত দেয় যে এর সহগটি শূন্য হবে। এটি অস্পষ্টতা দূর করে।

αLαL,αM,αSβ0

β0

Odds(Base category)=exp(β0+β1X1++βpXp).

No terms associated with any categorical variables appear here. (I have slightly changed the notation at this point: the betas βi now are the coefficients only of the covariates, while the full model includes the alphas αj for the various categories.)

Comparing odds

Let us compare odds. Suppose a hypothetical individual is a

male patient aged 80–89 with a white cataract, no fundal view, and a small pupil being operated on by a specialist registrar, ...

Associated with this patient (let's call him Charlie) are estimated coefficients for each category: α80-89 for his age group, αmale for being male, and so on. Wherever his attribute is the base for its category, the coefficient is zero by convention, as we have seen. Because this is a linear model, the coefficients add. Thus, to the base log odds given above, the log odds for this patient are obtained by adding in

α80-89+αmale+αno Glaucoma++αspecialist registrar.

This is precisely the amount by which the log odds of this patient vary from the base. To convert from log odds, undo the logarithm and recall that this turns addition into multiplication. Therefore, the base odds must be multiplied by

exp(α80-89)exp(αmale)exp(αno Glaucoma)exp(αspecialist registrar).

These are the numbers given in the table under "Adjusted OR" (adjusted odds ratio). (It is called "adjusted" because covariates x1,,xp were included in the model. They play no role in any of our calculations, as you will see. It is called a "ratio" because it is precisely the amount by which the base odds must be multiplied to produce the patient's predicted odds: see the first paragraph of this post.) In order in the table, they are exp(α80-89)=1.58, exp(αmale)=1.28, exp(αno Glaucoma)=1.00, and so on. According to the article, their product works out to 34.5. Therefore

Odds(Charlie)=34.5×Odds(Base).

(Notice that the base categories all have odds ratios of 1.00=exp(0), because including 1 in the product leaves it unchanged. That's how you can spot the base categories in the table.)

Restating the results as probabilities

Finally, let us convert this result to probabilities. We were told the baseline predicted probability is 0.736%=0.00736. Therefore, using the formulas relating odds and probabilities derived at the outset, we may compute

Odds(Base)=0.0073610.00736=0.00741.

Consequently Charlie's odds are

Odds(Charlie)=34.5×0.00741=0.256.

Finally, converting this back to probabilities gives

Pr(Y(Charlie)=1)=111+0.256=0.204.

3
whuber: getting in front of my computer after a very tiring previous day and finding this extraordinary response from you is simply brilliant. You have helped me a lot in a very tight situation. Many thanks. (somehow @ whuber won't show up...)
mahonya
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.