পইসন রিগ্রেশন-এ সহগের কীভাবে ব্যাখ্যা করবেন?


64

কীভাবে আমি পয়েসন রিগ্রেশনে মূল প্রভাবগুলি (ডামি কোডড ফ্যাক্টরের সহগ) ব্যাখ্যা করতে পারি?

নিম্নলিখিত উদাহরণটি ধরুন:

treatment     <- factor(rep(c(1, 2), c(43, 41)), 
                        levels = c(1, 2),
                        labels = c("placebo", "treated"))
improved      <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
                        levels = c(1, 2, 3),
                        labels = c("none", "some", "marked"))    
numberofdrugs <- rpois(84, 10) + 1    
healthvalue   <- rpois(84, 5)   
y             <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test          <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)

আউটপুটটি হ'ল:

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       1.88955    0.19243   9.819   <2e-16 ***
numberofdrugs    -0.02303    0.01624  -1.418    0.156    
treatmenttreated -0.01271    0.10861  -0.117    0.907   MAIN EFFECT  
improvedsome     -0.13541    0.14674  -0.923    0.356   MAIN EFFECT 
improvedmarke    -0.10839    0.12212  -0.888    0.375   MAIN EFFECT 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

আমি জানি যে ঘটনা হার numberofdrugsহয় exp(-0.023)=0.977। তবে আমি কীভাবে ডামি ভেরিয়েবলের মূল প্রভাবগুলি ব্যাখ্যা করব?


একটি অনুরূপ উত্তর (তবে আরও গাণিতিকভাবে ফ্রেমযুক্ত) পাওয়া যাবে এখানে: পোয়েসন জিএলএম ফলাফলগুলিতে পরামিতি অনুমানের কীভাবে ব্যাখ্যা করা যায় ।
গুং - মনিকা পুনরায়

এটি আকর্ষণীয় যে রেফারেন্স করা প্রশ্নটি অফ-টপিক হিসাবে বন্ধ ছিল। (আমি সম্মত হইনি যে এটি বিষয়বস্তু ছিল, যেহেতু কোনও উত্তর ব্যবহারকারীর কাছে সহগের একটি টেবিল ফিরিয়ে দেওয়া কোনও পরিসংখ্যান প্রোগ্রামের ফলাফলের ক্ষেত্রেও প্রযোজ্য এবং আপনার সাথে একমত যে এটি ভিত্তিতে নিকটতম ডুপ্লিকেট হওয়ার কথা।) আমার কাছে মনে হয় যে এসও সম্প্রদায় যে প্রশ্নগুলি আর থেকে আউটপুট ব্যাখ্যা করার জন্য জিজ্ঞাসা করছে সেগুলি সম্পর্কে খুব "টাইট"। তারা স্ট্যাকওভারফ্লোয়ের পক্ষে সত্যিকার অর্থে বিষয়বস্তু নয়, কারণ কোডিং সহায়তা দরকার বলে কোনও পরামর্শ নেই।
DWin

@ ডুইন, আমি মনে করি না যে পরিসংখ্যানগত আউটপুটকে ব্যাখ্যা করা ক্রস ভ্যালিডেটের বিষয়বস্তু । আমি এর সদৃশ হিসাবে প্রশ্নটি বন্ধ করার পক্ষে ভোট দিয়েছি। অন্যরা মনে হয় যে তারা ওটিকে ভোট দিয়েছে, আমি একত্রিত হয়েছি, কারণ তাদের কাছে মনে হয়েছিল যে ওপি "তাদের কম্পিউটার আউটপুট ডাম্প [সম্পাদনা] করেছে এবং [আশা করছেন যে কেউ তাদের জন্য স্ট্যাটাস বিশ্লেষণ চালাবেন")।
গুং - মনিকা পুনরায়

1
@ গুং: আমি স্পষ্ট করেছিলাম যে এটি আপনি নন যে এটিকে ওটি বলেছিলেন। আপনার মতামতগুলি এই বিষয়ে পরিষ্কার ছিল। (আমি ভেবেছিলাম আমি আপনার সাথে একমত হয়েছি।) একটি নিকট ভোটের তালিকাভুক্ত "কারণ" প্রায়শই সংখ্যাগরিষ্ঠ বা বহুবচন সিদ্ধান্ত is
ডিওয়িন

উত্তর:


56

এক্সপেনসেটেড numberofdrugsগুণফল হ'ল 1 ইউনিট দ্বারা বৃদ্ধি healthvalueযখন অনুমান গণনা করতে ব্যবহার করতে গুণ গুণ numberofdrugs। শ্রেণীবদ্ধ (ফ্যাক্টর) ভেরিয়েবলের ক্ষেত্রে, এক্সপেনসেটেড কো-কোপিলিটি হ'ল সেই ভেরিয়েবলের জন্য বেস (প্রথম ফ্যাক্টর) স্তরের সাথে সম্পর্কিত গুণক পদটি (যেহেতু আর ডিফল্টরূপে চিকিত্সা বিপরীতে ব্যবহার করে)। exp(Intercept)বেসলাইন হার, এবং সমস্ত অন্যান্য অনুমান এটি আপেক্ষিক হবে।

আপনার উদাহরণস্বরূপ ওষুধের healthvalueসাথে কারও জন্য অনুমান করা হয়েছে এবং এটি হবে (এক্সপের অভ্যন্তরে অতিরিক্তটি গুণকের সমতুল্য হিসাবে ব্যবহার করে):2"placebo"improvement=="none"

 exp( 1.88955 + 2*-0.02303 + 0 + 0 )
 [1] 6.318552

4ড্রাগ কেউ "treated", এবং "some"উন্নতি যখন একটি অনুমান healthvalueহতে পারে

exp( 1.88955 + 4*-0.02303 + -0.01271 + -0.13541)
[1] 5.203388

অ্যাডেন্ডেন্ডাম: "লগ স্কেলে অ্যাডেটিভ" হওয়ার অর্থ এটি। "লগ-অজস স্কেলে অ্যাডেটিভ" হ'ল বাক্যটি যা আমার শিক্ষক বারবারা ম্যাককাইটে ব্যবহার করেছিলেন যখন কোনও ধরণের পূর্বাভাস দেওয়ার সময় লজিস্টিক রিগ্রেশন প্রয়োগ করা সমস্ত পদ সহগ ব্যবহার করার প্রয়োজনের উপর জোর দেওয়া হয়েছিল। আপনি প্রথমে সমস্ত সহগ গুণগুলি কোভারিয়েট মানগুলিকে যুক্ত করুন এবং তারপরে এটি ঘটাবেন। আর এর মধ্যে রিগ্রেশন অবজেক্টস থেকে সহগের ফেরতের উপায়টি সাধারণত coef()এক্সট্রাক্টর ফাংশনটি ব্যবহার করা হয় (নীচে ভিন্ন ভিন্ন এলোমেলো অনুধাবন দিয়ে সম্পন্ন করা হয়):

 coef(test)
  #   (Intercept)    numberofdrugs treatmenttreated     improvedsome   improvedmarked 
  #   1.18561313       0.03272109       0.05544510      -0.09295549       0.06248684 

তাই সঙ্গে একটি বিষয় জন্য অনুমান হিসাব 4ওষুধ, "treated"সঙ্গে "some"উন্নতি হবে:

 exp( sum( coef(test)[ c(1,2,3,4) ]* c(1,4,1,1) ) ) 
 [1] 3.592999

এবং এই মামলার লিনিয়ার পূর্বাভাসকের যোগফল হওয়া উচিত:

 coef(test)[c(1,2,3,4)]*c(1,4,1,1) 
 #    (Intercept)    numberofdrugs treatmenttreated     improvedsome 
 #     1.18561313       0.13088438       0.05544510      -0.09295549

এই নীতিগুলি কোনও স্ট্যাটাস প্যাকেজের ক্ষেত্রে প্রযোজ্য যা ব্যবহারকারীকে সহগের একটি টেবিল ফেরত দেয়। পদ্ধতিটি এবং নীতিগুলি আমার আর ব্যবহার থেকে প্রদর্শিত হতে পারে তার চেয়ে বেশি সাধারণ।


আমি নির্বাচিত স্পষ্টকারী মন্তব্যগুলি অনুলিপি করছি যেহেতু তারা ডিফল্ট প্রদর্শনটিতে 'অদৃশ্য' হয়ে গেছে:

প্রশ্ন: সুতরাং আপনি সহগকে অনুপাত হিসাবে ব্যাখ্যা করেন! ধন্যবাদ! - মার্কডোলার

উত্তর: গুণাগুণগুলি হ'ল অনুপাতের প্রাকৃতিক_লগারিদম। - ডিওয়িন

প্রশ্ন 2: সেই ক্ষেত্রে, পোয়েসন রিগ্রেশন-এ, ক্ষুদ্রতর গুণাগুণকেও "প্রতিকূল অনুপাত" হিসাবে উল্লেখ করা হয়? - oort

এ 2: না। যদি এটি লজিস্টিক রিগ্রেশন হয় তবে তারা পয়সন রিগ্রেশন-এ থাকত, যেখানে এলএইচএস ইভেন্টগুলির সংখ্যা এবং অন্তর্নিহিত ডিনোমিনিটরটি ঝুঁকির সংখ্যা, তবে ক্ষতিকারক সহগগুলি হ'ল "রেট অনুপাত" বা "আপেক্ষিক ঝুঁকি"।


তাহলে কি আপনি দুবার ভোট দিতে পারবেন? কী সুন্দর. আমি ভেবেছিলাম ব্যাখ্যার কোনও আর কোড প্রয়োগের প্রস্তাব দিলে এটি শ্রেণিবদ্ধকরণের আধিপত্যের শক্তি থেকে উদ্ধার পেতে পারে। ওপি একটি দুর্দান্ত স্ব-নিদর্শন রচনা করেছে। হতে পারে আমার কোনও এক্সট্রাক্টর ফাংশন প্রদর্শন করা উচিত ছিল, তাই আমি মনে করি আমি এটি করব।
ডিউইন

হ্যাঁ, আমি আপনার প্রতিক্রিয়াটিকে এসও তে উন্নত করেছিলাম, তারপরে এটি এখানে চলে গেছে এবং আমি আবারও উত্সাহিত করেছি :)
ব্র্যান্ডন বার্টেলসেন

এখন পর্যন্ত ধন্যবাদ! আমি ডামি এবং ক্যাভারেবলের মধ্যে বাস্তবতা জানি, তবে কীভাবে প্রধান প্রভাবগুলি ব্যাখ্যা করতে পারি সে সম্পর্কে আমি আগ্রহী (আমি সেগুলি চিহ্নিত করেছি)। রেফারেন্স বিভাগ থেকে চিকিত্সার দিকে পরিবর্তন করার সময়, কোনও প্রধান প্রভাব থেকে উদাহরণস্বরূপ ডামি চিকিত্সা করা 'এক্সপ (-0.012) = 0.99' এবং হেল্ট্যালুয়েজ হ্রাস হওয়ার হার হিসাবে এটি কীভাবে ব্যাখ্যা করা সম্ভব? এটা অবশ্যই, না?
মার্কডোলার

সংঘটিত সহগগুলি সর্বদা অনুপাত হিসাবে ব্যাখ্যা করা হয়। 'কী' থেকে 'কী' এর অনুপাত বিশ্লেষণের ইউনিটগুলির উপর নির্ভর করে। অন্তর্ভুক্ত নম্বর এবং সময় মান থাকা 'হার' আলাদা। । তাই আপনি যদি সম্ভবত আপনার পরিভাষা পরিবর্তন করতে হলে, 'হ্যাঁ "ইচ্ছুক সর্বশ্রষ্ঠ উত্তর সম্পূর্ণরূপে বিশ্লেষণ অবস্থা বর্ণনা থেকে আসা।
DWin

আহ ঠিক আছে আমি এটি জানতে চেয়েছিলাম। সুতরাং আপনি সহগকে অনুপাত হিসাবে ব্যাখ্যা করেন! ধন্যবাদ!
মার্কডোলার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.