শ্রেণিবদ্ধ ভেরিয়েবলগুলির সাথে লগিট রিগ্রেশনে ইন্টারঅ্যাকশন শর্তাদি ব্যাখ্যা করা


25

আমার কাছে একটি সমীক্ষা পরীক্ষা থেকে ডেটা রয়েছে যাতে উত্তরদাতাদের এলোমেলোভাবে চারটি দলের মধ্যে একটিতে নিয়োগ দেওয়া হয়েছিল:

> summary(df$Group)
       Control     Treatment1     Treatment2     Treatment3 
            59             63             62             66 

তিনটি চিকিত্সা গোষ্ঠী প্রয়োগ করা উদ্দীপকটিতে কিছুটা পৃথক হয়, তবে আমি যে প্রধান পার্থক্যটি বিবেচনা করি তা নিয়ন্ত্রণ এবং চিকিত্সা গ্রুপগুলির মধ্যে। সুতরাং আমি একটি ডামি ভেরিয়েবল সংজ্ঞায়িত করেছি Control:

> summary(df$Control)
     TRUE FALSE 
       59   191 

সমীক্ষায়, উত্তরদাতাদের (অন্য বিষয়গুলির মধ্যে) দু'টি পছন্দের বিষয় বেছে নিতে জিজ্ঞাসা করা হয়েছিল:

> summary(df$Prefer)
      A   B  NA's 
    152  93   5 

তারপরে, তাদের চিকিত্সা গোষ্ঠী দ্বারা নির্ধারিত কিছু উদ্দীপনা পাওয়ার পরে (এবং যদি তারা নিয়ন্ত্রণ গোষ্ঠীতে থাকত তবে কিছুই না), উত্তরদাতাকে একই দুটি জিনিসের মধ্যে চয়ন করতে বলা হয়েছিল:

> summary(df$Choice)
  A    B 
149  101 

আমি জানতে চাই যে তিনটি চিকিত্সা দলের মধ্যে একজনের এই শেষ প্রশ্নটিতে উত্তরদাতারা যে পছন্দ করেছেন তাতে কোনও প্রভাব ফেলেছিল কি না। আমার হাইপোথিসিসটি হ'ল যে চিকিত্সা প্রাপ্ত উত্তরদাতাদের Aতুলনায় তার চেয়ে বেশি সম্ভাবনা রয়েছে B

আমি বর্ণিত ডেটা নিয়ে কাজ করছি তা প্রদত্ত, আমি একটি লগইট রিগ্রেশন ব্যবহার করার সিদ্ধান্ত নিয়েছি (আপনি যদি এটি ভুল বলে মনে করেন তবে নির্দ্বিধায় চটজলদি)। যেহেতু উত্তরদাতাদের এলোমেলোভাবে নির্ধারিত করা হয়েছিল, তাই আমি এই ধারণাটির আওতায় আছি যে আমার অন্যান্য ভেরিয়েবলগুলির (যেমন ডেমোগ্রাফিক্স) জন্য নিয়ন্ত্রণ করার প্রয়োজন হবে না, তাই আমি এই প্রশ্নের বাইরে রেখে দিয়েছি। আমার প্রথম মডেলটি কেবল নিম্নরূপ ছিল:

> x0 <- glm(Product ~ Control + Prefer, data=df, family=binomial(link="logit"))
> summary(x0)

Call:
glm(formula = Choice ~ Control + Prefer, family = binomial(link = "logit"), 
    data = df)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.8366  -0.5850  -0.5850   0.7663   1.9235  

Coefficients:
                    Estimate Std. Error z value Pr(>|z|)    
(Intercept)           1.4819     0.3829   3.871 0.000109 ***
ControlFALSE         -0.4068     0.3760  -1.082 0.279224    
PreferA              -2.7538     0.3269  -8.424  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 328.95  on 244  degrees of freedom
Residual deviance: 239.69  on 242  degrees of freedom
  (5 observations deleted due to missingness)
AIC: 245.69

Number of Fisher Scoring iterations: 4

আমি এই ধারণাটির আওতায় আছি যে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া বাধা হ'ল এমন কিছু নয় যা ব্যাখ্যাযোগ্য অর্থ ধারণ করে। আমি ভেবেছিলাম সম্ভবত আমার একটি মিথস্ক্রিয়া শব্দটি নিম্নলিখিত হিসাবে অন্তর্ভুক্ত করা উচিত:

> x1 <- glm(Choice ~ Control + Prefer + Control:Prefer, data=df, family=binomial(link="logit"))
> summary(x1)

Call:
glm(formula = Product ~ Control + Prefer + Control:Prefer, family = binomial(link = "logit"), 
    data = df)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.5211  -0.6424  -0.5003   0.8519   2.0688  

Coefficients:
                                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)                         3.135      1.021   3.070  0.00214 ** 
ControlFALSE                       -2.309      1.054  -2.190  0.02853 *  
PreferA                            -5.150      1.152  -4.472 7.75e-06 ***
ControlFALSE:PreferA                2.850      1.204   2.367  0.01795 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 328.95  on 244  degrees of freedom
Residual deviance: 231.27  on 241  degrees of freedom
  (5 observations deleted due to missingness)
AIC: 239.27

Number of Fisher Scoring iterations: 5

এখন চিকিত্সা গোষ্ঠীর মতো উত্তরদাতাদের স্থিতির প্রত্যাশিত প্রভাব রয়েছে। এটি কি পদক্ষেপের বৈধ সেট ছিল? আমি ইন্টারঅ্যাকশন শব্দটি কীভাবে ব্যাখ্যা করতে পারি ControlFALSE:PreferA? অন্যান্য সহগগুলি এখনও লগের প্রতিকূলতা রয়েছে?


আমার উত্তরটি এখানে প্রাসঙ্গিক: stats.stackexchange.com/questions/246873/…
kjetil b halvorsen

উত্তর:


31

আমি ধরে নিয়েছি যে PreferA = 1 টি যখন অন্য কাউকে A এবং 0 কে অগ্রাধিকার দেয় এবং যখন চিকিত্সা করা হয় তখন নিয়ন্ত্রণ = 1 এবং যখন নিয়ন্ত্রণ থাকে 0 0

প্রি এফিংয়ের বিভেদগুলি যখন কোনও ব্যক্তি আগে করেনি এবং চিকিত্সা গ্রহণ করেনি (কন্ট্রোলফালএসএ = 0 এবং প্রেফারএ = 0) হ'ল , অর্থাৎ ২৩ জন এমন ব্যক্তি আছেন যারা এ জাতীয় প্রত্যেক ব্যক্তির জন্য এ পছন্দ করেন। যে বি পছন্দ করে তাই একটি খুব জনপ্রিয়।exp(3.135)=23

ট্রিটমেন্টের প্রভাব কোনও ব্যক্তিকে বোঝায় যে পূর্বে একটি পছন্দ করে না (PreferA = 0)। সেক্ষেত্রে বেসলাইন একটি ফ্যাক্টর বা দ্বারা কমে যায় যখন সে বা তার সাথে চিকিত্সা করা হয়। সুতরাং যাদের চিকিত্সা করা হয়েছিল এবং এটিকে হয়নি তাদের জন্য এ নির্বাচনের হ'ল , সুতরাং সেখানে ২.৩ এমন ব্যক্তি যিনি বি পছন্দ করেন এমন প্রতিটি ব্যক্তির জন্য এ পছন্দ করেন তাই এই গোষ্ঠীর মধ্যে এ এখনও আরও জনপ্রিয় বি এর চেয়ে কম, তবে চিকিত্সাবিহীন / বেসলাইন গোষ্ঠীর চেয়ে কম।( 1 - .099 ) × 100 % = - 90.1 %exp(2.309)=.099(1.099)×100%=90.1%.09923=2.3

প্রিফারিং এর প্রভাব পূর্বে এমন কোনও ব্যক্তিকে বোঝায় যে একজন নিয়ন্ত্রণ (কন্ট্রোলএফএলএসই = 0)। সেক্ষেত্রে বেসলাইন একটি ফ্যাক্টর দ্বারা বা হ্রাস পায় যখন কেউ আগে পছন্দ করে। (সুতরাং যারা এটিকে আগে দেখিয়েছিল তাদের এখনকার সম্ভাবনা অনেক কম- 99.4 %.00699.4%

ইন্টারেক্টিভ ইফেক্টটি সেই ব্যক্তিদের জন্য চিকিত্সার প্রভাবের তুলনা করে যারা আগে এ পছন্দ করে এবং যারা করেনি তাদের জন্য। যদি কোনও ব্যক্তি পূর্ব (PreferA = 1) কে অগ্রাধিকার দেয় তবে চিকিত্সার বিজোড় অনুপাতটি একটি ফ্যাক্টর দ্বারা বৃদ্ধি পায় । সুতরাং এর আগে যারা পছন্দ করেন তাদের ক্ষেত্রে চিকিত্সার বিজোড় অনুপাত । বিকল্পভাবে, চিকিত্সার এই প্রতিকূল যারা আগে পছন্দ করে তাদের জন্য হিসাবে গণনা করা যেতে পারে ।17.3 × .099 = 1.71 Exp ( 2.850 - 2.309 )exp(2.850)=17.317.3×.099=1.71exp(2.8502.309)

সুতরাং এক্সফেনসেটেড ধ্রুবকটি আপনাকে বেসলাইন প্রতিকূলতা দেয় , অন্যান্য প্রভাবগুলি 0 এর সমান হলে মূল প্রভাবগুলির ক্ষতিকারক সহগগুলি আপনাকে বিজোড় অনুপাত প্রদান করে এবং ইন্টারঅ্যাকশন শর্তাবলীর এক্সফোনেনটেটেড সহগ আপনাকে বিজোড় অনুপাতের পরিবর্তনের দ্বারা অনুপাতটি বলে দেয় ।


আপনাকে ধন্যবাদ মার্টেন, এটি আমার পক্ষে অন্যান্য সম্পর্কিত প্রশ্নের উত্তর হিসাবে খুব সহায়ক। যদিও আমি এক পর্যায়ে কিছুটা ব্যাখ্যা চাই ation আমার অন্যান্য প্রশ্নে আমি যেমন ইঙ্গিত করেছি, আমি এখানে যা করেছি তার পরিসংখ্যানগত বৈধতা সম্পর্কে উদ্বিগ্ন কারণ ControlFALSEপ্রথম মডেলটির উচ্চ মানের পি-ভ্যালু এবং তারপরে দ্বিতীয় মডেলটিতে মোটামুটি কম। এই নির্দিষ্ট ক্ষেত্রে আমার অন্য প্রশ্নের উত্তরটি প্রয়োগ করে আপনি বলেছিলেন যে Controlএটি একটি গ্রুপের উপর নেতিবাচক প্রভাব ফেলতে পারে Preferএবং অন্যটিতে ইতিবাচক প্রভাব ফেলতে পারে।
পিগমালিয়ন

(স্পেসের বাইরে দৌড়ে) এখানে কি সেই ব্যাখ্যাটি বোঝা যায়? কীভাবে সরাসরি এটি প্রয়োগ করা যায় আমি ঠিক নিশ্চিত নই।
পিগমালিয়ন

প্রভাব ControlFALSEপ্রথম মডেল জন্য চিকিত্সা প্রভাব উভয় , ঐ prefered পূর্বে এবং ঐ যে করতে না পারলেও দ্বিতীয় মডেল প্রভাব শুধুমাত্র যারা পূর্বে পছন্দ করা হয়নি জন্য চিকিত্সা প্রভাব। তা ঠিক আছে কি না তা কোনও পরিসংখ্যানগত প্রশ্ন নয়, তবে তা প্রকৃত অর্থে দেয় কি না।
মার্টেন বুইস

@ মার্টেনবুইস দুর্দান্ত ব্যাখ্যা। আপনি কীভাবে অনুমানের আস্থার অন্তরগুলির জন্য সমান গণনা করবেন? স্বাচ্ছন্দ্যের জন্য, আমি সাধারণত লজিস্টিক মডেলগুলিকে স্তরিত করেছি (উদাহরণস্বরূপ এই উদাহরণের আগে অগ্রাধিকার দিয়ে) এবং ইন্টারঅ্যাকশন শব্দটিকে "OR এর মধ্যে উল্লেখযোগ্য পার্থক্যের জন্য পরিসংখ্যানগত পরীক্ষা হিসাবে ব্যবহার করেছি this এটি কি গ্রহণযোগ্য?
ববমকপপ

2

আমি এই কাগজটি লজিস্টিক রিগ্রেশনে ইন্টারঅ্যাকশনটির ব্যাখ্যা করতে সহায়ক বলে মনে করেছি:

চেন, জেজে (2003) জটিল তথ্য যোগাযোগ: একাধিক লজিস্টিক রিগ্রেশন বিশ্লেষণে পরিসংখ্যানিক মিথস্ক্রিয়াটির ব্যাখ্যাআমেরিকান জনস্বাস্থ্যের জার্নাল , 93 (9), 1376-1377।


4
আমি একটি সম্পূর্ণ রেফারেন্স সরবরাহ করেছি (শিরোনাম, লেখক, তারিখ, জার্নাল ইত্যাদি) যার অর্থ লিঙ্কের ঠিকানা পরিবর্তন হলে অবদানটি এখনও কার্যকর হবে। তবে বিষয়বস্তুর সংক্ষিপ্তসার জন্য আপনি এর উপর প্রসারিত করতে পারেন? অন্যথায় এটি একটি উত্তরের চেয়ে সত্যই বেশি মন্তব্য - আমরা আমাদের উত্তরগুলিকে স্বতঃস্ফূর্ত থাকতে পছন্দ করি, সুতরাং তারা "লিঙ্ক-রট" প্রতিরোধী। বিকল্পভাবে আমরা এটিকে আপনার জন্য একটি মন্তব্যে রূপান্তর করতে পারি।
সিলভারফিশ

ধন্যবাদ। আমি এনসিবিআইকে যুক্ত করছিলাম তাই আমি ভেবেছিলাম এটি ভাল হবে। আমি পরিবর্তনের সাথে একমত ধন্যবাদ!
ডিপসিএস

0

আমার নিজস্ব পছন্দ, লজিস্টিক রিগ্রেশন মধ্যে মিথস্ক্রিয়া ব্যাখ্যা করার চেষ্টা করার সময় শ্রেণীবদ্ধ ভেরিয়েবলের প্রতিটি সংমিশ্রনের জন্য পূর্বাভাসযুক্ত সম্ভাবনার দিকে তাকাতে হয়। আপনার ক্ষেত্রে, এটি কেবল 4 সম্ভাব্যতা হবে:

  1. এটিকে পছন্দ করুন, সত্যকে নিয়ন্ত্রণ করুন
  2. এটিকে পছন্দ করুন, মিথ্যা নিয়ন্ত্রণ করুন
  3. বি পছন্দ করুন, সত্য নিয়ন্ত্রণ করুন
  4. বি পছন্দ করুন, মিথ্যা নিয়ন্ত্রণ করুন

যখন আমার অবিচ্ছিন্ন পরিবর্তনশীল হয়, আমি সাধারণত মধ্যম, প্রথম এবং তৃতীয় চতুর্থাংশের পূর্বাভাসিত মানটি দেখি।

যদিও এটি প্রতিটি সহগের ব্যাখ্যাতে সরাসরি আসে না , তবে আমি দেখতে পাই এটি প্রায়শই আমাকে (এবং আমার ক্লায়েন্টদের) দেখতে দেয় যে একটি পরিষ্কার পদ্ধতিতে কী চলছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.