আমার কাছে একটি সমীক্ষা পরীক্ষা থেকে ডেটা রয়েছে যাতে উত্তরদাতাদের এলোমেলোভাবে চারটি দলের মধ্যে একটিতে নিয়োগ দেওয়া হয়েছিল:
> summary(df$Group)
Control Treatment1 Treatment2 Treatment3
59 63 62 66
তিনটি চিকিত্সা গোষ্ঠী প্রয়োগ করা উদ্দীপকটিতে কিছুটা পৃথক হয়, তবে আমি যে প্রধান পার্থক্যটি বিবেচনা করি তা নিয়ন্ত্রণ এবং চিকিত্সা গ্রুপগুলির মধ্যে। সুতরাং আমি একটি ডামি ভেরিয়েবল সংজ্ঞায়িত করেছি Control
:
> summary(df$Control)
TRUE FALSE
59 191
সমীক্ষায়, উত্তরদাতাদের (অন্য বিষয়গুলির মধ্যে) দু'টি পছন্দের বিষয় বেছে নিতে জিজ্ঞাসা করা হয়েছিল:
> summary(df$Prefer)
A B NA's
152 93 5
তারপরে, তাদের চিকিত্সা গোষ্ঠী দ্বারা নির্ধারিত কিছু উদ্দীপনা পাওয়ার পরে (এবং যদি তারা নিয়ন্ত্রণ গোষ্ঠীতে থাকত তবে কিছুই না), উত্তরদাতাকে একই দুটি জিনিসের মধ্যে চয়ন করতে বলা হয়েছিল:
> summary(df$Choice)
A B
149 101
আমি জানতে চাই যে তিনটি চিকিত্সা দলের মধ্যে একজনের এই শেষ প্রশ্নটিতে উত্তরদাতারা যে পছন্দ করেছেন তাতে কোনও প্রভাব ফেলেছিল কি না। আমার হাইপোথিসিসটি হ'ল যে চিকিত্সা প্রাপ্ত উত্তরদাতাদের A
তুলনায় তার চেয়ে বেশি সম্ভাবনা রয়েছে B
।
আমি বর্ণিত ডেটা নিয়ে কাজ করছি তা প্রদত্ত, আমি একটি লগইট রিগ্রেশন ব্যবহার করার সিদ্ধান্ত নিয়েছি (আপনি যদি এটি ভুল বলে মনে করেন তবে নির্দ্বিধায় চটজলদি)। যেহেতু উত্তরদাতাদের এলোমেলোভাবে নির্ধারিত করা হয়েছিল, তাই আমি এই ধারণাটির আওতায় আছি যে আমার অন্যান্য ভেরিয়েবলগুলির (যেমন ডেমোগ্রাফিক্স) জন্য নিয়ন্ত্রণ করার প্রয়োজন হবে না, তাই আমি এই প্রশ্নের বাইরে রেখে দিয়েছি। আমার প্রথম মডেলটি কেবল নিম্নরূপ ছিল:
> x0 <- glm(Product ~ Control + Prefer, data=df, family=binomial(link="logit"))
> summary(x0)
Call:
glm(formula = Choice ~ Control + Prefer, family = binomial(link = "logit"),
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8366 -0.5850 -0.5850 0.7663 1.9235
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.4819 0.3829 3.871 0.000109 ***
ControlFALSE -0.4068 0.3760 -1.082 0.279224
PreferA -2.7538 0.3269 -8.424 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 328.95 on 244 degrees of freedom
Residual deviance: 239.69 on 242 degrees of freedom
(5 observations deleted due to missingness)
AIC: 245.69
Number of Fisher Scoring iterations: 4
আমি এই ধারণাটির আওতায় আছি যে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়া বাধা হ'ল এমন কিছু নয় যা ব্যাখ্যাযোগ্য অর্থ ধারণ করে। আমি ভেবেছিলাম সম্ভবত আমার একটি মিথস্ক্রিয়া শব্দটি নিম্নলিখিত হিসাবে অন্তর্ভুক্ত করা উচিত:
> x1 <- glm(Choice ~ Control + Prefer + Control:Prefer, data=df, family=binomial(link="logit"))
> summary(x1)
Call:
glm(formula = Product ~ Control + Prefer + Control:Prefer, family = binomial(link = "logit"),
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.5211 -0.6424 -0.5003 0.8519 2.0688
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.135 1.021 3.070 0.00214 **
ControlFALSE -2.309 1.054 -2.190 0.02853 *
PreferA -5.150 1.152 -4.472 7.75e-06 ***
ControlFALSE:PreferA 2.850 1.204 2.367 0.01795 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 328.95 on 244 degrees of freedom
Residual deviance: 231.27 on 241 degrees of freedom
(5 observations deleted due to missingness)
AIC: 239.27
Number of Fisher Scoring iterations: 5
এখন চিকিত্সা গোষ্ঠীর মতো উত্তরদাতাদের স্থিতির প্রত্যাশিত প্রভাব রয়েছে। এটি কি পদক্ষেপের বৈধ সেট ছিল? আমি ইন্টারঅ্যাকশন শব্দটি কীভাবে ব্যাখ্যা করতে পারি ControlFALSE:PreferA
? অন্যান্য সহগগুলি এখনও লগের প্রতিকূলতা রয়েছে?