আমরা মডেলগুলি তৈরি করতে রিগ্রেশন বিশ্লেষণ ব্যবহার করি যা প্রতিক্রিয়াশীল ভেরিয়েবলের প্রেডেক্টর ভেরিয়েবলের পরিবর্তনের প্রভাব বর্ণনা করে। কখনও কখনও যদি আমাদের কাছে হ্যাঁ / না বা পুরুষ / মহিলা ইত্যাদির মান সহ শ্রেণীবদ্ধ ভেরিয়েবল থাকে তবে সাধারণ রিগ্রেশন বিশ্লেষণ শ্রেণীবদ্ধ ভেরিয়েবলের প্রতিটি মানের জন্য একাধিক ফলাফল দেয়। এই জাতীয় দৃশ্যে, আমরা ভবিষ্যদ্বাণীকারী ভেরিয়েবলের সাথে ব্যবহার করে এবং শ্রেণিবদ্ধ ভেরিয়েবলের প্রতিটি স্তরের জন্য রিগ্রেশন লাইনের তুলনা করে শ্রেণীবদ্ধ ভেরিয়েবলের প্রভাব অধ্যয়ন করতে পারি। এ জাতীয় বিশ্লেষণকে কোভারিয়েন্সের অ্যানালাইসিস বলা হয় যা তাকে এনকোভা নামেও ডাকা হয়।
উদাহরণ অন্তর্নির্মিত ডেটা সেটটি
বিবেচনা করুন । এটিতে আমরা পর্যবেক্ষণ করি যে ক্ষেত্রটি সংক্রমণ প্রকারের (অটো বা ম্যানুয়াল) প্রতিনিধিত্ব করে। এটি 0 এবং 1 এর মানগুলির সাথে একটি বিভক্ত পরিবর্তনশীল যা কোনও গাড়ির গ্যালন মান ( ) প্রতি মাইল মাইল এছাড়াও ঘোড়ার শক্তি ( ) এর মান ছাড়াও এটির উপর নির্ভর করতে পারে । আমরা এবং এর মধ্যে রিগ্রেশনটির মানটির প্রভাবটি অধ্যয়ন করি । এটি অনুসরণ করে ফাংশনটি ব্যবহার করে করা হয়R
mtcars
am
mpg
hp
am
mpg
hp
aov()
anova()
একাধিক রিগ্রেশনগুলির সাথে তুলনা করার জন্য ।
ইনপুট ডেটা
ক্ষেত্র ধারণকারী একটি ডাটা ফ্রেম তৈরি করুন mpg
, hp
এবং am
ডেটা সেট থেকে mtcars
। এখানে আমরা mpg
প্রতিক্রিয়াশীল ভেরিয়েবল hp
হিসাবে, ভবিষ্যদ্বাণীকারী ভেরিয়েবল am
হিসাবে এবং শ্রেণিবদ্ধ ভেরিয়েবল হিসাবে গ্রহণ করি।
input <- mtcars[,c("am","mpg","hp")]
head(input)
যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:
am mpg hp
Mazda RX4 1 21.0 110
Mazda RX4 Wag 1 21.0 110
Datsun 710 1 22.8 93
Hornet 4 Drive 0 21.4 110
Hornet Sportabout 0 18.7 175
Valiant 0 18.1 105
ANCOVA বিশ্লেষণ
আমরা একটি রিগ্রেশন মডেল গ্রহণ তৈরি hp
predictor পরিবর্তনশীল এবং mpg
প্রতিক্রিয়া পরিবর্তনশীল মধ্যে পারস্পরিক কথোপকথন একাউন্টে গ্রহণ যেমন am
এবং hp
।
শ্রেণীবদ্ধ ভেরিয়েবল এবং প্রিডেক্টর ভেরিয়েবলের মধ্যে মিথস্ক্রিয়া সহ মডেল
রিগ্রেশন মডেল 1 তৈরি করুন
result1 <- aov(mpg~hp*am,data=mtcars)
summary(result1)
যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:
Df Sum Sq Mean Sq F value Pr(>F)
hp 1 678.4 678.4 77.391 1.50e-09 ***
am 1 202.2 202.2 23.072 4.75e-05 ***
hp:am 1 0.0 0.0 0.001 0.981
Residuals 28 245.4 8.8
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
এই ফলাফলটি দেখায় যে উভয় ক্ষেত্রে পি-মান 0.05 এর চেয়ে কম হওয়ায় উভয় ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের গ্যালন প্রতি মাইলের উপর উল্লেখযোগ্য প্রভাব রয়েছে। তবে এই দুটি ভেরিয়েবলের মধ্যে মিথস্ক্রিয়াটি উল্লেখযোগ্য নয় কারণ পি-মান 0.05 এর বেশি।
শ্রেণীবদ্ধ ভেরিয়েবল এবং প্রিডেক্টর ভেরিয়েবলের মধ্যে মিথস্ক্রিয়া ছাড়াই মডেল
রিগ্রেশন মডেল 2 তৈরি করুন
result2 <- aov(mpg~hp+am,data=mtcars)
summary(result2)
যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:
Df Sum Sq Mean Sq F value Pr(>F)
hp 1 678.4 678.4 80.15 7.63e-10 ***
am 1 202.2 202.2 23.89 3.46e-05 ***
Residuals 29 245.4 8.5
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
এই ফলাফলটি দেখায় যে উভয় ক্ষেত্রে পি-মান 0.05 এর চেয়ে কম হওয়ায় উভয় ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের গ্যালন প্রতি মাইলের উপর উল্লেখযোগ্য প্রভাব রয়েছে।
দুটি মডেলের তুলনা করা
এখন আমরা দুটি মডেলের তুলনা করতে পারব যদি ভেরিয়েবলের মিথস্ক্রিয়া সত্যই তুচ্ছ হয়। এর জন্য আমরা anova()
ফাংশনটি ব্যবহার করি ।
anova(result1,result2)
Model 1: mpg ~ hp * am
Model 2: mpg ~ hp + am
Res.Df RSS Df Sum of Sq F Pr(>F)
1 28 245.43
2 29 245.44 -1 -0.0052515 6e-04 0.9806
পি-মান 0.05 এর চেয়ে বেশি হওয়ায় আমরা উপসংহারে পৌঁছলাম যে ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের মধ্যে মিথস্ক্রিয়া গুরুত্বপূর্ণ নয়। সুতরাং গ্যালন প্রতি মাইলেজ অটো এবং ম্যানুয়াল উভয় সংক্রমণ মোডে গাড়ির ঘোড়া শক্তির উপর একইভাবে নির্ভর করবে।