গাউসিয়ান ত্রুটিযুক্ত সরল লিনিয়ার রিগ্রেশন একটি খুব দুর্দান্ত বৈশিষ্ট্য যা সাধারণত রৈখিক মডেলগুলিকে সাধারণীকরণ করে না।
সাধারণ রৈখিক মডেলগুলিতে প্রতিক্রিয়া গড় প্রদত্ত কিছু বিতরণ অনুসরণ করে । লিনিয়ার রিগ্রেশন এই প্যাটার্ন অনুসরণ করে; যদি আমাদের থাকে
yi=β0+β1xi+ϵi
সঙ্গে ϵi∼N(0,σ)
তাহলে আমাদেরও আছে
yi∼N(β0+β1xi,σ)
ঠিক আছে, সুতরাং প্রতিক্রিয়া সাধারণ রৈখিক মডেলগুলির জন্য প্রদত্ত বিতরণ অনুসরণ করে, তবে লিনিয়ার রিগ্রেশনের জন্য আমাদের কাছে এও রয়েছে যে অবশিষ্টাংশগুলি গাউসীয় বিতরণ অনুসরণ করে। কেন এটি জোর দেওয়া হয় যে যখন সাধারণীকরণের নিয়মটি না হয় তখন অবশিষ্টাংশগুলি স্বাভাবিক? ঠিক আছে, কারণ এটি অনেক বেশি কার্যকর নিয়ম। অবশিষ্টাংশের স্বাভাবিকতা সম্পর্কে চিন্তাভাবনা করার দুর্দান্ত জিনিসটি এটি পরীক্ষা করা আরও সহজ। যদি আমরা আনুমানিক উপায়গুলি বিয়োগ করি তবে সমস্ত অবশিষ্টাংশের মোটামুটি একই রকম বৈকল্পিক এবং মোটামুটি একই গড় (0) হওয়া উচিত এবং মোটামুটিভাবে সাধারণভাবে বিতরণ করা হবে (দ্রষ্টব্য: আমি "মোটামুটি" বলি কারণ যদি আমাদের কাছে নির্ভুল অনুমান না থাকে তবে রিগ্রেশন পরামিতি, আমরা অবশ্যই না, ϵ i এর অনুমানের বৈকল্পিক ϵi এর ব্যাপ্তির উপর ভিত্তি করে বিভিন্ন রূপ থাকবে । তবে আশা করা যায় যে অনুমানের ক্ষেত্রে এটি যথাযথ নির্ভুলতা রয়েছে যে এটি উপেক্ষা করা যায়!)।x
অন্যদিকে, অনিয়ন্ত্রিত দিকে তাকিয়ে এর, আমরা আসলেই বলতে পারবেন না, যদি তারা সব বিভিন্ন উপায় আছে যদি তারা সাধারণ ব্যাপার। উদাহরণস্বরূপ, নিম্নলিখিত মডেলটি বিবেচনা করুন:yi
yi=0+2×xi+ϵi
সঙ্গে এবং এক্স আমি ~ বের্নুলির ( পি = 0.5 )ϵi∼N(0,0.2)xi∼Bernoulli(p=0.5)
তাহলে অত্যন্ত বিমোডাল হব, তবে রৈখিক প্রতিরোধের অনুমানগুলি লঙ্ঘন করে না! অন্যদিকে, অবশিষ্টাংশগুলি মোটামুটি স্বাভাবিক বিতরণ অনুসরণ করবে।yi
R
উদাহরণস্বরূপ এখানে কিছু কোড।
x <- rbinom(1000, size = 1, prob = 0.5)
y <- 2 * x + rnorm(1000, sd = 0.2)
fit <- lm(y ~ x)
resids <- residuals(fit)
par(mfrow = c(1,2))
hist(y, main = 'Distribution of Responses')
hist(resids, main = 'Distribution of Residuals')