প্রায়শই একটি পরিসংখ্যান বিশ্লেষককে সেট ডেটাসেট হস্তান্তরিত করা হয় এবং লিনিয়ার রিগ্রেশন জাতীয় প্রযুক্তি ব্যবহার করে একটি মডেল ফিট করতে বলা হয়। খুব ঘন ঘন ডেটাসেটের সাথে "ওহ হ্যাঁ, আমরা এর মধ্যে কিছু ডেটা পয়েন্ট সংগ্রহ করতে ভুল করেছি - আপনি যা করতে পারেন তা করুন" এর অনুরূপ একটি দাবি অস্বীকার করার সাথে থাকে।
এই পরিস্থিতিটি রিগ্রেশন ফিটগুলির দিকে পরিচালিত করে যা বহিরাগতদের উপস্থিতি দ্বারা ভীষণভাবে প্রভাবিত হয় যা ভুল তথ্য হতে পারে be নিম্নলিখিত দেওয়া:
বৈজ্ঞানিক ও নৈতিক উভয় দিক থেকেই এটি বিপজ্জনক, কারণ এটি "ফিটকে খারাপ দেখাচ্ছে" ব্যতীত অন্য কোনও কারণে ডেটা ফেলে দেওয়া।
বাস্তব জীবনে, যারা তথ্য সংগ্রহ করেছেন তারা প্রায়শই "এই ডেটা সেটটি তৈরি করার সময়, আপনি কোন পয়েন্টটি ঠিক গোলমাল করেছেন?" এর মতো প্রশ্নের উত্তর দিতে পাওয়া যায় না?
লিনিয়ার রিগ্রেশন বিশ্লেষণে বহিরাগতদের বাদ দেওয়ার জন্য কোন পরিসংখ্যানগত পরীক্ষা বা থাম্বের নিয়মগুলি ভিত্তি হিসাবে ব্যবহার করা যেতে পারে?
মাল্টিলাইনার রিগ্রেশন জন্য কোন বিশেষ বিবেচনা আছে?