এটি সত্য যে লিনিয়ার রিগ্রেশন অনুমানগুলি বাস্তববাদী নয়। তবে এটি সমস্ত পরিসংখ্যানের মডেলের ক্ষেত্রে সত্য true "সমস্ত মডেল ভুল, তবে কিছু দরকারী।"
আমি অনুমান করি আপনি এমন ছাপের মধ্যে রয়েছেন যে যখন আপনি আরও জটিল মডেল ব্যবহার করতে পারেন তখন লিনিয়ার রিগ্রেশন ব্যবহার করার কোনও কারণ নেই। এটি সত্য নয়, কারণ সাধারণভাবে আরও জটিল মডেলগুলি অত্যধিক মানানসইয়ের পক্ষে বেশি ঝুঁকিপূর্ণ এবং তারা আরও বেশি গণনামূলক সংস্থান ব্যবহার করে, এটি গুরুত্বপূর্ণ যদি উদাহরণস্বরূপ, আপনি একটি এমবেডেড প্রসেসর বা ওয়েব সার্ভারে পরিসংখ্যান করার চেষ্টা করছেন। সহজ মডেলগুলি বোঝা এবং ব্যাখ্যা করাও সহজ; বিপরীতে, জটিল মেশিন-শেখার মডেল যেমন নিউরাল নেটওয়ার্কগুলি কালো বাক্স হিসাবে কমবেশি ঝোঁক থাকে।
এমনকি যদি কোনও দিন লিনিয়ার রিগ্রেশনটি ব্যবহারিকভাবে কার্যকর না হয়ে যায় (যা প্রত্যাশিত ভবিষ্যতে অত্যন্ত অসম্ভব বলে মনে হয়) তবে এটি তাত্ত্বিকভাবে গুরুত্বপূর্ণ হবে, কারণ আরও জটিল মডেলগুলি ভিত্তি হিসাবে লিনিয়ার রিগ্রেশন গড়ে তুলতে ঝোঁক। উদাহরণস্বরূপ, নিয়মিত মিক্সড-এফেক্টস লজিস্টিক রিগ্রেশন বোঝার জন্য আপনাকে প্রথমে সাধারণ পুরানো লিনিয়ার রিগ্রেশন বুঝতে হবে ression
এটি এমনটি বলার অপেক্ষা রাখে না যে আরও জটিল, নতুন এবং চিকন মডেলগুলি দরকারী বা গুরুত্বপূর্ণ নয়। তাদের অনেকেই আছেন। তবে সহজ মডেলগুলি আরও বিস্তৃতভাবে প্রযোজ্য এবং সেহেতু আরও গুরুত্বপূর্ণ এবং আপনি বিভিন্ন মডেল উপস্থাপন করতে যাচ্ছেন তবে প্রথমে স্পষ্টভাবে উপস্থাপন করার জন্য তা বোঝা যায়। এই দিনগুলিতে লোকেরা যাঁরা নিজেকে "ডেটা বিজ্ঞানী" বা কিছু বলে অভিহিত করেন তাদের দ্বারা প্রচুর পরিমাণে খারাপ ডেটা বিশ্লেষণ করা হয় তবে আস্থাভাজনের অন্তর্বর্ত আসলে কী তা যেমন বেসিক স্টাফগুলিও জানেন না। একটি পরিসংখ্যান না!