আমি মনে করি এই পদ্ধতির ভুল হয়েছে, তবে আমি যদি তা ব্যাখ্যা করি তবে সম্ভবত এটি আরও সহায়ক হবে। বিপুল সংখ্যক ভেরিয়েবল সম্পর্কে কিছু তথ্য প্রদত্ত সেরা মডেলটি জানতে চাওয়া যথেষ্ট বোধগম্য। তদুপরি, এটি এমন একটি পরিস্থিতি যেখানে লোকেরা নিজেকে নিয়মিত খুঁজে পায়। এছাড়াও, রিগ্রেশন সম্পর্কিত অনেক পাঠ্যপুস্তক (এবং কোর্স) ধাপে ধাপে নির্বাচন পদ্ধতিগুলি অন্তর্ভুক্ত করে, যা বোঝায় যে সেগুলি অবশ্যই বৈধ হতে হবে। দুর্ভাগ্যক্রমে, তারা না, এবং এই পরিস্থিতি এবং লক্ষ্যটির জুটি সফলভাবে নেভিগেট করা বেশ কঠিন। নীচে স্বয়ংক্রিয় ধাপে ধাপে মডেল নির্বাচন প্রক্রিয়াগুলির সাথে সমস্যার তালিকা রয়েছে (ফ্র্যাঙ্ক হ্যারেলকে দায়ী, এবং এখান থেকে অনুলিপি করা হয়েছে ):
- এটি আর-স্কোয়ার মানগুলি দেয় যা খারাপভাবে পক্ষপাতদুষ্ট উচ্চ।
- প্রিন্টআউটে প্রতিটি ভেরিয়েবলের পাশে উদ্ধৃত F এবং চি-স্কোয়ার পরীক্ষাগুলিতে দাবিযুক্ত বিতরণ নেই।
- পদ্ধতিটি মিথ্যাভাবে সংকীর্ণ প্রভাব এবং পূর্বাভাসিত মানগুলির জন্য আত্মবিশ্বাসের ব্যবধানগুলি দেয়; অল্টম্যান এবং অ্যান্ডারসন (1989) দেখুন।
- এটি পি-মান দেয় যাগুলির সঠিক অর্থ হয় না এবং তাদের জন্য সঠিক সংশোধন করা একটি কঠিন সমস্যা।
- এটি পক্ষপাতদুষ্ট রিগ্রেশন সহগগুলি দেয় যা সঙ্কুচিত হওয়া দরকার (বাকী পরিবর্তনশীলগুলির সহগগুলি খুব বড়; তিবশিরানী [1996] দেখুন)।
- সহপাঠের উপস্থিতিতে এটির মারাত্মক সমস্যা রয়েছে।
- এটি এমন পদ্ধতিগুলির উপর ভিত্তি করে (যেমন নেস্টেড মডেলগুলির জন্য F পরীক্ষাগুলি) যা পূর্বনির্ধারিত হাইপোথেসিসগুলি পরীক্ষা করার জন্য ব্যবহৃত হয়েছিল were
- নমুনার আকার বাড়ানো খুব বেশি সাহায্য করে না; ডারকসেন এবং কেসেলম্যান (1992) দেখুন।
- এটি আমাদের সমস্যার কথা চিন্তা না করার অনুমতি দেয়।
- এটি প্রচুর কাগজ ব্যবহার করে।
প্রশ্নটি হচ্ছে, এই পদ্ধতিগুলি সম্পর্কে কী খারাপ / কেন এই সমস্যাগুলি ঘটে? বেশীরভাগ মানুষই যারা মৌলিক রিগ্রেশন অবশ্যই গ্রহণ করেছে ধারণার সাথে পরিচিত গড় থেকে রিগ্রেশন , তাই এই কি আমি এই বিষয়গুলো ব্যাখ্যা করতে ব্যবহার করেন। (যদিও এটি প্রথমে অফ-বিষয় মনে হতে পারে তবে আমার সাথে সহ্য করুন, আমি প্রতিশ্রুতি দিচ্ছি এটি প্রাসঙ্গিক।)
ট্রায়আউটগুলির প্রথম দিন একটি হাই স্কুল ট্র্যাক কোচ কল্পনা করুন। ত্রিশ বাচ্চা দেখায়। এই বাচ্চাদের অভ্যন্তরীণ দক্ষতার কিছু অন্তর্নিহিত স্তর রয়েছে যার কাছে কোচ বা অন্য কারওাই সরাসরি অ্যাক্সেস পাচ্ছে না। ফলস্বরূপ, কোচ কেবলমাত্র তিনিই করতে পারেন যা তাদের সকলেরই 100 মিটার ড্যাশ চালানো। সময়গুলি সম্ভবত তাদের অভ্যন্তরীণ দক্ষতার একটি পরিমাপ এবং সেভাবে নেওয়া হয়। তবে এগুলি সম্ভাব্য; কেউ কতটা ভাল করে তার কিছু অনুপাত তাদের আসল দক্ষতার উপর ভিত্তি করে এবং কিছু অনুপাত এলোমেলো। কল্পনা করুন যে আসল পরিস্থিতি নিম্নলিখিত:
set.seed(59)
intrinsic_ability = runif(30, min=9, max=10)
time = 31 - 2*intrinsic_ability + rnorm(30, mean=0, sd=.5)
প্রথম দৌড়ের ফলাফলগুলি বাচ্চাদের প্রতি কোচের মন্তব্য সহ নিম্নলিখিত চিত্রটিতে প্রদর্শিত হবে।
নোট করুন যে বাচ্চাদের প্রতিযোগিতামূলক সময় অনুসারে তাদের অভ্যন্তরীণ দক্ষতার উপর ওভারল্যাপ ছেড়ে যায় - এই ঘটনাটি অত্যন্ত গুরুত্বপূর্ণ। কিছু প্রশংসা করার পরে, এবং কিছু অন্যকে চিত্কার (যেমন কোচদের ঝোঁক), তিনি তাদের আবার চালানো হয়েছে। কোচের প্রতিক্রিয়া (উপরে একই মডেল থেকে সিমুলেটেড) সহ দ্বিতীয় রেসের ফলাফল এখানে রয়েছে:
লক্ষ্য করুন যে তাদের অভ্যন্তরীণ দক্ষতা অভিন্ন, তবে সময়টি প্রথম দৌড়ের তুলনায় প্রায় বাউন্স হয়েছিল। কোচের দৃষ্টিকোণ থেকে, তিনি যে উন্নতির দিকে ঝুঁকেছিলেন, এবং তার প্রশংসা করেছেন তারা আরও খারাপ কাজ করতেন (উইকি পৃষ্ঠায় তালিকাভুক্ত কাহিনিমান উক্তি থেকে আমি এই কংক্রিটের উদাহরণটি গ্রহণ করেছি), যদিও প্রকৃতপক্ষে গড়নের প্রতি সংক্ষিপ্ততা একটি সাধারণ গাণিতিক কোচ আংশিক এলোমেলো একটি পরিমাপের উপর ভিত্তি করে দলের হয়ে অ্যাথলেটদের নির্বাচন করছেন।
এখন, এটি স্বয়ংক্রিয়ভাবে (উদাহরণস্বরূপ, পদক্ষেপের) মডেল নির্বাচন কৌশলগুলির সাথে কী করতে পারে? একই ডেটাসেটের উপর ভিত্তি করে একটি মডেল বিকাশ এবং নিশ্চিতকরণকে কখনও কখনও ডেটা ড্রেজিং বলা হয়। যদিও ভেরিয়েবলের মধ্যে কিছু অন্তর্নিহিত সম্পর্ক রয়েছে এবং শক্তিশালী সম্পর্কগুলি শক্তিশালী স্কোর অর্জন করবে বলে আশা করা হয় (যেমন, উচ্চতর টি-স্ট্যাটিস্টিকস), এগুলি এলোমেলো ভেরিয়েবল এবং উপলব্ধ মূল্যবোধে ত্রুটি থাকে। সুতরাং, আপনি যখন উচ্চতর (বা নিম্ন) উপলব্ধি হওয়া মানগুলির ভিত্তিতে ভেরিয়েবলগুলি নির্বাচন করেন, তখন তাদের অন্তর্নিহিত সত্য মান, ত্রুটি বা উভয়ের কারণে এগুলি হতে পারে। আপনি যদি এই পদ্ধতিতে এগিয়ে যান, আপনি কোচ যেমন দ্বিতীয় দফার পরে ছিলেন তেমন অবাক হবেন। আপনি উচ্চ টি-পরিসংখ্যান, বা স্বল্প আন্তঃসংযোগের ভিত্তিতে ভেরিয়েবলগুলি নির্বাচন করেন কিনা তা সত্য। সত্য, পি-ভ্যালু ব্যবহারের চেয়ে এআইসি ব্যবহার করা আরও ভাল, কারণ এটি জটিলতার জন্য মডেলটিকে শাস্তি দেয় তবে এআইসি নিজেই এলোমেলো পরিবর্তনশীল (যদি আপনি বেশ কয়েকবার একটি গবেষণা চালান এবং একই মডেলটি ফিট করেন তবে এআইসি ঠিক একইভাবে চারদিকে বাউন্স করবে) অন্য সবকিছু). দুর্ভাগ্যবশত,
আমি আশা করি এই সহায়ক।