আপনি অনুমান করতে চান এমন একটি প্রাইমারী লিনিয়ার মডেল থাকলে একাধিক অনুমানের বিষয়টি মোটামুটি সোজা । যাইহোক, জিনিসগুলি কিছুটা জটিল বলে মনে হচ্ছে যখন আপনি আসলে কিছু মডেল নির্বাচন করতে চান (উদাহরণস্বরূপ প্রার্থীর ভেরিয়েবলগুলির একটি বৃহত্তর সেট থেকে প্রেডিকটর ভেরিয়েবলগুলির "সেরা" সেটটি আবিষ্কার করুন - আমি বিশেষত ল্যাসো এবং আর ব্যবহার করে ভগ্নাংশের বহুভুজ সম্পর্কে ভাবছি)।
একটি ধারণা হ'ল অদৃশ্য মানগুলির সাথে মূল ডেটাতে মডেলটিকে ফিট করে এবং তারপরে এমআই ডেটাসেটগুলিতে এই মডেলটির পুনরায় অনুমান করতে এবং আপনার স্বাভাবিকভাবে যেমন অনুমান একত্রিত হয়। তবে এটি সমস্যাযুক্ত বলে মনে হচ্ছে যেহেতু আপনি পক্ষপাতের প্রত্যাশা করছেন (না কেন এমআই প্রথম স্থানে আছেন?), যা শুরু থেকেই "ভুল" মডেল নির্বাচন করতে পারে।
আরেকটি ধারণা হ'ল আপনি প্রতিটি এমআই ডেটাসেটে যে কোনও মডেল নির্বাচন প্রক্রিয়াটি ব্যবহার করছেন - তারপরে আপনি কীভাবে ফলাফলগুলি একত্রিত করবেন যদি সেগুলিতে ভেরিয়েবলের বিভিন্ন সেট অন্তর্ভুক্ত থাকে?
আমি ভেবেছিলাম আমার এমআই ডেটাসেটের একটি সেট স্ট্যাক করা এবং সেগুলি একটি বড় ডেটাসেট হিসাবে বিশ্লেষণ করা যা আপনি তখন একটি একক, "সেরা" মডেল ফিট করতে ব্যবহার করবেন এবং আপনি যে বারবার ব্যবস্থা গ্রহণ করছেন তার জন্য অ্যাকাউন্টে এলোমেলো প্রভাব অন্তর্ভুক্ত করুন প্রতিটি পর্যবেক্ষণ।
এই শব্দটি কি যুক্তিসঙ্গত? বা সম্ভবত অবিশ্বাস্যভাবে নিষ্পাপ? এই ইস্যুতে কোনও পয়েন্টার (একাধিক অভিশাপের সাথে মডেল নির্বাচন) প্রশংসিত হবে।