এই প্রশ্ন / বিষয়টি সহকর্মীর সাথে আলোচনায় উঠে এসেছিল এবং আমি এ সম্পর্কে কিছু মতামত খুঁজছিলাম:
আমি একটি এলোমেলো প্রভাব লজিস্টিক রিগ্রেশন ব্যবহার করে কিছু ডেটা মডেলিং করছি, আরও স্পষ্টভাবে একটি এলোমেলো ইন্টারসেপ্ট লজিস্টিক রিগ্রেশন। স্থির প্রভাবগুলির জন্য আমার কাছে 9 টি ভেরিয়েবল রয়েছে যা আগ্রহী এবং বিবেচনায় আসবে। আমি উল্লেখযোগ্য যে ভেরিয়েবলগুলি খুঁজে পেতে এবং "সেরা" মডেলটি দিতে (কেবলমাত্র প্রধান প্রভাবগুলি) দিতে কিছু ধরণের মডেল নির্বাচন করতে চাই।
আমার প্রথম ধারণাটি ছিল বিভিন্ন মডেলের তুলনায় এআইসি ব্যবহার করা কিন্তু 9 ভেরিয়েবলের সাথে আমি 2 ^ 9 = 512 বিভিন্ন মডেলের (কীওয়ার্ড: ডেটা ড্রেজিং) তুলনা করতে খুব আগ্রহী নই।
আমি একজন সহকর্মীর সাথে এটি নিয়ে আলোচনা করেছি এবং তিনি আমাকে বলেছিলেন যে তিনি জিএলএমএমগুলির সাথে ধাপে ধাপে (বা ফরোয়ার্ড) মডেল নির্বাচন ব্যবহারের বিষয়ে পড়ার কথা মনে রেখেছেন। তবে পি-মান (উদাহরণস্বরূপ জিএলএমএমগুলির জন্য সম্ভাবনা অনুপাতের পরীক্ষার উপর ভিত্তি করে) ব্যবহারের পরিবর্তে, এআইসিকে প্রবেশ / প্রস্থান মাপদণ্ড হিসাবে ব্যবহার করা উচিত।
আমি এই ধারণাটি খুব আকর্ষণীয় পেয়েছি তবে আমি এর মধ্যে আরও আলোচনা করে এমন কোনও রেফারেন্স পাই না এবং আমার সহকর্মী সে কোথায় পড়েছিল তা মনে নেই। অনেকগুলি বই এআইসি ব্যবহার করে মডেলগুলির তুলনা করার পরামর্শ দেয় তবে আমি স্টেপওয়াইজ বা ফরোয়ার্ড মডেল নির্বাচন প্রক্রিয়াটির সাথে এটি ব্যবহার করে কোনও আলোচনা পাইনি।
সুতরাং আমার মূলত দুটি প্রশ্ন আছে:
প্রবেশদ্বার / প্রস্থান মাপদণ্ড হিসাবে ধাপে ধাপে মডেল নির্বাচন পদ্ধতিতে এআইসি ব্যবহার করে কোনও ভুল আছে কি? যদি হ্যাঁ হয়, বিকল্প কি হবে?
আপনার কি কিছু রেফারেন্স রয়েছে যা উপরোক্ত পদ্ধতিটি নিয়ে আলোচনা করে (এটিও একটি চূড়ান্ত প্রতিবেদনের রেফারেন্স হিসাবে)?
সেরা
Emilia,