আমার অবস্থা:
- ছোট নমুনার আকার: 116
- বাইনারি ফলাফল পরিবর্তনশীল
- ব্যাখ্যামূলক ভেরিয়েবলের দীর্ঘ তালিকা: 44
- ব্যাখ্যামূলক পরিবর্তনশীলগুলি আমার মাথার শীর্ষ থেকে আসে নি; তাদের পছন্দ সাহিত্যের উপর ভিত্তি করে ছিল।
- বেশিরভাগ ক্ষেত্রে নমুনা এবং বেশিরভাগ ভেরিয়েবলের মান অনুপস্থিত missing
বৈশিষ্ট্য নির্বাচনের পন্থা বেছে নেওয়া হয়েছে: লাসো
আর এর গ্ল্যামনেট প্যাকেজটি আমাকে গ্ল্যামনেট রুটিন চালাতে দেবে না, সম্ভবত আমার ডেটা সেটে মূল্যবোধের অস্তিত্ব রয়েছে। অনুপস্থিত ডেটা হ্যান্ডল করার বিভিন্ন পদ্ধতি রয়েছে বলে মনে হয়, তাই আমি জানতে চাই:
- আমি ব্যবহার করতে পারি এমন অভিশংসনের পদ্ধতির ক্ষেত্রে লাসো কি কোনও বিধিনিষেধ আরোপ করে?
- অভিশংসনের পদ্ধতির জন্য সেরা বাজি কী হবে? আদর্শভাবে, আমার এমন একটি পদ্ধতি প্রয়োজন যা আমি এসপিএসএসে চালাতে পারি (অগ্রাধিকার সহ) বা আর।
আপডেট 1: এটি নীচের কয়েকটি উত্তর থেকে স্পষ্ট হয়ে উঠেছে যে আমি অভিবাসন পদ্ধতি বিবেচনা করার আগে আরও মূল বিষয়গুলি নিয়ে কাজ করেছি। আমি এখানে সে সম্পর্কে নতুন প্রশ্ন যুক্ত করতে চাই। উত্তরের ক্ষেত্রে কোডিংটি ধ্রুবক মান হিসাবে এবং 'প্রযোজ্য নয়' মান এবং গ্রুপ লাসো ব্যবহারের সাথে মোকাবিলা করার জন্য একটি নতুন ভেরিয়েবল তৈরির পরামর্শ দেয়:
- আপনি কি বলবেন যে আমি যদি গ্রুপ লাসো ব্যবহার করি তবে আমি ধারাবাহিক ভবিষ্যদ্বাণীকারীদেরও প্রস্তাবিত দৃষ্টিভঙ্গিগুলিকে শ্রেণিবদ্ধ ভবিষ্যদ্বাণীদের ব্যবহার করতে সক্ষম হব? যদি তা হয় তবে আমি ধরে নিই এটি একটি নতুন বিভাগ তৈরি করার সমতুল্য হবে - আমি সতর্ক যে এটি পক্ষপাতিত্বের পরিচয় দিতে পারে।
- আর এর গ্ল্যামনেট প্যাকেজটি গ্রুপ লাসো সমর্থন করে কিনা তা কি কেউ জানেন? যদি তা না হয় তবে লজিস্টিক রিগ্রেশনের সাথে মিশ্রিত করে এমন কেউ কি অন্যকে পরামর্শ দেবেন? গ্রুপ লাসো উল্লেখ করে বেশ কয়েকটি বিকল্প সিআরএএন সংগ্রহস্থলে পাওয়া যাবে, আমার ক্ষেত্রে সবচেয়ে উপযুক্ত কোন পরামর্শ? হয়তো এসজিএল?
এটি আমার পূর্ববর্তী প্রশ্নের একটি ফলো-আপ ( লজিস্টিক রিগ্রেশন বিশ্লেষণ সম্পাদন করতে আমার মূল দীর্ঘ তালিকা থেকে ভেরিয়েবলগুলির একটি উপসেট কীভাবে নির্বাচন করবেন? )।
ওবিএস: আমি কোনও পরিসংখ্যানবিদ নই।