আমি এখানে বিভিন্ন থ্রেড ব্রাউজ করছি, তবে আমার সঠিক প্রশ্নের উত্তর দেওয়া হয়েছে বলে আমি মনে করি না।
আমার কাছে ~ 50,000 শিক্ষার্থীর একটি ডেটাসেট এবং ড্রপ আউট করার সময়। আমি প্রচুর সংখ্যক সম্ভাব্য কোভেরিয়েটদের সাথে আনুপাতিক বিপদ সংক্ষিপ্তকরণ সম্পাদন করতে যাচ্ছি। আমি ড্রপআউট / থাকার বিষয়ে লজিস্টিক রিগ্রেশনও করতে যাচ্ছি The মূল লক্ষ্যটি হবে নতুন নতুন শিক্ষার্থীদের জন্য ভবিষ্যদ্বাণী।
সাধারণত, আমার কাছে ডেটাগুলির মতো বিলাসিতা নেই এবং কোনও ধরণের দণ্ডের সাথে মডেল ফিটিং করি না, তবে এবার আমি ভাবা হয়েছিল প্রশিক্ষণ ও পরীক্ষার ডেটা সেটগুলি বিভক্ত করা এবং তারপরে প্রশিক্ষণের সেটটিতে পরিবর্তনশীল নির্বাচন করা; তারপরে পরামিতি এবং ভবিষ্যদ্বাণীমূলক ক্ষমতা অনুমানের জন্য পরীক্ষার ডেটা সেট ব্যবহার করে।
এটা কি ভাল কৌশল? তা না হলে এর থেকে ভাল আর কী?
উদ্ধৃতি স্বাগত তবে প্রয়োজনীয় নয়।