আমার একটি ডেটাসেট রয়েছে যাতে ইভেন্টের হার খুব কম ( 40,000 )। আমি এটিতে লজিস্টিক রিগ্রেশন প্রয়োগ করছি। আমি এমন কারও সাথে আলোচনা করেছি যেখানে এটি বেরিয়ে এসেছিল যে লজিস্টিক রিগ্রেশন এত কম ইভেন্টের হারের ডেটাতে ভাল বিভ্রান্তির ম্যাট্রিক্স দেয় না। তবে ব্যবসায়ের সমস্যা এবং এটি সংজ্ঞায়িত করার কারণে, আমি ইভেন্টের সংখ্যা ৪০,০০০ থেকে কোনও বৃহত্তর সংখ্যায় বাড়িয়ে তুলতে পারি না যদিও আমি সম্মতি জানাই যে আমি কিছু জনসংখ্যার লোককে মুছে ফেলতে পারি।
বিশেষ করে আমাকে এই সম্পর্কে আপনার মতামত বলুন:
- লজিস্টিক রিগ্রেশনের নির্ভুলতা কি ইভেন্টের হারের উপর নির্ভর করে বা কোনও ন্যূনতম ইভেন্টের হারের প্রস্তাব দেওয়া হয়?
- লো ইভেন্ট রেট ডেটার জন্য কোনও বিশেষ কৌশল আছে?
- আমার মডেলটির নির্ভুলতার জন্য আমার অবিশ্বাস্য জনসংখ্যা মুছে ফেলা কি ভাল হবে?
আমি পরিসংখ্যানগত মডেলিংয়ে নতুন তাই আমার অজ্ঞতা ক্ষমা করুন এবং দয়া করে যে কোনও সম্পর্কিত সমস্যা সম্পর্কে আমি ভাবতে পারি তার সমাধান করুন।
ধন্যবাদ,