নামমাত্র বা অর্ডিনাল ডেটাতে বিভাগের সংখ্যা হ্রাস করার জন্য আমি কোনও পদ্ধতি খুঁজতে লড়াই করছি।
উদাহরণস্বরূপ, আসুন আমরা বলি যে আমি একটি ডেটাসেটে একটি রিগ্রেশন মডেল তৈরি করতে চাই যেখানে বেশ কয়েকটি নামমাত্র এবং অর্ডিনাল ফ্যাক্টর রয়েছে। যদিও এই পদক্ষেপে আমার কোনও সমস্যা নেই, আমি প্রায়শই এমন পরিস্থিতিতে চলে যাই যেখানে নামমাত্র বৈশিষ্ট্যটি প্রশিক্ষণ সেটে পর্যবেক্ষণ ছাড়াই থাকে তবে পরে বৈধতা ডেটাসেটে উপস্থিত থাকে। এটি স্বাভাবিকভাবেই ত্রুটির দিকে পরিচালিত করে যখন মডেলটি (এতদূর) অদেখা কেসগুলির সাথে উপস্থাপন করা হয়। আরও কয়েকটি পরিস্থিতি যেখানে আমি বিভাগগুলি সংযুক্ত করতে চাই তা কেবল তখন যখন কয়েকটি পর্যবেক্ষণের সাথে অনেকগুলি বিভাগ থাকে।
সুতরাং আমার প্রশ্নগুলি হ'ল:
- আমি যখন উপলব্ধি করেছি যে তারা উপস্থাপন করে এমন পূর্ব-বাস্তব পটভূমি তথ্যের উপর ভিত্তি করে অনেক নামমাত্র (এবং অর্ডিনাল) বিভাগগুলি একত্রিত করা ভাল, তবে কি পদ্ধতিগত পদ্ধতি (
R
প্যাকেজগুলি পছন্দনীয়) উপলব্ধ? - কাট-অফ থ্রেশহোল্ড ইত্যাদি সম্পর্কে আপনি কোন নির্দেশিকা এবং পরামর্শগুলি করবেন?
- সাহিত্যের সর্বাধিক জনপ্রিয় সমাধানগুলি কী কী?
- একটি নতুন, "OTHERS" বিভাগের সাথে ছোট নামমাত্র বিভাগগুলি সংযুক্তকরণ ছাড়াও কী অন্যান্য কৌশল আছে?
আপনার যদি অন্যান্য পরামর্শও থাকে তবে বিনা দ্বিধায় চিম করুন।