2
সিদ্ধান্ত গাছগুলির জন্য শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি কোডিংয়ের সেরা অনুশীলনগুলি?
লিনিয়ার রিগ্রেশন জন্য শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি কোডিং করার সময়, একটি নিয়ম রয়েছে: ডামির সংখ্যা মোট স্তরের সংখ্যার চেয়ে কম হওয়া উচিত (কোলাইনারিটি এড়াতে)। সিদ্ধান্ত গাছের জন্য কি একই ধরণের নিয়ম রয়েছে (ব্যাগড, বুস্টেড)? আমি এটি জিজ্ঞাসা করছি কারণ পাইথনে একটি স্ট্যান্ডার্ড অনুশীলন মনে হয় nস্তরগুলি nডমিগুলিতে (স্কালার্নস ' OneHotEncoderবা পান্ডাস' pd.get_dummies) …