দেখে মনে হচ্ছে আপনি বুঝতে পেরেছেন যে আপনি n
স্তরগুলি তুলতে সক্ষম হলেন, এর বিপরীতে n-1
, কারণ লিনিয়ার রিগ্রেশনের বিপরীতে আপনাকে নিখুঁত কোলিনারিটির বিষয়ে চিন্তা করার দরকার নেই।
(আমি এটি আর এর দৃষ্টিকোণ থেকে আসছি, তবে আমি পাইথনের ক্ষেত্রে এটি একইরকম অনুমান করি)) এটি বেশ কয়েকটি বিষয়ের উপর নির্ভর করে, যেমন 1) আপনি কোন প্যাকেজটি ব্যবহার করছেন এবং ২) আপনার কতগুলি ফ্যাক্টর স্তর রয়েছে।
1) আপনি যদি আর এর randomForest
প্যাকেজটি ব্যবহার করে থাকেন তবে আপনার <33 ফ্যাক্টর স্তরগুলি যদি থাকে তবে আপনি চাইলে এগিয়ে যেতে পারেন এবং সেগুলি একটি বৈশিষ্ট্যে রেখে দিতে পারেন। এটি কারণ আর এর এলোমেলো বন বাস্তবায়নের সময় এটি পরীক্ষা করে দেখাবে যে কোন ফ্যাক্টরের স্তরগুলি বিভাজনের একপাশে থাকতে হবে এবং অন্যদিকে কোনটি (উদাহরণস্বরূপ, আপনার স্তরগুলির 5 টি বাম দিকে একত্রে বিভক্ত করা যেতে পারে, এবং 7 টি গ্রুপ করা যেতে পারে একসাথে ডানদিকে)। আপনি যদি শ্রেণিবদ্ধ বৈশিষ্ট্যটিকে n
ডমিগুলিতে বিভক্ত করেন তবে অ্যালগরিদমের কাছে এটির বিকল্প নেই।
স্পষ্টতই যদি আপনি যে বিশেষভাবে প্যাকেজটি ব্যবহার করছেন সেটি বিভাগীয় বৈশিষ্ট্যগুলি পরিচালনা করতে না পারে তবে আপনার কেবল n
ডামি ভেরিয়েবলগুলি তৈরি করতে হবে ।
2) আমি উপরে বর্ণিত হিসাবে, আর এর এলোমেলো বন বাস্তবায়ন কেবল 32 ফ্যাক্টর স্তরগুলি পরিচালনা করতে পারে - আপনার যদি এর চেয়ে বেশি থাকে তবে আপনাকে হয় নিজের উপাদানগুলি আরও ছোট ছোট উপচ্ছেদে বিভক্ত করতে হবে বা প্রতিটি স্তরের জন্য একটি ডামি ভেরিয়েবল তৈরি করতে হবে।
randomForest
স্বয়ংক্রিয়ভাবে কোডিং হয়, আমারn
ডামিদের সাথে যাওয়া উচিত কারণ আরএফের জন্য প্রান্তিকতা কোনও সমস্যা নয়?