আমি আর এলোমেলো বন মডেল ব্যবহার করে পূর্বাভাস দেওয়ার চেষ্টা করছি am
তবে আমি ত্রুটিগুলি পেয়েছি যেহেতু কিছু উপাদানগুলির প্রশিক্ষণ সংস্থার চেয়ে পরীক্ষার সেটে বিভিন্ন মান রয়েছে। উদাহরণস্বরূপ, পরীক্ষার সেটে কোনও ফ্যাক্টরের Cat_2
মান 34, 68, 76
ইত্যাদি থাকে যা প্রশিক্ষণ সেটে উপস্থিত হয় না। দুর্ভাগ্যক্রমে, টেস্ট সেটে আমার নিয়ন্ত্রণ নেই ... আমার অবশ্যই এটি ব্যবহার করা উচিত।
আমার একমাত্র কাজটি হ'ল সমস্যাযুক্ত বিষয়গুলি পুনরায় সংখ্যার মানগুলিতে রূপান্তর করে ব্যবহার করে as.numeric()
। এটা তোলে কাজ করে কিন্তু আমি খুব, সন্তুষ্ট নই যেহেতু এই মান কোড কোন সংখ্যাসূচক ইন্দ্রিয় আছে আছে ...
আপনি কি মনে করেন যে পরীক্ষার সেট থেকে নতুন মানগুলি ফেলে দেওয়ার জন্য আরও একটি সমাধান হবে? তবে 1, 2, 14, 32
প্রশিক্ষণ এবং পরীক্ষার উভয় ক্ষেত্রেই রয়েছে এমন সমস্ত অন্যান্য ফ্যাক্টর মানগুলি (মানগুলি বলি etc.