আমি 6 টি বিভাগের মধ্যে বৈষম্য র্যান্ডম ফরেস্টের সাথে একটি শ্রেণিবদ্ধকরণ মডেলকে প্রশিক্ষণ দিচ্ছি। আমার লেনদেনের ডেটাতে প্রায় 60k + পর্যবেক্ষণ এবং 35 ভেরিয়েবল রয়েছে। এটি প্রায় দেখতে কেমন লাগে তার একটি উদাহরণ এখানে।
_________________________________________________
|user_id|acquisition_date|x_var_1|x_var_2| y_vay |
|-------|----------------|-------|-------|--------|
|111 | 2013-04-01 | 12 | US | group1 |
|222 | 2013-04-12 | 6 | PNG | group1 |
|333 | 2013-05-05 | 30 | DE | group2 |
|444 | 2013-05-10 | 78 | US | group3 |
|555 | 2013-06-15 | 15 | BR | group1 |
|666 | 2013-06-15 | 237 | FR | group6 |
মডেলটি তৈরি হয়ে গেলে, আমি গত কয়েক সপ্তাহ থেকে পর্যবেক্ষণগুলি করতে চাই। সিস্টেমে যেমন পরিবর্তন হয়েছে তেমনি সাম্প্রতিক পর্যবেক্ষণগুলি বর্তমান পর্যবেক্ষণগুলির পরিবেশের সাথে আরও ঘনিষ্ঠভাবে মিলবে যা আমি পূর্বাভাস দিতে চাই। অতএব, আমি একটি ওজন পরিবর্তনশীল তৈরি করতে চাই যাতে র্যান্ডম ফরেস্ট সাম্প্রতিক পর্যবেক্ষণগুলিতে আরও বেশি গুরুত্ব দেয়।
R এ র্যান্ডমফোরেস্ট প্যাকেজটি পর্যবেক্ষণে ওজন পরিচালনা করতে সক্ষম কিনা তা কি কেউ জানেন?
এছাড়াও, আপনি কি দয়া করে ওজন পরিবর্তনশীল তৈরির জন্য একটি ভাল পদ্ধতিটি বলতে পারেন? উদাহরণস্বরূপ, আমার ডেটা 2013 হিসাবে, আমি ভাবছিলাম যে আমি তারিখ থেকে মাসের নম্বরটিকে ওজন হিসাবে নিতে পারি। কেউ কি এই পদ্ধতিতে সমস্যা দেখছেন?
অগ্রিম ধন্যবাদ!