আমি হাই-ডাইমেনশনাল গোষ্ঠীযুক্ত ডেটা (50 সংখ্যার ইনপুট ভেরিয়েবল) এ র্যান্ডম বন ব্যবহার করছি যা হায়ারিকাল স্ট্রাকচারযুক্ত। 70 টি বিভিন্ন বস্তুর 30 পজিশনে 6 টি প্রতিলিপি সহ ডেটা সংগ্রহ করা হয়েছিল যার ফলে 12600 ডেটা পয়েন্ট আসে, যা স্বতন্ত্র নয়।
মনে হয় এলোমেলো বনটি উপাত্তগুলিকে বেশি মানিয়ে যাচ্ছে, যেহেতু প্রশিক্ষণ চলাকালীন একটি বস্তু থেকে ডেটা ছেড়ে দেওয়া এবং তারপরে প্রশিক্ষিত এলোমেলো অরণ্যের সাথে বাম আউট অবজেক্টের ফলাফলের পূর্বাভাস দেওয়ার সময় যে ত্রুটিটি আমরা পেয়েছি তার চেয়ে ওব ত্রুটিটি অনেক ছোট। তবুও আমি অবশিষ্টাংশের সাথে সম্পর্ক স্থাপন করেছি।
আমি মনে করি যে এলোমেলোভাবে বন কারণ স্বাধীন বেনিফিট আশা করে। ডেটাগুলির শ্রেণিবদ্ধ কাঠামো সম্পর্কে এলোমেলো বন বলতে কি সম্ভব? অথবা আরও একটি শক্তিশালী টুকরো টুকরো বা সংকোচন পদ্ধতি আছে যা একটি শক্তিশালী মিথস্ক্রিয়া কাঠামোর সাথে উচ্চ-মাত্রিক গ্রুপযুক্ত ডেটা পরিচালনা করতে পারে?
কোনও ইঙ্গিত কীভাবে আমি আরও ভাল করতে পারি?