গ্রুপযুক্ত ডেটাতে এলোমেলো বন


11

আমি হাই-ডাইমেনশনাল গোষ্ঠীযুক্ত ডেটা (50 সংখ্যার ইনপুট ভেরিয়েবল) এ র্যান্ডম বন ব্যবহার করছি যা হায়ারিকাল স্ট্রাকচারযুক্ত। 70 টি বিভিন্ন বস্তুর 30 পজিশনে 6 টি প্রতিলিপি সহ ডেটা সংগ্রহ করা হয়েছিল যার ফলে 12600 ডেটা পয়েন্ট আসে, যা স্বতন্ত্র নয়।

মনে হয় এলোমেলো বনটি উপাত্তগুলিকে বেশি মানিয়ে যাচ্ছে, যেহেতু প্রশিক্ষণ চলাকালীন একটি বস্তু থেকে ডেটা ছেড়ে দেওয়া এবং তারপরে প্রশিক্ষিত এলোমেলো অরণ্যের সাথে বাম আউট অবজেক্টের ফলাফলের পূর্বাভাস দেওয়ার সময় যে ত্রুটিটি আমরা পেয়েছি তার চেয়ে ওব ত্রুটিটি অনেক ছোট। তবুও আমি অবশিষ্টাংশের সাথে সম্পর্ক স্থাপন করেছি।

আমি মনে করি যে এলোমেলোভাবে বন কারণ স্বাধীন বেনিফিট আশা করে। ডেটাগুলির শ্রেণিবদ্ধ কাঠামো সম্পর্কে এলোমেলো বন বলতে কি সম্ভব? অথবা আরও একটি শক্তিশালী টুকরো টুকরো বা সংকোচন পদ্ধতি আছে যা একটি শক্তিশালী মিথস্ক্রিয়া কাঠামোর সাথে উচ্চ-মাত্রিক গ্রুপযুক্ত ডেটা পরিচালনা করতে পারে?

কোনও ইঙ্গিত কীভাবে আমি আরও ভাল করতে পারি?


শ্রেণিবদ্ধ তথ্য প্রকৃতি কি? এটি কি আপনাকে ডেটার পাতাগুলি আপনার ডেটা পয়েন্ট হিসাবে ব্যবহার করতে দেয়?
CasperOne

1
আপনি কি পৃথক ব্যক্তির চেয়ে উচ্চ স্তরের স্তরের বুটস্ট্র্যাপিং বিবেচনা করেছেন?
জেনেরিক_উজার

উত্তর:


1

পার্টিতেও দেরি হয়ে গেছে তবে আমি মনে করি এটি কয়েক বছর আগে যা কিছু করেছিল তার সাথে সম্পর্কিত হতে পারে। সেই কাজটি এখানে প্রকাশিত হয়েছে:

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0093379

এবং সিদ্ধান্ত গাছের টুকরোতে পরিবর্তনশীল পারস্পরিক সম্পর্ক নিয়ে কাজ করে। আপনার গ্রন্থাগারটি একবার দেখে নেওয়া উচিত যা এই ধরণের সমস্যাগুলি মোকাবেলার জন্য অনেক প্রস্তাবকে নির্দেশ করছে (যা "জেনেটিক" ক্ষেত্রে সাধারণ)।

সোর্স কোড পাওয়া যায় এখানে (কিন্তু সত্যিই এখন আর বজায় হয় না)।


-1

র্যান্ডম ফরেস্টের ওভার-ফিটিং বিভিন্ন কারণে হতে পারে এবং এটি আরএফ প্যারামিটারের উপর নির্ভর করে। আপনি কীভাবে আপনার আরএফ টিউন করেছেন তা আপনার পোস্ট থেকে পরিষ্কার নয়।

এখানে কিছু টিপস যা সহায়তা করতে পারে:

  1. গাছের সংখ্যা বাড়িয়ে দিন

  2. গাছগুলির সর্বোচ্চ গভীরতা টিউন করুন। এই প্যারামিটারটি হাতের সমস্যার উপর নির্ভর করে। ছোট গাছ ব্যবহার করা ওভার ফিটিং সমস্যার ক্ষেত্রে সহায়তা করতে পারে।


2
পার্টিতে খুব দেরি হয়ে গেছে, তবে এই উত্তরটি ডেটা সেটের শ্রেণিবদ্ধ প্রকৃতির কারণে কোনও সমস্যা সমাধান করবে না।
সিবিএলাইটরা এসএক্স-এর সাথে অসন্তুষ্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.