র্যান্ডম ফরেস্ট শ্রেণিবদ্ধের জন্য সর্বোত্তম পরামিতিগুলি কী হওয়া উচিত?


14

বাইনারি শ্রেণীবদ্ধকরণ সমস্যার জন্য আমি বর্তমানে ম্যাটল্যাবে আরএফ টুলবক্স ব্যবহার করছি

ডেটা সেট: 50000 নমুনা এবং 250 টিরও বেশি বৈশিষ্ট্য

সুতরাং গাছের সংখ্যা বৃদ্ধির জন্য প্রতিটি ভাগে গাছের সংখ্যা এবং এলোমেলোভাবে নির্বাচিত বৈশিষ্ট্যটি কী হওয়া উচিত? অন্য কোনও প্যারামিটারগুলি ফলাফলগুলিকে ব্যাপকভাবে প্রভাবিত করতে পারে?

উত্তর:


8

প্রচুর পরিমাণে গাছ বাছুন, 100 বলুন I ইন্টারনেটে আমি যা পড়েছি তা থেকে এলোমেলোভাবে নির্বাচিত বৈশিষ্ট্যগুলি চয়ন করুন। যাইহোক, এ মূল কাগজ , Breiman নিকটস্থ পূর্ণসংখ্যা সম্পর্কে ব্যবহৃত অর্থাত \ frac {\ লগ {এম}} {\ লগ {2}} 250logMlog2

আমি বলব যে ক্রস-বৈধতা সাধারণত সর্বোত্তম পরামিতিগুলি সন্ধানের মূল বিষয়, তবে আমি এলোমেলো বন সম্পর্কে যথেষ্ট জানি না।


ব্রেইম বৈশিষ্ট্য ব্যবহার করেছে। আমি এখানে একটি মন্তব্য দিচ্ছি, কারণ আপনার লিঙ্কটি কাজ করে না :)1+log2M
এন্টোইন

ধন্যবাদ, আমি লিঙ্কটি আপডেট করেছি। এখন, এটি সরাসরি বার্কলে to
Wok

12

গাছের সংখ্যা যত বেশি তত ভাল। আপনি প্রায় এই প্যারামিটারটি দিয়ে পরিচালনা করতে পারবেন না, তবে অবশ্যই উপরের সীমাটি আপনি আরএফের জন্য যে পরিমাণ গণনা করতে চান তা নির্ভর করে।
ভাল ধারণাটি হল প্রথমে একটি দীর্ঘ বন তৈরি করা এবং তারপরে ওওবি যথার্থতা রূপান্তরিত হওয়ার পরে (আমি আশা করি এটি ম্যাটল্যাব বাস্তবায়নে উপলব্ধ is

ডিফল্টরূপে চেষ্টা করা গুণাবলীর সংখ্যার পুরো সংখ্যাটির বর্গমূল, তবুও সাধারণত বন এই প্যারামিটারটির মান সম্পর্কে খুব সংবেদনশীল নয় - বাস্তবে এটি খুব কমই অনুকূলিত হয়, বিশেষত কারণ আরএফের স্টোকাস্টিক দিকটি আরও বড় ধরণের প্রবর্তন করতে পারে।


7

গাছের সংখ্যা যত বেশি , তত ভাল: সম্মত।

চেষ্টা করা গুণাবলীর সংখ্যা নির্ভর করবে। বৈশিষ্ট্যগুলির মধ্যে কীভাবে তথ্যটি ছড়িয়ে পড়ছে বা না তা সম্পর্কে ইতিমধ্যে যদি আপনার কিছু প্রাথমিক থাকে। যদি তথ্যটি অনেকগুলি বৈশিষ্ট্য দ্বারা ভাগ করা হয়, তবে সেই প্যারামিটারটির আরও কম মান আরও ভাল ফলাফলের সাথে আসে। অন্যদিকে, যদি কেবল কয়েকটি বৈশিষ্ট্যই তথ্য বহন করে তবে আপনার আরও বড় মান ব্যবহার করা উচিত। অন্য কথায়, অনেক প্রাসঙ্গিক ভেরিয়েবল সহ: ছোট মানগুলি আরও ভাল এবং অনেক অপ্রাসঙ্গিক ভেরিয়েবলের সাথে: বড় মানগুলি আরও ভাল।


1
চেষ্টা করা গুণাবলীর সংখ্যা সম্পর্কে আপনার দাবির অর্থটি বোধ হয়, আপনি কি এর জন্য একটি প্রশংসাপত্র রেখেছেন?
জেমস মালিকরা

আমি এই থিসিসটি পড়ার সুপারিশ করব: github.com/glouppe/phd- থেসিস পাশাপাশি এটি একটি: orbi.ulg.ac.be/handle/2268/25737
0asa
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.