আমার প্রশ্ন: এলোমেলো বন কেন গাছের স্তরের পরিবর্তে প্রতিটি গাছের মধ্যে নোড স্তরে বিভক্ত হওয়ার জন্য বৈশিষ্ট্যগুলির এলোমেলো উপগুলি বিবেচনা করে ?
পটভূমি: এটি একটি ইতিহাসের প্রশ্ন। টিন কাম হো ১৯৯৮ সালে প্রতিটি গাছের বৃদ্ধি করার জন্য এলোমেলোভাবে ব্যবহারের জন্য বৈশিষ্ট্যগুলির একটি উপসেট নির্বাচন করে "সিদ্ধান্ত বন" নির্মাণের জন্য এই গবেষণাপত্রটি প্রকাশ করেছিলেন। বেশ কয়েক বছর পরে, 2001 সালে, লিও ব্রেইমান তার সেমিনাল র্যান্ডম ফরেস্ট পেপার প্রকাশ করেছিলেন , যেখানে বৈশিষ্ট্যটির উপসেটটি এলোমেলোভাবে রয়েছে প্রতিটি গাছের মধ্যে নয়, প্রতিটি গাছের মধ্যে প্রতিটি নোডে নির্বাচিত । ব্রেইমান হোয়ের উদ্ধৃতি দেওয়ার সময়, তিনি গাছের স্তর থেকে নোড-স্তরের এলোমেলো বৈশিষ্ট্য নির্বাচনের পদক্ষেপটি বিশেষভাবে ব্যাখ্যা করেননি।
আমি ভাবছি যে এই বিকাশটি বিশেষভাবে কীভাবে অনুপ্রাণিত করেছে। দেখে মনে হচ্ছে গাছের স্তরে বৈশিষ্ট্য উপসেটটি নির্বাচন করা এখনও গাছগুলির কাঙ্ক্ষিত সজ্জা অর্জন করবে।
আমার তত্ত্ব: আমি এটিকে অন্য কোথাও দেখিনি, তবে মনে হয় বৈশিষ্ট্যটির গুরুত্বের অনুমান পাওয়ার ক্ষেত্রে এলোমেলো উপ-স্থানটি কম দক্ষ হবে। পরিবর্তনশীল গুরুত্বের অনুমানের জন্য প্রতিটি গাছের জন্য বৈশিষ্ট্যগুলি এলোমেলোভাবে একের পর এক অনুমোদিত হয় এবং ব্যাগের বাইরে থাকা পর্যবেক্ষণগুলির জন্য ভুল শৃঙ্খলা বৃদ্ধি বা ত্রুটিতে বৃদ্ধি রেকর্ড করা হয়। এই র্যান্ডম ক্রমানুসারে ফলশ্রুতি বা ত্রুটি বৃদ্ধির ফলে যে ভেরিয়েবলগুলি বেশি তা হ'ল তারাই সবচেয়ে বেশি গুরুত্ব দেয়।
আমরা যদি র্যান্ডম subspace পদ্ধতি ব্যবহার, প্রতিটি গাছ জন্য, আমরা কেবল বিবেচনা করা হয় এর বৈশিষ্ট্য। এমনকি একবারে সমস্ত ভবিষ্যদ্বাণীকে বিবেচনা করতে বেশ কয়েকটি গাছ লাগতে পারে । অন্যদিকে, যদি আমরা একটি ভিন্ন উপসেট বিবেচনা এর অতিরিক্ত বৈশিষ্ট্যগুলিও উপস্থিত রয়েছে প্রতিটি নোডের এ , আমরা প্রতিটি বৈশিষ্ট্য আরো কয়েকবার কম গাছ পর বিবেচনা, আমাদের বৈশিষ্ট্য গুরুত্ব একটি শক্তসমর্থ অনুমান দান করবে।
আমি এতদূর যা দেখেছি: এখনও অবধি আমি ব্রেইম্যানের কাগজ এবং হো'র কাগজটি পড়েছি এবং একটি নির্দিষ্ট উত্তর না পেয়ে পদ্ধতিগুলির তুলনা করার জন্য একটি বিস্তৃত অনলাইন অনুসন্ধান করেছি। নোট করুন যে আগে অনুরূপ প্রশ্ন জিজ্ঞাসা করা হয়েছিল। একটি সম্ভাব্য সমাধানের দিকে আমার অনুমান / কাজকে অন্তর্ভুক্ত করে এই প্রশ্নটি আরও খানিকটা এগিয়ে যায়। আমি দুটি পদ্ধতির তুলনায় যে কোনও উত্তর, প্রাসঙ্গিক উদ্ধৃতি বা সিমুলেশন অধ্যয়নে আগ্রহী। যদি কেউ আসন্ন না থাকে তবে আমি দুটি পদ্ধতির তুলনা করে আমার নিজস্ব সিমুলেশন চালানোর পরিকল্পনা করছি।