র্যান্ডম ফরেস্টে, প্রতিটি গাছের সমান্তরালভাবে ডেটার এক অনন্য বুস্ট্র্যাপ নমুনায় উত্থিত হয়। যেহেতু প্রতিটি বুস্ট্র্যাপ নমুনায় প্রায়% 63% অনন্য পর্যবেক্ষণ রয়েছে বলে আশা করা যায়, এটি প্রায় পর্যবেক্ষণের প্রায় 37% ছেড়ে দেয় যা গাছ পরীক্ষার জন্য ব্যবহার করা যেতে পারে।
এখন, মনে হচ্ছে স্টোকাস্টিক গ্রেডিয়েন্ট বুস্টিং-এ, আরএফ-এর মতো একটি :
যদি ব্যাগ.ফ্রাকশন 0-এর চেয়ে বেশি সেট করা থাকে (0.5 বাঞ্ছনীয়) তবে জিবিএম ভবিষ্যদ্বাণীপূর্ণ কার্যকারিতাটির উন্নতির একটি প্রাক-ব্যাগ প্রাক্কলন গণনা করে। এটি পরবর্তী রিগ্রেশন ট্রি নির্বাচন করতে ব্যবহৃত হয়নি এমন পর্যবেক্ষণগুলির উপর বিচ্যুতি হ্রাসের মূল্যায়ন করে।
সূত্র: রিজওয়ে (2007) , বিভাগ 3.3 (পৃষ্ঠা 8)।
এটি কীভাবে কার্যকর হয় / বৈধ তা বুঝতে আমার সমস্যা হয়। বলুন আমি ক্রমে একটি গাছ যুক্ত করছি। আমি এই গাছটি মূল ডেটা সেটের এলোমেলো উপস্থানে বাড়ছি। আমি এই একা গাছটি পর্যবেক্ষণগুলিতে পরীক্ষা করতে পারি যা এটি বাড়ার জন্য ব্যবহৃত হয় নি। একমত। কিন্তু , যেহেতু বুস্টিং ক্রমযুক্ত , তাই আমি বাম-আউট পর্যবেক্ষণগুলির জন্য পূর্বাভাস দেওয়ার জন্য এ পর্যন্ত নির্মিত গাছের সম্পূর্ণ ক্রমটি ব্যবহার করছি । এবং, পূর্ববর্তী গাছগুলির মধ্যে অনেকগুলি এই পর্যবেক্ষণগুলি ইতিমধ্যে দেখেছেন এমন উচ্চ সম্ভাবনা রয়েছে। সুতরাং মডেলটি সত্যই কি আরএফ-এর মতো অদৃশ্য পর্যবেক্ষণগুলিতে প্রতিটি রাউন্ডে পরীক্ষা করা হচ্ছে না, তাই না?
সুতরাং, কীভাবে এটিকে "আউট-অফ-ব্যাগ" ত্রুটির প্রাক্কলন বলা হয়? আমার কাছে, পর্যবেক্ষণগুলি ইতিমধ্যে দেখা গেছে বলে এটি কোনও ব্যাগের "আউট" বলে মনে হয় না?