র্যান্ডম অরণ্যটি মূলত নমুনাগুলির পুনরায় মডেলিং এবং প্রশিক্ষণ সংক্রান্ত সিদ্ধান্তের গাছগুলি বুটস্ট্র্যাপ হয়, সুতরাং আপনার প্রশ্নের উত্তরের সেই দুটি বিষয়কে সম্বোধন করা দরকার।
বুটস্ট্র্যাপ রিস্যাম্পলিং হয় ছোট নমুনার জন্য একটি প্রতিকারও না । আপনার যদি আপনার ডেটাসেটে মাত্র চব্বিশটি পর্যবেক্ষণ থাকে, তবে এই তথ্য থেকে প্রতিস্থাপনের সাথে নেওয়া প্রতিটি নমুনায় চব্বিশটি স্বতন্ত্র মানগুলির চেয়ে বেশি নয়। কেসগুলি পরিবর্তন করা এবং সেগুলির মধ্যে কিছু অঙ্কন না করা অন্তর্নিহিত বিতরণ সম্পর্কে নতুন কিছু শেখার আপনার ক্ষমতা সম্পর্কে খুব বেশি পরিবর্তন ঘটবে না। সুতরাং একটি ছোট নমুনা হয় বুটস্ট্র্যাপ জন্য সমস্যা।
সিদ্ধান্ত গাছগুলিকে প্রোটেক্টর ভেরিয়েবলগুলিতে শর্তসাপেক্ষে ডেটা বিভক্ত করে প্রশিক্ষণ দেওয়া হয়, এক সময় এক পরিবর্তনশীল, এমন সাবমেলগুলি সন্ধান করতে যা সর্বাধিক বৈষম্যমূলক শক্তি রয়েছে। যদি আপনার কেবল চব্বিশটি কেস থাকে তবে বলুন যে আপনি ভাগ্যবান এবং সমস্ত বিভাজন এমনকি আকারে হলেও দুটি বিভাজন সহ আপনি ছয়টি মামলার চারটি গ্রুপের সাথে তিনটি আটটি গ্রুপের সাথে গাছের বিভাজন সহ শেষ হয়ে যেতেন। যদি আপনি নমুনাগুলিতে শর্তাধীন মানে গণনা করেন (রিগ্রেশন ট্রিগুলিতে ক্রমাগত মানগুলি বা সিদ্ধান্ত গাছগুলিতে শর্তাধীন সম্ভাবনার পূর্বাভাস), আপনি কেবলমাত্র কয়েকটি কয়েকটি ক্ষেত্রে আপনার সিদ্ধান্তকে ভিত্তি করে দেখবেন! সুতরাং আপনি সিদ্ধান্ত নিতে যে সাব-স্যাম্পলগুলি ব্যবহার করবেন তা আপনার মূল ডেটার চেয়েও ছোট হবে।
ছোট নমুনাগুলি সহ সাধারণ পদ্ধতিগুলি ব্যবহার করা সাধারণত বুদ্ধিমানের কাজ । তদতিরিক্ত, আপনি বয়েসিয়ান সেটিংয়ে তথ্যবহুল প্রিয়ারগুলি ব্যবহার করে ছোট্ট নমুনাটি ধরতে পারেন (যদি আপনার সমস্যা সম্পর্কে কোনও যুক্তিসঙ্গত আউট-অফ-ডেটা জ্ঞান থাকে), তাই আপনি কিছু টেইলার-তৈরি বায়েশিয়ান মডেলটি বিবেচনা করতে পারেন।