আমি একটি র্যান্ডমফোরস্টের সাথে খেলছি এবং দেখেছি যে সাধারণত স্যাম্পসাইজ বাড়ানো আরও ভাল পারফরম্যান্সের দিকে নিয়ে যায়। কোনও নিয়ম / সূত্র / ইত্যাদি রয়েছে যা ইঙ্গিত দেয় যে সর্বোত্তম স্যাম্পসাইজটি কী হওয়া উচিত বা এটি একটি ট্রায়াল এবং ত্রুটিযুক্ত জিনিস? আমি অনুমান করি এটির অন্যরকম উপায়; একটি সাম্পসাইজ খুব ছোট বা খুব বড় (ওভারফিটিং?) এর আমার ঝুঁকিগুলি কী?
এই প্রশ্নটি randomForestপ্যাকেজে এলোমেলোভাবে বন নির্ধারণের কথা উল্লেখ করছে । ফাংশনটির randomForestএকটি পরামিতি রয়েছে sampSizeযা ডকুমেন্টেশনে বর্ণিত রয়েছে
অঙ্কনের জন্য নমুনার আকার (গুলি)। শ্রেণিবিন্যাসের জন্য, যদি স্যাম্পসাইজগুলি স্তরের সংখ্যাটির দৈর্ঘ্যের একটি ভেক্টর হয়, তবে নমুনাটি স্তর দ্বারা স্তরিত হয় এবং স্যাম্পসাইজগুলির উপাদানগুলি স্তর থেকে অঙ্কিত হওয়া সংখ্যাগুলি নির্দেশ করে।