আমি একটি র্যান্ডমফোরস্টের সাথে খেলছি এবং দেখেছি যে সাধারণত স্যাম্পসাইজ বাড়ানো আরও ভাল পারফরম্যান্সের দিকে নিয়ে যায়। কোনও নিয়ম / সূত্র / ইত্যাদি রয়েছে যা ইঙ্গিত দেয় যে সর্বোত্তম স্যাম্পসাইজটি কী হওয়া উচিত বা এটি একটি ট্রায়াল এবং ত্রুটিযুক্ত জিনিস? আমি অনুমান করি এটির অন্যরকম উপায়; একটি সাম্পসাইজ খুব ছোট বা খুব বড় (ওভারফিটিং?) এর আমার ঝুঁকিগুলি কী?
এই প্রশ্নটি randomForest
প্যাকেজে এলোমেলোভাবে বন নির্ধারণের কথা উল্লেখ করছে । ফাংশনটির randomForest
একটি পরামিতি রয়েছে sampSize
যা ডকুমেন্টেশনে বর্ণিত রয়েছে
অঙ্কনের জন্য নমুনার আকার (গুলি)। শ্রেণিবিন্যাসের জন্য, যদি স্যাম্পসাইজগুলি স্তরের সংখ্যাটির দৈর্ঘ্যের একটি ভেক্টর হয়, তবে নমুনাটি স্তর দ্বারা স্তরিত হয় এবং স্যাম্পসাইজগুলির উপাদানগুলি স্তর থেকে অঙ্কিত হওয়া সংখ্যাগুলি নির্দেশ করে।