আমি ভাবছি শ্রেণীবদ্ধকরণ সমস্যার জন্য কোন ধরণের মডেল ক্রস-বৈধতা চয়ন করতে হবে: কে-ভাঁজ বা এলোমেলো উপ-নমুনা (বুটস্ট্র্যাপ নমুনা)?
আমার সর্বোত্তম অনুমানটি হ'ল প্রশিক্ষণের জন্য ডেটা সেট (যা 1000 ডলার আইটেম) 2/3 এবং বৈধতার জন্য 1/3 ব্যবহার করা।
এই ক্ষেত্রে কে-ফোল্ড কেবল তিনটি পুনরাবৃত্তি (ভাঁজ) দেয় যা স্থির গড় ত্রুটি দেখতে যথেষ্ট নয়।
অন্যদিকে আমি এলোমেলো সাব-স্যাম্পলিং বৈশিষ্ট্যটি পছন্দ করি না: কিছু আইটেম কখনও প্রশিক্ষণ / বৈধতার জন্য নির্বাচিত হবে না এবং কিছু একাধিকবার ব্যবহৃত হবে।
শ্রেণিবদ্ধকরণ অ্যালগরিদম ব্যবহৃত: এলোমেলো বন এবং লজিস্টিক রিগ্রেশন।