প্রাইভেট টেস্ট সেটের ফলাফলগুলি আরও মডেলটিকে আরও পরিমার্জন করতে ব্যবহার করা যায় না, তবুও কি প্রাইভেট টেস্ট সেট ফলাফলের ভিত্তিতে বিপুল সংখ্যক মডেল সম্পাদন করা হচ্ছে না? আপনি কি একা এই প্রক্রিয়াটি না পেরে প্রাইভেট টেস্ট সেটে ওভারফিটিং শেষ করবেন না?
মতে "ছদ্ম-গণিত ও আর্থিক চালিয়াতি: Backtest Overfitting প্রভাব অপ্রচলিত নমুনা পারফরমেন্স এ" বেইলি et.al. দ্বারা একই ডাটাবেসে মূল্যবান বিপুল সংখ্যক মডেলের মধ্যে সেরাটি বেছে নেওয়ার সময় "ওভারফিট" করা তুলনামূলকভাবে সহজ। কাগলটির ব্যক্তিগত লিডারবোর্ডের সাথে কি এটি ঘটছে না?
- প্রাইভেট লিডারবোর্ডে সেরা পারফরম্যান্স মডেলগুলির মডেল যা আউট-অফ-স্যাম্পল ডেটাতে সেরাকে সাধারণীকরণ করে তার পরিসংখ্যানগত ন্যায্যতাগুলি কী?
- সংস্থাগুলি আসলে কী বিজয়ী মডেলগুলি ব্যবহার করে শেষ করে, বা কেবলমাত্র "গেমের নিয়ম" সরবরাহ করার জন্য সেখানে প্রাইভেট লিডারবোর্ড রয়েছে এবং সংস্থাগুলি সমস্যার আলোচনার ফলে উত্থিত অন্তর্দৃষ্টি সম্পর্কে আরও আগ্রহী?