বারবার কে-ফোল্ড ক্রস-বৈধকরণ সম্পাদনের পূর্বে ডেটা (শূন্যের গড় এবং unityক্যের মানক বিচ্যুতি থাকা) স্বাভাবিক করার ক্ষেত্রে কী ওভারফিটিংয়ের মতো কোনও নেতিবাচক বিজয় রয়েছে?
দ্রষ্টব্য: এটি এমন একটি পরিস্থিতির জন্য যেখানে # কেসগুলি> মোট # বৈশিষ্ট্য
আমি লগ ট্রান্সফর্ম ব্যবহার করে আমার কিছু ডেটা রুপান্তর করছি, তারপরে উপরের মত সমস্ত ডেটা স্বাভাবিক করে তুলছি। আমি তখন বৈশিষ্ট্য নির্বাচন সম্পাদন করছি। পরবর্তী আমি সাধারণ শ্রেণিবদ্ধের পারফরম্যান্সটি চেষ্টা করতে এবং অনুমান করার জন্য বারবার 10-গুণ ক্রস-বৈধকরণের জন্য নির্বাচিত বৈশিষ্ট্যগুলি এবং সাধারণকরণের ডেটা প্রয়োগ করি এবং উদ্বিগ্ন যে সমস্ত ডেটা স্বাভাবিক করার জন্য ব্যবহার করা উপযুক্ত না। সেই ভাঁজটির জন্য প্রশিক্ষণ ডেটা থেকে প্রাপ্ত তথ্যকে নরমালাইজ করে আমি কি প্রতিটি ভাঁজের জন্য পরীক্ষার ডেটা স্বাভাবিক করতে পারি?
কৃতজ্ঞভাবে কোনও মতামত গৃহীত হয়েছে! এই প্রশ্নটি যদি সুস্পষ্ট মনে হয় তবে ক্ষমা চাই।
সম্পাদনা: এটি পরীক্ষা করার সময় (নীচের পরামর্শের সাথে মিল রেখে) আমি দেখতে পেয়েছি যে সিভির পূর্বে স্বাভাবিককরণ সিভিতে স্বাভাবিকীকরণের তুলনায় পারফরম্যান্স-ভিত্তিতে খুব বেশি পার্থক্য করে না।