কৃত্রিমভাবে ভারসাম্য প্রশিক্ষণের সেট তৈরি করা বিতর্কযোগ্য, আসলে বেশ বিতর্কিত। আপনি যদি এটি করেন তবে আপনাকে অভিজ্ঞতার সাথে যাচাই করা উচিত যে প্রশিক্ষণটি ভারসাম্যহীন রেখে যাওয়ার চেয়ে এটি সত্যিই আরও ভাল কাজ করে। কৃত্রিমভাবে পরীক্ষা-সেট ভারসাম্য প্রায় ভাল ধারণা না। লেবেল ছাড়াই টেস্ট-সেটটিতে নতুন ডেটা পয়েন্টগুলি উপস্থাপন করা উচিত। আপনি সেগুলি ভারসাম্যহীন হওয়ার প্রত্যাশা করছেন, সুতরাং আপনার মডেলটি ভারসাম্যহীন পরীক্ষা-সেট পরিচালনা করতে পারে কিনা তা জানতে হবে। (আপনি যদি নতুন রেকর্ডগুলি ভারসাম্যহীন হওয়ার প্রত্যাশা না করেন তবে আপনার সমস্ত বিদ্যমান রেকর্ড ভারসাম্যহীন কেন?)
আপনার পারফরম্যান্স মেট্রিক সম্পর্কিত, আপনি সর্বদা যা চান তা পাবেন। ভারসাম্যহীন সেটে যথাযথতা যা আপনার সর্বাধিক প্রয়োজন তা যদি না হয়, কারণ কেবল ক্লাসই নয় অপ্রয়োজনীয় মূল্যও ভারসাম্যহীন, তবে এটি ব্যবহার করবেন না। আপনি যদি যথাযথতাকে মেট্রিক হিসাবে ব্যবহার করেন এবং সর্বদা সর্বোত্তম নির্ভুলতার সাথে একটি করে আপনার সমস্ত মডেল নির্বাচন এবং হাইপারপ্যারমিটার টিউনিং করে থাকেন তবে আপনি নির্ভুলতার জন্য অপ্টিমাইজ করছেন।
আমি সংখ্যালঘু শ্রেণিকে ধনাত্মক শ্রেণি হিসাবে গ্রহণ করি, এটি তাদের নামকরণের প্রচলিত উপায়। নীচে আলোচিত হিসাবে যথার্থতা এবং প্রত্যাহার হ'ল সংখ্যালঘু শ্রেণীর যথার্থতা এবং পুনরুদ্ধার।
- যদি একমাত্র গুরুত্বপূর্ণ জিনিসটি সংখ্যালঘু শ্রেণীর সমস্ত রেকর্ড সনাক্ত করতে হয় তবে আপনি পুনরায় প্রত্যাহার করতে পারেন। আপনি আরও মিথ্যা ইতিবাচক গ্রহণ করছেন।
- কেবলমাত্র নির্ভুলতার অপ্টিমাইজ করা খুব বিচিত্র ধারণা হবে। আপনি আপনার ক্লাসিফায়ারকে বলবেন যে সংখ্যালঘু শ্রেণীর অবমূল্যায়ন করা কোনও সমস্যা নয়। উচ্চতর নির্ভুলতার সবচেয়ে সহজ উপায় হ'ল সংখ্যালঘু শ্রেণি ঘোষণায় সতর্কতা অবলম্বন করা।
- আপনার যদি নির্ভুলতা এবং পুনর্নির্মাণের প্রয়োজন হয় তবে আপনি এফ-মাপ নিতে পারেন। এটি নির্ভুলতা এবং পুনর্বিবেচনার মধ্যে সুরেলা গড় এবং ফলস্বরূপ উভয় মেট্রিকের বিভাজন যেখানে শাস্তি দেয়।
- আপনি যদি উভয় দিকেই কংক্রিটের ভুল শ্রেণিবিন্যাসের ব্যয় জানেন (এবং সঠিক শ্রেণিবদ্ধের লাভ যদি তারা প্রতি শ্রেণি অনুসারে আলাদা হয়) তবে আপনি সমস্ত কিছু ক্ষতির ক্ষেত্রে রেখে দিতে পারেন এবং এটি অনুকূলিত করতে পারেন।