এসভিএম ভারসাম্যহীন ডেটাসেট পরিচালনা করে? ভারসাম্যহীন ডেটাসেট পরিচালনা করে এমন কোনও প্যারামিটার (যেমন সি, বা ভুল সংশোধনী ব্যয়)?
এসভিএম ভারসাম্যহীন ডেটাসেট পরিচালনা করে? ভারসাম্যহীন ডেটাসেট পরিচালনা করে এমন কোনও প্যারামিটার (যেমন সি, বা ভুল সংশোধনী ব্যয়)?
উত্তর:
ভারসাম্যহীন ডেটা সেটগুলির জন্য আমরা সাধারণত প্রতি ক্লাসে বিভ্রান্তিকর জরিমানা পরিবর্তন করি। এটিকে ক্লাস-ওয়েটেড এসভিএম বলা হয়, যা নিম্নলিখিতগুলি হ্রাস করে:
যেখানে এবং ইতিবাচক / নেতিবাচক প্রশিক্ষণের উদাহরণগুলি উপস্থাপন করে। স্ট্যান্ডার্ড এসভিএম-এ আমাদের কেবলমাত্র একটি মান রয়েছে, যেখানে এখন আমাদের কাছে ২ টি সংখ্যা রয়েছে। সংখ্যালঘু শ্রেণির জন্য বিয়োগ বিধানের জরিমানা সংখ্যাগরিষ্ঠ শ্রেণীর চেয়ে বড় হতে বেছে নেওয়া হয়।
এই পদ্ধতির প্রারম্ভিকভাবে প্রবর্তিত হয়েছিল, এটি উদাহরণস্বরূপ 1997 সালের একটি গবেষণাপত্রে উল্লেখ করা হয়েছে:
এডগার ওসুনা, রবার্ট ফ্রেন্ড এবং ফেডেরিকো গিরোসি। সমর্থন ভেক্টর মেশিন: প্রশিক্ষণ এবং অ্যাপ্লিকেশন। প্রযুক্তিগত প্রতিবেদন এআইএম -1602, 1997. ( পিডিএফ )
মূলত এটি সংখ্যালঘু শ্রেণীর উপর রাখার সমতুল্য: উদাহরণস্বরূপ যদি এটি সম্পূর্ণরূপে প্রশিক্ষণ সেটে প্রতিটি দুবার অন্তর্ভুক্ত করার পরে সহ একটি স্ট্যান্ডার্ড এসভিএম প্রশিক্ষণের সমতুল্য ।
এসভিএমগুলি ভারসাম্যহীন শ্রেণীর ফ্রিকোয়েন্সি সহ ডেটাসেটগুলির সাথে ডিল করতে সক্ষম হয়। অনেকগুলি বাস্তবায়ন আপনাকে ইতিবাচক এবং নেতিবাচক শ্রেণীর জন্য স্লাক পেনাল্টির (সি) আলাদা মূল্য রাখতে দেয় (যা সংক্ষিপ্তভাবে শ্রেণীর ফ্রিকোয়েন্সি পরিবর্তনের সমতুল্য)। আমি এই প্যারামিটারগুলির মানগুলি সেট করার পরামর্শ দিচ্ছি যাতে কোনও টেস্ট সেটটিতে সাধারণকরণের কর্মক্ষমতা সর্বাধিক হয় যেখানে শ্রেণিক ফ্রিকোয়েন্সিগুলি অপারেশনাল ব্যবহারে আপনি যে প্রত্যাশা আশা করেন are
আমি অনেক লোকের মধ্যে যারা এই বিষয়ে কাগজপত্র লিখেছিলেন তাদের মধ্যে একজন ছিল, এখানে আমার , আমি আরও সাম্প্রতিক / আরও ভাল কিছু খুঁজে পেতে পারি কিনা তা আমি দেখতে পাব। ভেরোপৌলস, ক্যাম্পবেল এবং ক্রিস্টিয়িনি (1999) চেষ্টা করুন ।