শ্রেণীর ভারসাম্যহীন সমস্যা সমাধানের দিকে জনপ্রিয় দৃষ্টিভঙ্গি হল শ্রেণিবদ্ধার পক্ষপাতিত্ব করা যাতে এটি ইতিবাচক উদাহরণগুলিতে আরও মনোযোগ দেয়। উদাহরণস্বরূপ, negativeণাত্মক শ্রেণীর তুলনায় ধনাত্মক শ্রেণীর ভুল সংজ্ঞা দেওয়ার সাথে জড়িত জরিমানা বাড়িয়ে এটি করা যেতে পারে। আরেকটি পদ্ধতি হ'ল ভারসাম্যপূর্ণ ডেটাসেট তৈরির জন্য সংখ্যাগরিষ্ঠ শ্রেণিকে ওভার স্যাম্পল করে বা সংখ্যালঘু শ্রেণিকে আন্ডার স্যাম্পল করে ডেটা প্রেরোসেস করা।
তবে আপনার ক্ষেত্রে, শ্রেণি ভারসাম্যহীনতা কোনও সমস্যা বলে মনে হচ্ছে না। সম্ভবত এটি পরামিতি টিউনিংয়ের বিষয়, যেহেতু কোনও এসভিএম শ্রেণিবদ্ধের জন্য অনুকূল পরামিতিগুলি সন্ধান করা বরং এক ক্লান্তিকর প্রক্রিয়া হতে পারে। আরবিএফ কার্নেলের ক্ষেত্রে উদাহরণস্বরূপ দুটি পরামিতি রয়েছে:সি এবং γ। আগে কোনটি জানা যায়নিসি এবং γপ্রদত্ত সমস্যার জন্য সেরা; ফলস্বরূপ কিছু ধরণের মডেল নির্বাচন (প্যারামিটার অনুসন্ধান) করা আবশ্যক।
ডেটা প্রিপ্রোসেসিং পর্বে, মনে রাখবেন যে এসভিএমের প্রয়োজন প্রতিটি তথ্য উদাহরণকে প্রকৃত সংখ্যার ভেক্টর হিসাবে উপস্থাপন করা হয়। সুতরাং, যদি শ্রেণীবদ্ধ বৈশিষ্ট্যগুলি থাকে তবে এম-বিভাগের বৈশিষ্ট্যটি উপস্থাপন করার জন্য এম সংখ্যা ব্যবহার করে (বা এটি নতুন নতুন বাইনারি ভেরিয়েবলের সাথে প্রতিস্থাপন) মিটার সংখ্যা ব্যবহার করে এগুলিকে সংখ্যাসূচক ডেটাতে রূপান্তরিত করার পরামর্শ দেওয়া হয়।
এছাড়াও, এসভিএম প্রয়োগ করার আগে ভেরিয়েবলগুলি স্কেলিং করা অত্যন্ত গুরুত্বপূর্ণ, যাতে বৃহত্তর সংখ্যাসূচক রেঞ্জগুলিতে ছোট সংখ্যার পরিসীমাগুলির উপর প্রভাব বিস্তার করতে পারে না।
পরীক্ষা করে দেখুন এই কাগজ ।
আপনি আর কর্মরত থাকেন, তবে খুঁজে বার করো সুর ফাংশন (প্যাকেজ e1071) সুর hyperparameters সরবরাহকৃত প্যারামিটার রেঞ্জ উপর একটি গ্রিড অনুসন্ধান ব্যবহার করতে। তারপরে প্লট.টুন ব্যবহার করে আপনি দেখতে পারবেন কোন মানগুলির সেটটি ত্রুটিটিকে আরও ছোট করে gives
সময় গ্রহণকারী প্যারামিটার অনুসন্ধানের চারপাশে একটি শর্টকাট রয়েছে। "এসভিএমপ্যাথ" নামে একটি আর প্যাকেজ রয়েছে যা একসাথে ২-শ্রেণির এসভিএম শ্রেণিবদ্ধের জন্য পুরো নিয়মিতকরণের পথটি গণনা করে। এখানে কাগজের একটি লিঙ্ক রয়েছে যা এটি কী করছে তা বর্ণনা করে।
পিএস আপনি এই কাগজটি আকর্ষণীয়ও দেখতে পাবেন: ক্যালিবিটেড সম্ভাবনার প্রাক্কলন প্রাপ্ত