একটি এসভিএম-এ আপনি দুটি জিনিস অনুসন্ধান করছেন: বৃহত্তম ন্যূনতম মার্জিন সহ একটি হাইপারপ্লেন এবং একটি হাইপারপ্লেন যা যথাসম্ভব যথাযথভাবে পৃথক করে। সমস্যাটি হ'ল আপনি সর্বদা দুটি জিনিসই পেতে সক্ষম হবেন না। সি প্যারামিটারটি নির্ধারণ করে যে আপনার পরবর্তীকালের জন্য কতটা দুর্দান্ত is এটি চিত্রিত করার জন্য আমি নীচে একটি ছোট উদাহরণ আঁকছি। বামদিকে আপনার কাছে কম সি রয়েছে যা আপনাকে বেশ বড় ন্যূনতম মার্জিন (বেগুনি) দেয়। তবে এর জন্য প্রয়োজন যে আমরা নীল বৃত্তের আউটলেটটিকে অবহেলা করব যা আমরা সঠিক শ্রেণিবদ্ধ করতে ব্যর্থ হয়েছি। ডানদিকে আপনি একটি উচ্চ সি আছে। এখন আপনি আউটলেটটিকে অবহেলা করবেন না এবং এভাবে অনেক ছোট ব্যবধানে শেষ করবেন।
তাহলে এর মধ্যে কোন শ্রেণিবদ্ধকারী সেরা? এটি আপনার ভবিষ্যতের ডেটা কেমন হবে তার উপর নির্ভর করে এবং বেশিরভাগ ক্ষেত্রে আপনি অবশ্যই তা জানেন না। যদি ভবিষ্যতের ডেটাগুলি এমন দেখায়:
তারপরে শ্রেণিবদ্ধ একটি বৃহত সি মান ব্যবহার করে শিখেছি সেরা।
অন্যদিকে, যদি ভবিষ্যতের ডেটাগুলি এমন দেখায়:
তারপরে ক্লাসিফায়ার একটি কম সি মান ব্যবহার করে শিখেছি সবচেয়ে ভাল।
আপনার ডেটা সেটের উপর নির্ভর করে সি পরিবর্তন করা একটি ভিন্ন হাইপারপ্লেন তৈরি করতে পারে বা নাও পারে। যদি এটি একটি ভিন্ন হাইপারপ্লেন তৈরি করে , তবে এটি বোঝায় না যে আপনার শ্রেণিবদ্ধকারী নির্দিষ্ট শ্রেণীর জন্য বিভিন্ন শ্রেণীর আউটপুট উত্পন্ন করবেন যা আপনি এটি শ্রেণিবদ্ধ করতে ব্যবহার করেছেন। ডেটা ভিজ্যুয়ালাইজ করা এবং এসভিএমের জন্য বিভিন্ন সেটিংসের সাথে চারপাশে খেলতে ওয়েকা একটি ভাল সরঞ্জাম। এটি আপনাকে কীভাবে আপনার ডেটা দেখাচ্ছে এবং কেন সি মান পরিবর্তন করে শ্রেণিবিন্যাস ত্রুটি পরিবর্তন করে না সে সম্পর্কে আরও ভাল ধারণা পেতে আপনাকে সহায়তা করতে পারে। সাধারণভাবে, কয়েকটি প্রশিক্ষণের উদাহরণ এবং অনেকগুলি অ্যাট্রিবিউট থাকা তথ্যকে রৈখিক পৃথককরণ সহজ করে তোলে। এছাড়াও সত্য যে আপনি আপনার প্রশিক্ষণ ডেটার উপর মূল্যায়ন করছেন এবং নতুন দেখা না হওয়া ডেটা পৃথকীকরণকে সহজ করে তোলে।
আপনি কোন ধরণের ডেটা থেকে মডেল শিখতে চাইছেন? কত তথ্য? আমরা কি এটি দেখতে পারি?