আপনি যদি SVM সমাধান করে এমন অপটিমাইজেশন সমস্যাটি দেখেন:
minw,ξ,b{12∥w∥2+C∑ni=1ξi}
st
সমস্তyi(w⋅xi−b)≥1−ξi, ξi≥0,i=1,…n
সমর্থন ভেক্টর যারা যেখানে সংশ্লিষ্ট । অন্য কথায়, এগুলি হ'ল ডেটা পয়েন্ট যা হয় ভুল শৃঙ্খলাবদ্ধ বা সীমানার কাছাকাছি।xiξi>0
এখন আপনি যখন কিছু বৈশিষ্ট্য দূরে নিক্ষেপ করেন সেই ক্ষেত্রে আপনার কাছে বৈশিষ্ট্যগুলির একটি সম্পূর্ণ সেট থাকে তখন এই সমস্যার সমাধানটির তুলনা করি। একটি বৈশিষ্ট্য দূরে নিক্ষেপ বৈশিষ্ট্যগুলি বৈশিষ্ট্যটি contraint পালন, কিন্তু যোগ সমতূল্য বৈশিষ্ট্যের জন্য যে আমরা পরিত্যাগ করতে চান। wj=0j
আপনি যখন এই দুটি অপটিমাইজেশন সমস্যাগুলি তুলনা করেন এবং গণিতে কাজ করেন তখন দেখা যায় বৈশিষ্ট্যের সংখ্যা এবং সমর্থন ভেক্টরগুলির সংখ্যার মধ্যে কোনও কঠিন সম্পর্ক নেই। এটি যে কোনও উপায়ে যেতে পারে।
এটি একটি সাধারণ কেস সম্পর্কে চিন্তা করা দরকারী। একটি 2-ম্লাদ কেসটি কল্পনা করুন যেখানে আপনার নেতিবাচক এবং ধনাত্মক বৈশিষ্ট্যগুলি যথাক্রমে (-1, -1) এবং (1,1) চারপাশে ক্লাস্টারযুক্ত রয়েছে এবং 3 টি সমর্থনকারী ভেক্টরগুলির সাথে একটি তির্যক পৃথক হাইপারপ্লেনের সাথে পৃথকযোগ্য ble এখন y- অক্ষ বৈশিষ্ট্যটি বাদ দেওয়ার কল্পনা করুন, সুতরাং এখনই আপনার ডেটা এক্স-অক্ষের উপরে अनुमानিত। যদি ডেটাটি এখনও পৃথকযোগ্য হয় তবে x = 0 এ বলুন, আপনি সম্ভবত কেবল দুটি সমর্থক ভেক্টর রেখে গেছেন, প্রতিটি পক্ষের মধ্যে একটি, তাই y- বৈশিষ্ট্য যুক্ত করা সমর্থন ভেক্টরের সংখ্যা বাড়িয়ে তুলবে। তবে, যদি ডেটা আর পৃথকযোগ্য না হয় তবে আপনি x = 0 এর ভুল দিকের প্রতিটি পয়েন্টের জন্য কমপক্ষে একটি সমর্থন ভেক্টর পাবেন, এক্ষেত্রে ওয়াই-বৈশিষ্ট্য যুক্ত করা সমর্থন ভেক্টরের সংখ্যা হ্রাস করবে।
সুতরাং, যদি এই স্বজ্ঞাততাটি সঠিক হয়, আপনি যদি খুব উচ্চ-মাত্রিক বৈশিষ্ট্যযুক্ত জায়গাগুলিতে কাজ করছেন বা একটি উচ্চ মাত্রিক বৈশিষ্ট্যযুক্ত স্থানের জন্য মানচিত্র তৈরি করে এমন একটি কার্নেল ব্যবহার করেন, তবে আপনার ডেটা পৃথক হওয়ার সম্ভাবনা বেশি বেশি, তাই কোনও বৈশিষ্ট্য যুক্ত করা ঝোঁক হয়ে যাবে শুধু অন্য সমর্থন ভেক্টর যুক্ত করতে। যদিও আপনার ডেটা বর্তমানে পৃথকযোগ্য নয় এবং আপনি এমন একটি বৈশিষ্ট্য যুক্ত করেছেন যা উল্লেখযোগ্যভাবে পৃথকযোগ্যতার উন্নতি করে, তবে আপনার পক্ষে সমর্থন ভেক্টরের সংখ্যা হ্রাস হওয়ার সম্ভাবনা বেশি।