প্রদত্ত ডেটাসেটের জন্য সেরা শ্রেণিবদ্ধকরণ পদ্ধতি কোনটি সম্পর্কে কোনও একক উত্তর নেই । প্রদত্ত ডেটাসেটের তুলনায় তুলনামূলক অধ্যয়নের জন্য বিভিন্ন ধরণের শ্রেণিবদ্ধকারীদের সর্বদা বিবেচনা করা উচিত। ডেটাসেটের বৈশিষ্ট্যগুলি দেওয়া, আপনার কিছু সংকেত থাকতে পারে যা কিছু পদ্ধতিতে অগ্রাধিকার দিতে পারে। তবে, সম্ভব হলে সবার সাথে পরীক্ষা করার পরামর্শ দেওয়া হবে।
নাইভ বেয়েস ক্লাসিফায়ার (এনবিসি) এবং সাপোর্ট ভেক্টর মেশিন (এসভিএম) এর প্রতিটি জন্য কার্নেল ফাংশন পছন্দ সহ বিভিন্ন বিকল্প রয়েছে। তারা উভয়ই প্যারামিটার অপ্টিমাইজেশনের প্রতি সংবেদনশীল (যেমন বিভিন্ন পরামিতি নির্বাচন তাদের আউটপুটকে উল্লেখযোগ্যভাবে পরিবর্তন করতে পারে) । সুতরাং, আপনার যদি এমন ফলাফল দেখা যায় যে এনবিসি এসভিএমের চেয়ে ভাল পারফর্ম করছে। এটি কেবলমাত্র নির্বাচিত পরামিতিগুলির ক্ষেত্রেই সত্য। তবে অন্য প্যারামিটার নির্বাচনের জন্য আপনি দেখতে পাবেন যে এসভিএম আরও ভাল পারফর্ম করছে।
সাধারণভাবে, যদি এনবিসিতে স্বাধীনতার অনুমান আপনার ডেটাসেটের ভেরিয়েবল দ্বারা সন্তুষ্ট হয় এবং শ্রেণি ওভারল্যাপিংয়ের ডিগ্রি ছোট হয় (তবে সম্ভাব্য লিনিয়ার সিদ্ধান্তের সীমানা), এনবিসি ভাল অর্জনের প্রত্যাশা করবে। কিছু ডেটাসেটের জন্য, মোড়ক বৈশিষ্ট্য নির্বাচন ব্যবহার করে অপ্টিমাইজেশন সহ, উদাহরণস্বরূপ, এনবিসি অন্যান্য শ্রেণিবদ্ধদের পরাস্ত করতে পারে। এমনকি যদি এটি তুলনামূলক পারফরম্যান্স অর্জন করে তবে এনবিসি এর উচ্চ গতির কারণে আরও আকাঙ্ক্ষিত হবে।
সংক্ষেপে বলতে গেলে, আমাদের কোনও শ্রেণিবদ্ধকরণ পদ্ধতি পছন্দ করা উচিত নয় যদি এটি অন্য প্রসঙ্গে একটি প্রসঙ্গে অন্যদেরকে ছাড়িয়ে যায় কারণ এটি অন্য কোনও ক্ষেত্রে মারাত্মকভাবে ব্যর্থ হতে পারে। ( এই হল স্বাভাবিক ডেটা মাইনিং সমস্যার )।