আমি বর্তমানে নিজেকে শ্রেণিবদ্ধকরণ কীভাবে করব তা শিখছি এবং বিশেষত আমি তিনটি পদ্ধতির দিকে নজর দিচ্ছি: ভেক্টর মেশিন, নিউরাল নেটওয়ার্ক এবং লজিস্টিক রিগ্রেশন সমর্থন করুন। আমি যা বোঝার চেষ্টা করছি তা হ'ল লজিস্টিক রিগ্রেশন অন্য দু'জনের তুলনায় আরও ভাল পারফর্ম করতে পারে।
লজিস্টিক রিগ্রেশন সম্পর্কে আমার বোঝাপড়া থেকে ধারণাটি হ'ল লজিস্টিক ফাংশনটি পুরো ডেটাতে ফিট করে। সুতরাং যদি আমার ডেটা বাইনারি হয় তবে লেবেল 0 সহ আমার সমস্ত ডেটা 0 মান (বা এটির নিকটবর্তী) ম্যাপ করা উচিত এবং 1 মান সহ আমার সমস্ত ডেটা 1 মান (বা এটির নিকটে) ম্যাপ করা উচিত। এখন, কারণ লজিস্টিক ফাংশন অবিচ্ছিন্ন এবং মসৃণ, এই প্রতিরোধ সম্পাদন করার জন্য আমার সমস্ত ডেটাটি বক্ররেখার সাথে মাপসই করা দরকার ; সিদ্ধান্তের সীমানার নিকটে ডেটা পয়েন্টগুলিতে কোনও বৃহত্তর গুরুত্ব প্রয়োগ করা হয় না এবং সমস্ত ডেটা পয়েন্টগুলি বিভিন্ন পরিমাণে ক্ষতির জন্য অবদান রাখে।
তবে, সমর্থন ভেক্টর মেশিন এবং নিউরাল নেটওয়ার্কগুলির সাথে, সিদ্ধান্তের সীমানার নিকটে কেবল সেইগুলি ডেটা পয়েন্টগুলি গুরুত্বপূর্ণ; যতক্ষণ না কোনও তথ্য পয়েন্ট সিদ্ধান্তের সীমানার একই দিকে থাকে, এটি একই ক্ষতিতে অবদান রাখবে।
সুতরাং, কেন লজিস্টিক রিগ্রেশন ভেক্টর মেশিন বা নিউরাল নেটওয়ার্ককে সমর্থন করে, কেননা সিদ্ধান্তের আশেপাশের কঠিন তথ্যের উপরে কেন্দ্রীভূত না করে প্রচুর অযৌক্তিক (সহজে শ্রেণিবদ্ধযোগ্য) ডেটাগুলিতে একটি বক্ররেখার ফিট করার চেষ্টা করার উপর "সম্পদ অপচয়" করে given সীমানা?