সমর্থন ভেক্টর মেশিন এবং লিনিয়ার বৈষম্য বিশ্লেষণের মধ্যে পার্থক্য কী?
সমর্থন ভেক্টর মেশিন এবং লিনিয়ার বৈষম্য বিশ্লেষণের মধ্যে পার্থক্য কী?
উত্তর:
এলডিএ: অনুমান: তথ্য সাধারণত বিতরণ করা হয়। সমস্ত গোষ্ঠীগুলি অভিন্নভাবে বিতরণ করা হয়, যদি গোষ্ঠীগুলির মধ্যে বিভিন্ন সমবায় ম্যাট্রিক থাকে তবে এলডিএ চতুর্ভুজীয় বৈষম্য বিশ্লেষণে পরিণত হয়। সমস্ত অনুমানগুলি বাস্তবায়িত হওয়ার ক্ষেত্রে এলডিএ হ'ল সেরা বৈষম্যমূলক। কিউডিএ, যাইহোক, একটি অ-রৈখিক শ্রেণিবদ্ধ।
এসভিএম: সর্বোত্তমভাবে পৃথকীকরণ হাইপারপ্লেন (ওএসএইচ) সাধারণীকরণ করে। ওএসএইচ ধরে নিয়েছে যে সমস্ত গ্রুপ সম্পূর্ণ বিচ্ছিন্ন, এসভিএম একটি 'স্ল্যাক ভেরিয়েবল' ব্যবহার করে যা গ্রুপগুলির মধ্যে একটি নির্দিষ্ট পরিমাণের ওভারল্যাপের অনুমতি দেয়। এসভিএম ডেটা সম্পর্কে মোটেই অনুমান করে না, অর্থাত এটি একটি খুব নমনীয় পদ্ধতি। অন্যদিকে নমনীয়তা প্রায়শই এলডিএর তুলনায় এসভিএম শ্রেণিবদ্ধ থেকে ফলাফল ব্যাখ্যা করা আরও কঠিন করে তোলে।
এসভিএম শ্রেণিবিন্যাস একটি অপ্টিমাইজেশন সমস্যা, এলডিএর একটি বিশ্লেষণাত্মক সমাধান রয়েছে। এসভিএমের জন্য অপ্টিমাইজেশনের সমস্যাটির দ্বৈত এবং একটি প্রাথমিক সূত্র রয়েছে যা ব্যবহারকারীর ডেটা পয়েন্টের সংখ্যা বা ভেরিয়েবলের সংখ্যার উপর নির্ভর করে, কোন পদ্ধতিটি সবচেয়ে বেশি গণনামূলকভাবে সম্ভব হবে তার উপর নির্ভর করে। SVM একটি লিনিয়ার শ্রেণিবদ্ধ থেকে একটি অ-রৈখিক শ্রেণিবদ্ধে রূপান্তর করতে কার্নেলগুলি ব্যবহার করতে পারে। 'এসভিএম কার্নেল ট্রিক' অনুসন্ধান করতে আপনার পছন্দসই অনুসন্ধান ইঞ্জিনটি ব্যবহার করুন কীভাবে পরামিতি স্থানকে রূপান্তর করতে এসভিএম কার্নেলগুলি ব্যবহার করে।
এলডিএ গোপনীয়তার ম্যাট্রিক্স অনুমান করার জন্য পুরো ডেটা সেটটিকে ব্যবহার করে এবং এভাবে বিদেশীদের কাছে কিছুটা প্রবণ। এসভিএম ডেটার একটি উপসেটের উপরে অপ্টিমাইজ করা হয়েছে, যা সেই ডেটা পয়েন্ট যা পৃথকীকরণের মার্জিনে থাকে। অপ্টিমাইজেশনের জন্য ব্যবহৃত ডেটা পয়েন্টগুলিকে সমর্থন ভেক্টর বলা হয়, কারণ তারা নির্ধারণ করে যে কীভাবে এসভিএম গ্রুপগুলির মধ্যে বৈষম্য করে এবং শ্রেণিবিন্যাসকে সমর্থন করে।
যতদূর আমি জানি, এসভিএম সত্যিকার অর্থে দুটি শ্রেণির চেয়ে বেশি বৈষম্য করে না। একটি আউটলার শক্তিশালী বিকল্প হ'ল লজিস্টিক শ্রেণিবদ্ধকরণ ব্যবহার করা। এলডিএ বেশিরভাগ ক্লাস পরিচালনা করে, যতক্ষণ অনুমানগুলি মেটানো হয়। আমি বিশ্বাস করি, যদিও (সতর্কতা: ভয়াবহভাবে অসমর্থিত দাবি) বেশ কয়েকটি পুরানো মানদণ্ডে দেখা গেছে যে এলডিএ সাধারণত অনেক পরিস্থিতিতে বেশ ভাল পারফরম্যান্স করে এবং প্রাথমিক বিশ্লেষণে এলডিএ / কিউডিএ প্রায়শই প্রচলিত পদ্ধতি হয়।
সংক্ষেপে: এলডিএ এবং এসভিএমের মধ্যে খুব কম মিল রয়েছে। ভাগ্যক্রমে, তারা উভয় দুর্দান্ত ব্যবহার।
এসভিএম কেবলমাত্র সেই পয়েন্টগুলিতে মনোনিবেশ করে যা শ্রেণিবদ্ধ করা কঠিন, এলডিএ সমস্ত ডেটা পয়েন্টগুলিতে মনোনিবেশ করে। এ জাতীয় কঠিন পয়েন্টগুলি সিদ্ধান্তের সীমানার খুব কাছাকাছি থাকে এবং একে সমর্থন ভেক্টর বলা হয় । সিদ্ধান্তের সীমানা রৈখিক হতে পারে, তবে উদাহরণস্বরূপ একটি আরবিএফ কার্নেল, বা বহুবর্ষীয় কার্নেল। যেখানে এলডিএ হ'ল বিচ্ছিন্নতা সর্বাধিক করার জন্য একটি লিনিয়ার রূপান্তর।
এলডিএ ধরে নেয় যে ডেটা পয়েন্টগুলির একই সমবায় রয়েছে এবং সম্ভাবনা ঘনত্বটি সাধারণত বিতরণ করা হয় বলে ধরে নেওয়া হয়। এসভিএমের এমন কোনও অনুমান নেই।
এলডিএ উত্পাদক, এসভিএম বৈষম্যমূলক।
সমর্থন ভেক্টর মেশিনগুলি একটি লিনিয়ার বিভাজক (লিনিয়ার সংমিশ্রণ, হাইপারপ্লেন) সন্ধান করে যা ক্লাসগুলি ন্যূনতম ত্রুটির সাথে পৃথক করে এবং সর্বাধিক মার্জিনের সাথে বিভাজককে বেছে নেয় (ডেটা বিন্দুতে আঘাতের আগে সীমানাটি বাড়ানো যেতে পারে)।
উদাহরণস্বরূপ কোন লিনিয়ার বিভাজক ক্লাস পৃথক করে?
সর্বাধিক মার্জিন সহ এক:
লিনিয়ার বৈষম্যমূলক বিশ্লেষণ প্রতিটি শ্রেণীর গড় ভেক্টরকে সন্ধান করে এবং তারপরে প্রক্ষেপণের দিক (ঘূর্ণন) আবিষ্কার করে যা অর্থের বিভাজনকে সর্বাধিক করে তোলে:
শ্রেণীর প্রকরণের মধ্যেও এমন এক প্রক্ষেপণ খুঁজে পাওয়া যায় যা অর্থের বিভাজনকে সর্বাধিকীকরণের সময় বিতরণের (ওভারল্যাপ) হ্রাস করে: