রায়ান জোটির উত্তর সিদ্ধান্তের সীমানা সর্বাধিককরণের পিছনে অনুপ্রেরণা ব্যাখ্যা করে, কার্লোসডিসির উত্তরটি অন্যান্য শ্রেণিবদ্ধদের সাথে কিছু মিল এবং পার্থক্য দেয়। এসভিএমগুলি কীভাবে প্রশিক্ষিত এবং ব্যবহৃত হয় তার একটি সংক্ষিপ্ত গাণিতিক ওভারভিউ আমি এই উত্তরে দেব give
স্বরলিপি
নীচে, স্কেলারগুলিকে ইটালিক লোয়ারকেসগুলি (উদাহরণস্বরূপ, ), বোল্ডার লোয়ারকেসেস (যেমন, ) সহ ভেক্টর এবং ইটালিক বড় হাতের অক্ষর (যেমন, ) হ'ল , এবং স্থানান্তর ।y,bw,xWwTw∥w∥=wTw
দিন:
- x একটি বৈশিষ্ট্য ভেক্টর (অর্থাত্, এসভিএমের ইনপুট)। , যেখানে বৈশিষ্ট্য ভেক্টরের মাত্রা।x∈Rnn
- y শ্রেণি হতে হবে (অর্থাত্, এসভিএমের আউটপুট)। , অর্থাত শ্রেণিবদ্ধকরণ কার্য বাইনারি।y∈{−1,1}
- w এবং এসভিএমের প্যারামিটার হ'ল: প্রশিক্ষণ সেটটি ব্যবহার করে আমাদের সেগুলি শিখতে হবে।b
- (x(i),y(i)) the ডেটাসেটের নমুনা হোন। ধরে নেওয়া যাক আমাদের প্রশিক্ষণ সেটে নমুনা রয়েছে।ithN
সঙ্গে , এক SVM সিদ্ধান্তের গণ্ডি নিম্নরূপ উপস্থাপন করতে পারেন:n=2
বর্গটি নিম্নলিখিত হিসাবে নির্ধারিত হয়:y
y(i)={−11 if wTx(i)+b≤−1 if wTx(i)+b≥1
যা হিসাবে আরও সংক্ষিপ্তভাবে লেখা যেতে পারে ।y(i)(wTx(i)+b)≥1
লক্ষ্য
এসভিএমের দুটি প্রয়োজনীয়তা সন্তুষ্ট করার লক্ষ্য:
এসভিএমের দুটি সিদ্ধান্তের সীমানার মধ্যে সর্বাধিক দূরত্ব হওয়া উচিত। গাণিতিকভাবে, এর অর্থ আমরা হাইপারপ্লেনের মধ্যে by দ্বারা সংজ্ঞায়িত হাইপারপ্লেন এবং দ্বারা সংজ্ঞায়িত করতে চাই । এই দূরত্ব সমান । এর মানে হল আমরা সমাধান চাই । সমতুল্যভাবে আমরা চাই
।wTx+b=−1wTx+b=1 22∥w∥maxw2∥w∥minw∥w∥2
এসভিএমকে সমস্ত correctly এর সঠিকভাবে শ্রেণিবদ্ধকরণ করা উচিত , যার অর্থx(i)y(i)(wTx(i)+b)≥1,∀i∈{1,…,N}
যা আমাদের নিম্নলিখিত চতুষ্কোণ অপ্টিমাইজেশান সমস্যার দিকে নিয়ে যায়:
minw,bs.t.∥w∥2,y(i)(wTx(i)+b)≥1∀i∈{1,…,N}
এটি হার্ড-মার্জিন এসভিএম , কারণ এই চতুর্ভুজটি অপ্টিমাইজেশান সমস্যাটি যদি কোনও সমাধানকে পৃথকভাবে পৃথক করা যায় তবে একটি সমাধান স্বীকার করে।
এক তথাকথিত প্রবর্তনের দ্বারা সীমাবদ্ধতার শিথিল করতে পারেন ঢিলা ভেরিয়েবল । নোট করুন যে প্রশিক্ষণ সেটের প্রতিটি নমুনার নিজস্ব স্ল্যাক ভেরিয়েবল রয়েছে। এটি আমাদের নিম্নলিখিত চতুষ্কোণ অপ্টিমাইজেশন সমস্যা দেয়:ξ(i)
minw,bs.t.∥w∥2+C∑i=1Nξ(i),y(i)(wTx(i)+b)≥1−ξ(i),ξ(i)≥0,∀i∈{1,…,N}∀i∈{1,…,N}
এটি নরম-মার্জিন এসভিএম । একটি হাইপারপ্রেমিটার যা ত্রুটি শর্তের পেনাল্টি বলে । ( লিনিয়ার কার্নেল সহ এসভিএমগুলিতে সি এর প্রভাব কী? এবং এসভিএম অনুকূল পরামিতি নির্ধারণের জন্য কোন অনুসন্ধানের সীমা? )।C
উচ্চতর মাত্রিক বৈশিষ্ট্য স্থানটিতে মূল বৈশিষ্ট্য স্থানটিকে ম্যাপ করে এমন একটি ফাংশন- প্রবর্তনের মাধ্যমে কেউ আরও নমনীয়তা যুক্ত করতে পারে । এটি অ-রৈখিক সিদ্ধান্তের সীমানাকে মঞ্জুরি দেয়। চতুর্ভুজ অপ্টিমাইজেশান সমস্যাটি হয়ে ওঠে:ϕ
minw,bs.t.∥w∥2+C∑i=1Nξ(i),y(i)(wTϕ(x(i))+b)≥1−ξ(i),ξ(i)≥0,∀i∈{1,…,N}∀i∈{1,…,N}
অপ্টিমাইজেশান
চতুর্ভুজ অপ্টিমাইজেশান সমস্যাটি ল্যাঙ্গরজিয়ান দ্বৈত সমস্যা (আগের সমস্যাটিকে প্রিমাল বলা হয় ) নামে আরও একটি অপ্টিমাইজেশান সমস্যায় রূপান্তরিত করা যেতে পারে :
maxαs.t.minw,b∥w∥2+C∑i=1Nα(i)(1−wTϕ(x(i))+b)),0≤α(i)≤C,∀i∈{1,…,N}
এই অপ্টিমাইজেশান সমস্যাটি সরল করা যায় (কিছুতে গ্রেডিয়েন্ট সেট করে ):0
maxαs.t.∑i=1Nα(i)−∑i=1N∑j=1N(y(i)α(i)ϕ(x(i))Tϕ(x(j))y(j)α(j)),0≤α(i)≤C,∀i∈{1,…,N}
w যেমন মনে হচ্ছে না ( উপস্থাপক উপপাদ্য দ্বারা বর্ণিত )।w=∑Ni=1α(i)y(i)ϕ(x(i))
তাই আমরা প্রশিক্ষণের সেটটির ব্যবহার করে learn শিখি ।α(i)(x(i),y(i))
(এফওয়াইআই: এসভিএম লাগানোর সময় দ্বৈত সমস্যা নিয়ে কেন বিরক্ত হবেন? সংক্ষিপ্ত উত্তর: দ্রুত গণনা + কার্নেল ট্রিক ব্যবহার করতে দেয় যদিও প্রাইমেলে এসভিএমকে প্রশিক্ষণের জন্য কিছু ভাল পদ্ধতি রয়েছে যেমন eg 1} দেখুন)
ভবিষ্যদ্বাণী করা
একবার learned শিখলে, কেউ নীচের মতো বৈশিষ্ট্য ভেক্টর with দিয়ে একটি নতুন নমুনার শ্রেণীর পূর্বাভাস দিতে পারে :α(i)xtest
ytest=sign(wTϕ(xtest)+b)=sign(∑i=1Nα(i)y(i)ϕ(x(i))Tϕ(xtest)+b)
সঙ্কলন , অপ্রতিরোধ্য মনে হতে পারে এটা মানে যেহেতু এক সব প্রশিক্ষণ নমুনার উপর যোগফল করতে আছে, কিন্তু বেশীরভাগ হয় (দেখুন কেন ল্যাঞ্জরেঞ্জ গুণকগুলি এসভিএমগুলির জন্য স্পার হয়? ) তাই বাস্তবে এটি কোনও সমস্যা নয়। (নোট যে এক যেখানে সব বিশেষ ক্ষেত্রে গঠন করা যেতে পারে ।) iff একটি হল সমর্থন ভেক্টর । উপরের চিত্রটিতে 3 টি সমর্থনকারী ভেক্টর রয়েছে।∑Ni=1α(i)0α(i)>0α(i)=0x(i)
কার্নেল কৌশল
কেউ পর্যবেক্ষণ করতে পারেন যে অপ্টিমাইজেশান সমস্যাটি কেবলমাত্র অভ্যন্তরীণ পণ্য in in । The অভ্যন্তরীণ পণ্য হয় নামক একটি কার্নেল , ওরফে কার্নেল ফাংশন, প্রায়ই দ্বারা চিহ্নিত ।ϕ(x(i))ϕ(x(i))Tϕ(x(j))(x(i),x(j))ϕ(x(i))Tϕ(x(j))k
বেছে নিতে পারে যাতে অভ্যন্তরীণ পণ্য গণনা করতে দক্ষ হয়। এটি স্বল্প গণনা ব্যয়ে একটি সম্ভাব্য উচ্চ বৈশিষ্ট্য স্থান ব্যবহার করতে দেয় allows এটিকে কর্নেল ট্রিক বলে । কার্নেল ফাংশনটি বৈধ হওয়ার জন্য , যেমন কার্নেল ট্রিকের সাথে ব্যবহারযোগ্য, এটি দুটি মূল বৈশিষ্ট্য সন্তুষ্ট করা উচিত । নির্বাচনের জন্য অনেকগুলি কার্নেল ফাংশন রয়েছে । পার্শ্ব নোট হিসাবে, কার্নেল ট্রিকটি অন্য মেশিন লার্নিং মডেলগুলিতে প্রয়োগ করা যেতে পারে , সেই ক্ষেত্রে এগুলি কার্নেলাইজড হিসাবে উল্লেখ করা হয় ।k
সামনে যাচ্ছি
এসভিএমগুলিতে কিছু আকর্ষণীয় কিউএ:
অন্যান্য লিঙ্ক:
তথ্যসূত্র: