সহায়তা ভেক্টর মেশিনগুলি বুঝতে আমাকে সহায়তা করুন


76

একটি সাপোর্ট ভেক্টর মেশিনের লক্ষ্যটি বিভিন্ন ইনপুটকে বিভিন্ন শ্রেণিতে সেট করে শ্রেণীবদ্ধ করার ক্ষেত্রে কীসের মূল বিষয়গুলি আমি তা বুঝতে পারি, তবে যা আমি বুঝতে পারি না সেগুলি হ'ল নিতান্ত-কৌতুকপূর্ণ বিবরণ। প্রারম্ভিকদের জন্য, আমি স্ল্যাক ভেরিয়েবলগুলি ব্যবহার করে কিছুটা বিভ্রান্ত। তাদের উদ্দেশ্য কী?

আমি একটি শ্রেণিবিন্যাসের সমস্যাটি করছি যেখানে আমি জুতার ইনসোলে রেখে সেন্সরগুলি থেকে চাপের পড়াগুলি ক্যাপচার করেছি। একটি বিষয় বসবে, দাঁড়াবে এবং কয়েক মিনিট হাঁটবে যখন প্রেসের ডেটা রেকর্ড করা হবে। আমি কোনও শ্রেণিবদ্ধকে প্রশিক্ষণ দিতে চাই যে কোনও ব্যক্তি বসে আছেন, দাঁড়িয়ে আছেন বা হাঁটছেন কিনা তা নির্ধারণ করতে এবং ভবিষ্যতের যে কোনও পরীক্ষার ডেটার জন্য এটি করতে সক্ষম হবেন। আমার কোন শ্রেণিবদ্ধের চেষ্টা করতে হবে? আমি যে ডেটা ক্যাপচার করেছি তা থেকে কোনও শ্রেণিবদ্ধকারীকে প্রশিক্ষণ দেওয়ার সর্বোত্তম উপায় কী? আমার বসার জন্য, দাঁড়ানো এবং চলার জন্য 1000 এন্ট্রি রয়েছে (3x1000 = 3000 মোট) এবং তাদের সকলের নীচের বৈশিষ্ট্য ভেক্টর ফর্ম রয়েছে। (প্রেসারফ্রমেসেন্সর 1, প্রেসারফ্রেমেন্সর 2, প্রেসারফ্রেসেন্সর 3, প্রেসারফ্রেসেন্সেন্সর 4)


উত্তর:


103

আমি মনে করি আপনি খারাপ প্রান্ত থেকে শুরু করার চেষ্টা করছেন। এটি ব্যবহারের জন্য এসভিএম সম্পর্কে যা জানা উচিত তা কেবল এই যে এই অ্যালগরিদম বৈশিষ্ট্যগুলির হাইপারস্পেসে একটি হাইপারপ্লেন সন্ধান করছে যা দুটি শ্রেণিকে সবচেয়ে ভাল পৃথক করে, যেখানে শ্রেণীর মধ্যে সবচেয়ে বড় ব্যবধানের সর্বোত্তম উপায় (এটি কীভাবে করা হয় তা জ্ঞানটি এখানে আপনার শত্রু, কারণ এটি সামগ্রিক চিত্রকে ঝাপটায়), এর মতো একটি বিখ্যাত ছবি দ্বারা চিত্রিত: বিকল্প পাঠ

এখন, কিছু সমস্যা বাকি আছে।
প্রথমত, সেই সমস্ত দুষ্টু অপ্রত্যাশিত লোকেরা কি অন্য শ্রেণীর পয়েন্টের মেঘের কেন্দ্রে নির্লজ্জভাবে শুয়ে আছেন?
বিকল্প পাঠ
এ লক্ষ্যে আমরা অপ্টিমাইজারকে নির্দিষ্ট নমুনা বিভ্রান্তিকর রেখে দেওয়ার অনুমতি দিই, তবুও এরকম প্রতিটি উদাহরণকে শাস্তি দেব। বহুমুখী অপিমেশন এড়ানোর জন্য, বিভ্রান্তিযুক্ত মামলার জরিমানা মার্জিন আকারের সাথে অতিরিক্ত প্যারামিটার সি ব্যবহার করে মার্জ করা হয় যা সেই লক্ষ্যের মধ্যে ভারসাম্য নিয়ন্ত্রণ করে।
এরপরে, কখনও কখনও সমস্যাটি কেবল রৈখিক নয় এবং কোনও ভাল হাইপারপ্লেন পাওয়া যায় না। এখানে আমরা কার্নেল ট্রিকটি প্রবর্তন করেছি - আমরা কেবলমাত্র মূল, ননলাইনার স্পেসটি কিছু উচ্চতর মাত্রার সাথে কিছু অরৈখিক রূপান্তর সহ প্রজেক্ট করব, অবশ্যই অতিরিক্ত পরামিতিগুলির একগুচ্ছ দ্বারা সংজ্ঞায়িত করা হয়েছে, এই আশায় যে ফলস্বরূপ স্থানটি সমস্যাটি একটি সমতলের জন্য উপযুক্ত হবে ing SVM:

বিকল্প পাঠ

তবুও আবার কিছু গণিতের সাথে এবং আমরা দেখতে পাচ্ছি যে এই পুরো রূপান্তর প্রক্রিয়াটি তথাকথিত কার্নেল ফাংশন দিয়ে অবজেক্টগুলির ডট পণ্য প্রতিস্থাপন করে উদ্দেশ্য ফাংশনটি পরিবর্তন করে মার্জিতভাবে লুকানো যেতে পারে।
সবশেষে, এটি 2 টি শ্রেণীর জন্য কাজ করে এবং আপনার 3 টি রয়েছে; এটা নিয়ে কি করতে চান? এখানে আমরা 3 টি শ্রেণির শ্রেণিবদ্ধ তৈরি করি (বসে আছেন - বসে নেই, দাঁড়িয়ে নেই - দাঁড়িয়ে নেই, হাঁটছেন না - হাঁটছেন) এবং শ্রেণিবিন্যাসে তাদের ভোটদানের সাথে একত্রিত করুন।

ঠিক আছে, সুতরাং সমস্যাগুলি সমস্যার সমাধান বলে মনে হচ্ছে, তবে আমাদের কার্নেলটি নির্বাচন করতে হবে (এখানে আমরা আমাদের অন্তর্দৃষ্টি দিয়ে পরামর্শ করব এবং আরবিএফ বাছাই করব) এবং কমপক্ষে কয়েকটি পরামিতি (সি + কার্নেল) ফিট করব। এবং আমাদের অবশ্যই এটির জন্য ওভারফিট-সেফ অবজেক্টিভ ফাংশন থাকতে হবে, উদাহরণস্বরূপ ক্রস-বৈধতা থেকে ত্রুটি অনুমানের। সুতরাং আমরা কম্পিউটারটি এটিতে কাজ করি, একটি কফির জন্য যাই, ফিরে এসে দেখি যে এখানে কিছু অনুকূল পরামিতি রয়েছে। গ্রেট! এখন আমরা ত্রুটি কাছাকাছি এবং voila আছে নেস্টেড ক্রস বৈধকরণ শুরু।

এই সংক্ষিপ্ত ওয়ার্কফ্লোটি অবশ্যই পুরোপুরি সঠিক হতে খুব সহজ হয়েছে, তবে আমি কেন মনে করি যে আপনি প্রথমে এলোমেলো বন , যা প্রায় পরামিতি-স্বাধীন, নেটিভ মাল্টিক্লাসের সাথে চেষ্টা করা উচিত , নিরপেক্ষ ত্রুটির প্রাক্কলন সরবরাহ করে এবং প্রায় ভাল ভাল লাগানো এসভিএমগুলি সম্পাদন করে ।


5
(+1) দুর্দান্ত যে আপনি কিছু চিত্র জুড়ে পুরো বিষয়টি চিত্রিত করার জন্য!
chl

3
@ এমবিকিউ যেহেতু আপনি এসভিএম-তে খুব সক্ষম বলে মনে হচ্ছে, আমার সন্দেহটি পরিষ্কার করতে বলি: একবার যখন আমরা সবচেয়ে ভাল বিভাজনকারী হাইপারপ্লেন পেয়েছি, তখন আমরা কীসের জন্য এটি ব্যবহার করব? আমরা এসভিএমকে এমন একটি পদ্ধতি হিসাবে সংজ্ঞায়িত করতে পারি যা প্রথমত, ডেটা পয়েন্টগুলি সঠিকভাবে শ্রেণিবদ্ধ করার জন্য সেরা হাইপারপ্লেন বেছে নেয় এবং দ্বিতীয়ত, দুটি শ্রেণিতে নতুন ডেটা পয়েন্ট ছিন্ন করতে এটি এই হাইপারপ্লেনটি ব্যবহার করে। রাইট? (আমার দ্বিতীয় অংশে কিছু সন্দেহ আছে)
ডেভিডচিকো.ইট

3
@ ডেভিডচিকো.ইট মূলত পুরো এমএলটির মূল সমস্যাটি এমন একটি মডেল তৈরি করা যা নির্ভরযোগ্যভাবে নতুন ডেটার পূর্বাভাস দেয়, তাই হ্যাঁ।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.