এসভিএম এখনও উচ্চতর যেখানে অ্যাপ্লিকেশন আছে?


10

এসভিএম অ্যালগরিদম বেশ পুরানো - এটি 1960 এর দশকে উন্নত হয়েছিল, তবে 1990 এবং 2000 এর দশকে এটি অত্যন্ত জনপ্রিয় ছিল। এটি মেশিন লার্নিং কোর্সের একটি ধ্রুপদী (এবং বেশ সুন্দর) অংশ।

আজ মনে হচ্ছে মিডিয়া প্রসেসিংয়ে (চিত্র, শব্দ ইত্যাদি) নিউরাল নেটওয়ার্কগুলি পুরোপুরি আধিপত্য বজায় রাখে, অন্য অঞ্চলে গ্রেডিয়েন্ট বুস্টিংয়ের খুব শক্ত অবস্থান রয়েছে।

এছাড়াও, সাম্প্রতিক ডেটা প্রতিযোগিতায় আমি কোনও এসভিএম ভিত্তিক সমাধান পর্যবেক্ষণ করি না।

আমি অ্যাপ্লিকেশন উদাহরণগুলি সন্ধান করছি যেখানে এসভিএম এখনও স্টেট-অফ-আর্ট ফলাফল দেয় (২০১ of হিসাবে)।

আপডেট: আমি এসভিএম ব্যাখ্যা করার সময় শিক্ষার্থী / সহকর্মীদের উদাহরণ দিতে পারি যা আমি উদাহরণ দিতে পারি যাতে এটি নিখুঁত তাত্ত্বিক বা অবহেলিত পদ্ধতির মতো না লাগে।


3
কোন দিক থেকে সুপিরিয়ার? কিছু পারফরম্যান্স মেট্রিক? একটি গভীর নিউরাল নেট প্রশিক্ষণের জন্য প্রচুর পরিমাণে কম্পিউটার সময় প্রয়োজন, তবে আমি আমার ল্যাপটপে একটি সেবাযোগ্য এসভিএমকে প্রশিক্ষণ দিতে পারি।
সাইকোরাক্স মনিকাকে

@ ব্যবহারকারী 7777 বলতে অবশ্যই শ্রেণীবদ্ধকরণ / রেগ্রেশন মেট্রিক অবশ্যই প্রয়োগের ক্ষেত্রে উপযুক্ত। ডিএল এর জন্য গণ্য জটিলতার সমস্যাটি গুরুত্বপূর্ণ তবে এটি এই প্রশ্নের ক্ষেত্রের বাইরে কিছুটা।
অ্যালোও

উত্তর:


11

গবেষণাপত্র অনুসারে, আমাদের কি বিশ্বব্যাপী শ্রেণিবিন্যাসের সমস্যার সমাধানের জন্য কয়েকশ শ্রেণিবদ্ধ দরকার? এসভিএম একসাথে র‌্যান্ডম ফরেস্ট এবং গ্রেডিয়েন্ট বুটিং মেশিনগুলির সাথে 120+ ডেটাসেটের একটি বৃহত সেট (মেট্রিক হিসাবে নির্ভুলতা ব্যবহার করে) শীর্ষস্থানীয় পারফরম্যান্স শ্রেণিবদ্ধকরণ অ্যালগরিদমগুলির মধ্যে রয়েছে।

আমি তাদের পরীক্ষাগুলি কিছু সংশোধন করে পুনরাবৃত্তি করেছি এবং আমি এই তিনটি শ্রেণিবদ্ধ অন্যদের তুলনায় আরও ভাল পারফরম্যান্স পেয়েছি, তবে নিখরচায় মধ্যাহ্নভুক্ত উপপাদকটি না বলে এই সমস্যাটি রয়েছে যেহেতু এই তিনটির চেয়ে আরও কিছু অন্যান্য অ্যালগরিদম আরও ভাল সম্পাদন করে।

সুতরাং হ্যাঁ, আমি বলব যে এসভিএম (গাউসিয়ান কার্নেলের সাথে - এটি আমি ব্যবহার করেছি) এখনও মিডিয়া সম্পর্কিত ডেটাসেটগুলির জন্য একটি প্রাসঙ্গিক অ্যালগরিদম।


হাই, প্রতিক্রিয়া জন্য ধন্যবাদ! আমি এই আকর্ষণীয় অধ্যয়ন দেখেছি। যতদূর আমি বুঝতে পারি, ধারণাটি ছিল কোনও শ্রেণীবদ্ধকারী কোনও গুরুতর টিউনিং ছাড়াই কতটা দেয় (দেখুন ডেটা অ্যানালিস্টের আইএমও টিউন করা উচিত )। একটি অঞ্চল সম্পর্কিত অধ্যয়ন আরও আগ্রহী হবে।
অ্যালোও

1
আমার মনে আছে যে দেলগাদো এটগুলি সর্বোত্তম হাইপারপ্যারামিটারগুলির জন্য খুব বিশদ অনুসন্ধান চালায় নি, তবে যদি তারা কিছু অনুসন্ধান করে। প্রশ্ন (যার জন্য আমার কোনও উত্তর নেই) সর্বোত্তম হাইপারপ্যারামিটারগুলির জন্য আরও সূক্ষ্ম দানাদার অনুসন্ধানের ফলে বিভিন্ন ফলাফল হতে পারে কিনা তা। যদি এটি সত্য হয় তবে এর অর্থ হ'ল এসভিএমের সাথে প্রতিযোগিতামূলক অ্যালগরিদমগুলি সাধারণভাবে নির্দিষ্ট হাইপারপ্যারামিটারগুলির যথার্থতার জন্য খুব তীক্ষ্ণ শীর্ষে থাকে, যা আমি মনে করি অ্যালগরিদমের জন্য একটি নেতিবাচক কারণ।
জ্যাক ওয়াইনার

এছাড়াও একটি ছোট্ট মন্তব্যটি হ'ল ইউসিআই ডেটাসেটগুলি (পরীক্ষার জন্য ব্যবহৃত) বেশিরভাগই ছোট। আমি ভাবছি যদি এটি বৃদ্ধির খারাপ ফলাফলের ব্যাখ্যা হতে পারে? বেশিরভাগ কেগল চ্যালেঞ্জগুলি (অনেক তথ্য সহ) জিবি-র উচ্চতর পারফরম্যান্স প্রদর্শন করে।
অ্যালোও

আমি মানি যে ডেটা সেটগুলি ছোট। বৃহত্তর ডেটাসেটের জন্য আমি এই মুহূর্তে র্যান্ডম অরণ্যগুলি ব্যবহার করছি - হাইপারপ্যারামিটারগুলির সাথে আরও আরামদায়ক হওয়ার সাথে সাথেই আপনি জিবিএম ব্যবহার শুরু করবেন - আমি জানি না যে তাদের কাছে জিবিএম কতটা বুদ্ধিমান।
জ্যাক ওয়াইনার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.