ডোমেনগুলি কী কী যেখানে এসভিএমগুলি এখনও অত্যাধুনিক রয়েছে?


10

দেখে মনে হয় যে গভীর স্নায়ুবহুল নেটওয়ার্ক এবং অন্যান্য স্নায়ু নেটওয়ার্ক ভিত্তিক মডেলগুলি কম্পিউটারের দর্শন, বস্তুর শ্রেণিবিন্যাস, পুনর্বহালকরণ শিখন ইত্যাদির অনেকগুলি বর্তমান অঞ্চলে আধিপত্য বিস্তার করছে seems

এমন কি এমন ডোমেইন রয়েছে যেখানে এসভিএম (বা অন্যান্য মডেল) এখনও অত্যাধুনিক ফলাফল তৈরি করছে?

উত্তর:


12

স্টেট অফ দ্য আর্ট একটি শক্ত বার, কারণ এটি কীভাবে পরিমাপ করা উচিত তা পরিষ্কার নয়। একটি বিকল্প মানদণ্ড, যা অত্যাধুনিকের অনুরূপ, আপনি কখন কোনও এসভিএম চেষ্টা করতে পছন্দ করতে পারেন তা জিজ্ঞাসা করা ।

এসভিএমগুলির বিভিন্ন সুবিধা রয়েছে:

  1. কার্নেল ট্রিকের মাধ্যমে, যদি আপনি মূল বৈশিষ্ট্যটি সেট না করে বৈশিষ্ট্যগুলির অনেকগুলি অ-রৈখিক সংমিশ্রণের উপর নিদর্শন শিখতে চান তবে কোনও এসভিএমের রানটাইম উল্লেখযোগ্যভাবে বৃদ্ধি পায় না। বিপরীতে, একটি গভীর নিউরাল নেটওয়ার্কের মতো আরও আধুনিক পদ্ধতির একই ধরণের মডেল করার জন্য আরও গভীর বা আরও প্রশস্ত হওয়া দরকার যা এটির প্রশিক্ষণের সময় বাড়িয়ে তুলবে।
  2. "রক্ষণশীল" হাইপোথিসিকে বাছাইয়ের দিকে এসভিএমগুলির অন্তর্নিহিত পক্ষপাত থাকে, যা তথ্যের তুলনায় খুব কম সম্ভাবনা থাকে, কারণ তারা সর্বাধিক মার্জিন অনুমানগুলি অনুসন্ধান করার চেষ্টা করে। কিছু অর্থে তারা ওসামের ক্ষুরটি "বেক-ইন" করে।
  3. এসভিএমগুলিতে দুটি মাত্র হাইপারপ্যারামিটার রয়েছে (কার্নেলের পছন্দ এবং নিয়মিতকরণের ধ্রুবক), তাই নির্দিষ্ট সমস্যার সাথে তাল মিলানো খুব সহজ। প্যারামিটার স্পেসের মাধ্যমে সাধারণ গ্রিড-অনুসন্ধান করে তাদের টিউন করার জন্য এটি পর্যাপ্ত, যা স্বয়ংক্রিয়ভাবে করা যায়।

এসভিএমগুলির কিছু অসুবিধাও রয়েছে:

  1. এসভিএমগুলির একটি রানটাইম থাকে যা আপনি প্রশিক্ষণ করতে চান এমন ডেটাপয়েন্টগুলির সংখ্যায় ঘনক্ষেত্রে স্কেল করে ie O(n3)রানটাইম) 1 । এটি বলুন, গভীর স্নায়বিক নেটওয়ার্কের জন্য একটি সাধারণ প্রশিক্ষণ পদ্ধতির সাথে ভাল তুলনা হয় না যা চলেছেO(wne) সময়, কোথায় n ডেটা পয়েন্ট সংখ্যা, e প্রশিক্ষণ যুগের সংখ্যা এবং wনেটওয়ার্কের ওজন সংখ্যা। সাধারণতw,e<<n
  2. কার্নেল ট্রিকটি ব্যবহার করতে, এসভিএমগুলি কোনও দুটি জোড়া পয়েন্টের মধ্যে কার্নেলযুক্ত "দূরত্ব" এর জন্য একটি মান ক্যাশে করে। এর অর্থ তাদের দরকারO(n2)স্মৃতি. এটি বেশিরভাগ রিয়েল-ওয়ার্ল্ড সেটে কিউবিক রানটাইমের চেয়ে অনেক বেশি দূরে, বেশি কয়েক হাজার datapoints অধিকাংশ আধুনিক সার্ভার ছাড়বে পিটুনি , যা মাত্রার বিভিন্ন আদেশ দ্বারা কার্যকর রানটাইম বাড়িয়ে দেয়। পয়েন্ট 1 এর সাথে একত্রে, এর অর্থ এসভিএমগুলি উপরের সীমাতে 5,000-10,000 ডেটাপয়েন্ট ছাড়িয়ে সম্ভবত সেটগুলি অকার্যকরভাবে ধীর হয়ে যাবে।

এই সমস্ত কারণগুলি এসভিএমগুলিকে ঠিক একটি ব্যবহারের ক্ষেত্রে প্রাসঙ্গিকভাবে নির্দেশ করে: ছোট ডাটাবেস যেখানে লক্ষ্য প্যাটার্নটি ভাবা হয়, এপ্রোরি, কিছু নিয়মিত, তবে অত্যন্ত অ-রৈখিক, বিপুল সংখ্যক বৈশিষ্ট্যের ফাংশন। এই ব্যবহারের ঘটনাটি প্রায়শই প্রায়শই দেখা দেয়। সাম্প্রতিক একটি উদাহরণ অ্যাপ্লিকেশন যেখানে আমি এসভিএমগুলিকে প্রাকৃতিক পদ্ধতির বলে মনে করেছি একটি লক্ষ্য ফাংশনের জন্য ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করছিল যা বৈশিষ্ট্যগুলির জোড়া (বিশেষত, এজেন্টগুলির জোড়া মধ্যে যোগাযোগ) এর মধ্যে মিথস্ক্রিয়াগুলির ফলস্বরূপ পরিচিত ছিল। চতুর্ভুজ কার্নেল সহ একটি এসভিএম অতএব দক্ষতার সাথে রক্ষণশীল, যুক্তিসঙ্গত, অনুমানগুলি শিখতে পারে।


1 অন্যান্য উত্তরগুলিতে উল্লিখিত হিসাবে আনুমানিক অ্যালগরিদম রয়েছে যা এর চেয়ে দ্রুত এসভিএমকে সমাধান করবে।


7

ডিপ লার্নিং এবং নিউরাল নেটওয়ার্কগুলি ক্ষেত্রে সাম্প্রতিক অগ্রগতির কারণে বেশিরভাগ ফোকাস পাচ্ছে এবং বেশিরভাগ বিশেষজ্ঞরা এটি মেশিন লার্নিংয়ের সমস্যা সমাধানের ভবিষ্যত বলে মনে করেন।

তবে কোনও ভুল করবেন না, ধ্রুপদী মডেলগুলি এখনও ব্যতিক্রমী ফলাফল উত্পন্ন করে এবং কিছু সমস্যায় তারা গভীর শিক্ষার চেয়ে আরও ভাল ফলাফল করতে পারে।

লিনিয়ার রিগ্রেশন এখনও পর্যন্ত বিশ্বের সবচেয়ে ব্যবহৃত মেশিন লার্নিং অ্যালগরিদম।

কোনও নির্দিষ্ট ডোমেন সনাক্ত করা কঠিন যেখানে শাস্ত্রীয় মডেলগুলি সর্বদা আরও ভাল সম্পাদন করে কারণ ইনপুট ডেটার আকার এবং গুণমানের উপর নির্ভুলতা অনেকটাই নির্ধারিত হয়।

সুতরাং অ্যালগরিদম এবং মডেল নির্বাচন সর্বদা একটি বাণিজ্য বন্ধ। এটি ক্লাসিকাল মডেলগুলি আরও ছোট ডেটা সেটগুলির সাথে আরও ভাল পারফরম্যান্স তৈরি করতে কিছুটা সঠিক বিবৃতি। যাইহোক, অনেক গবেষণা কম ডেটাতে গভীর শেখার মডেল কর্মক্ষমতা উন্নত করতে চলেছে।

বেশিরভাগ ধ্রুপদী মডেলগুলির জন্য কম গণনার সংস্থান দরকার হয় তাই যদি আপনার লক্ষ্যটি গতি হয় তবে এটি আরও ভাল।

এছাড়াও, শাস্ত্রীয় মডেলগুলি কার্যকর করা এবং ভিজ্যুয়ালাইজ করা সহজ যা পারফরম্যান্সের জন্য অন্য সূচক হতে পারে তবে এটি আপনার লক্ষ্যগুলির উপর নির্ভর করে।

আপনার যদি সীমাহীন সংস্থান থাকে, একটি বিশাল পর্যবেক্ষণযোগ্য ডেটা সেট যা সঠিকভাবে লেবেলযুক্ত এবং আপনি সঠিকভাবে সমস্যা ডোমেনের মধ্যে এটি প্রয়োগ করেন তবে গভীর শিক্ষণ সম্ভবত বেশিরভাগ ক্ষেত্রে আপনাকে আরও ভাল ফলাফল দিতে চলেছে।

তবে আমার অভিজ্ঞতায় বাস্তব-বিশ্বের পরিস্থিতি কখনই এই নিখুঁত হয় না


0

@ জন এর উত্তরের সাথে পুরোপুরি একমত চেষ্টা করুন এবং আরও কিছু পয়েন্ট সঙ্গে পরিপূরক হবে।

এসভিএমগুলির কিছু সুবিধা:

ক) এসভিএমকে উত্তল অপ্টিমাইজেশন সমস্যা দ্বারা সংজ্ঞায়িত করা হয় যার জন্য সমাধানের জন্য দক্ষ পদ্ধতি রয়েছে যেমন এসএমওর মতো

খ) উচ্চ মাত্রিক জায়গাগুলিতে এবং সেই সাথে ক্ষেত্রে যেখানে মাত্রাগুলির সংখ্যা নমুনার সংখ্যার চেয়ে বেশি।

গ) সিদ্ধান্ত ফাংশনে প্রশিক্ষণ পয়েন্টগুলির একটি উপসেট ব্যবহার করে (সমর্থন ভেক্টর নামে পরিচিত), তাই এটি মেমরিরও দক্ষ।

d) সিদ্ধান্ত ফাংশনের জন্য বিভিন্ন কার্নেল ফাংশন নির্দিষ্ট করা যেতে পারে। । এর সর্বাধিক আকারে, কার্নেল ট্রিকের অর্থ ডেটা শ্রেণীর মধ্যে স্পষ্ট বিভাজক মার্জিন রয়েছে এমন ডেটাটিকে অন্য মাত্রায় রূপান্তরিত করা।

সমর্থন ভেক্টর মেশিনগুলির অসুবিধাগুলির মধ্যে রয়েছে:

ক) যদি বৈশিষ্ট্যের সংখ্যা নমুনার সংখ্যার তুলনায় অনেক বেশি হয় তবে কার্নেল ফাংশন এবং নিয়মিতকরণের মেয়াদটি বেছে নেওয়ার ক্ষেত্রে অতিরিক্ত-ফিটিং এড়ানো গুরুত্বপূর্ণ is কার্নেল মডেলগুলি মডেল নির্বাচনের মানদণ্ডকে অতিরিক্ত-ফিট করার জন্য বেশ সংবেদনশীল হতে পারে

খ) এসভিএমগুলি সরাসরি সম্ভাবনার অনুমান দেয় না। অনেক শ্রেণিবিন্যাসের সমস্যায় আপনি প্রকৃতপক্ষে শ্রেণীর সদস্যতার সম্ভাবনা চান, সুতরাং সম্ভাবনা পাওয়ার জন্য এসভিএমের আউটপুট পোস্ট-প্রক্রিয়া না করে লজিস্টিক রিগ্রেশন জাতীয় পদ্ধতি ব্যবহার করা ভাল।


-1

নিম্ন-মাত্রিক টেবুলার ডেটার ডেটাসেটের জন্য। বিপুল পরিমাণে ওভারপেমেটারাইসেশনের কারণে ডিএনএন নিম্ন-মাত্রিক ইনপুটটিতে দক্ষ নয়। এমনকি যদি ডেটাসেট আকারে বিশাল হয় তবে প্রতিটি নমুনা নিম্ন-মাত্রিক এসভিএম ডিএনএনকে হারাতে পারে।

আরও সাধারণভাবে যদি ডেটা টেবুলার হয় এবং নমুনার ক্ষেত্রগুলির মধ্যে পারস্পরিক সম্পর্ক দুর্বল এবং কোলাহলপূর্ণ হয় তবে এসভিএম এখনও উচ্চ মাত্রিক ডেটার জন্য ডিএনএনকে পরাজিত করতে পারে তবে এটি নির্দিষ্ট তথ্যের উপর নির্ভর করে।

দুর্ভাগ্যক্রমে আমি বিষয় সম্পর্কিত কোনও নির্দিষ্ট কাগজপত্র প্রত্যাহার করতে পারি না, সুতরাং এটি বেশিরভাগই সাধারণ জ্ঞানের যুক্তি, আপনার এটি বিশ্বাস করার দরকার নেই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.