বিদ্যমান এসভিএম মডেলগুলিতে প্রশিক্ষণ ডেটা যুক্ত করা কি সম্ভব?


14

আমি libsvm ব্যবহার করছি এবং আমি লক্ষ্য করেছি যে আমি যখনই svmtrain () কল করি তখন আমি একটি নতুন মডেল তৈরি করি এবং মনে হয় যে কোনও বিদ্যমান মডেলটিতে ডেটা রাখার কোনও বিকল্প নেই। এটি কি তবে সম্ভব? আমি কি শুধু লিবসভিমে এই দিকটি দেখছি না?


আমি নিশ্চিত না যে আপনি 'বিদ্যমান মডেলটিতে ডেটা রাখুন' বলতে কী বোঝায়? আপনি কি অন্য কিছু কৌশল (এসভিএম নয়) এর উদাহরণ দিতে পারেন যা আপনাকে এটি করতে দেয়? উদাহরণস্বরূপ লজিস্টিক রিগ্রেশন গ্রহণ করুন; আপনি যদি নতুন ডেটা যুক্ত করেন তবে বিদ্যমান সেটটিতে নতুন কোনও সহ-কার্যকারীর একটি নতুন সেট পাবেন যা কোনও তথ্য 'নতুন' বা 'পুরাতন' সম্পর্কিত উল্লেখ ছাড়াই, এটি কেবলমাত্র প্রশিক্ষণের ডেটা। আমার ধারণা আপনি যদি পূর্ববর্তী অনুকূলিত মানের সাথে আরম্ভ করে সময় বাঁচাতে পারেন তবে আপনি যদি গ্রেডিয়েন্ট বংশোদ্ভূত টাইপ সলভার ব্যবহার করছেন তবে সম্ভবত এটি নতুন সমাধানের খুব কাছাকাছি থাকবে। এর মানে কি?
বোগদানোভিস্ট

উত্তর:


17

দেখে মনে হচ্ছে আপনি কোনও "ইনক্রিমেন্টাল" বা "অনলাইন" শেখার অ্যালগরিদম খুঁজছেন। এই অ্যালগরিদমগুলি আপনাকে পুরো বিষয়টিকে স্ক্র্যাচ থেকে পুনরায় প্রশিক্ষণ না দিয়ে নতুন উদাহরণ দিয়ে একটি শ্রেণিবদ্ধ আপডেট করতে দেয়।

সমর্থন ভেক্টর মেশিনগুলির মাধ্যমে এটি অবশ্যই সম্ভব, যদিও আমি বিশ্বাস করি যে লিবিএসভিএম বর্তমানে এটি সমর্থন করে না। এটি সহ আরও কয়েকটি প্যাকেজ যা এটি সরবরাহ করে তা একবার দেখে নেওয়া উচিত

পিএস: @ বোগদানোভিস্ট: এটি সম্পর্কে একটি দুর্দান্ত বিস্তৃত সাহিত্য রয়েছে। কেএনএন স্পষ্টত এবং তুচ্ছভাবে বর্ধনশীল। কেউ সম্ভাব্যতার পরিবর্তে গণনা সঞ্চয় করে বায়সিয়ান শ্রেণিবদ্ধগুলিকে (কিছু) বর্ধিত শ্রেণিবদ্ধে পরিণত করতে পারে। স্ট্যাগার, একিউ * এবং সিদ্ধান্ত গাছের অ্যালগোরিদমের আইডি * পরিবারের কিছু (তবে সব কিছু নয়) আমার বর্ধনের দিক থেকেও বর্ধনশীল।


1
আকর্ষণীয়, মাথা আপ জন্য ধন্যবাদ। আমি আগে 'অনলাইন' শব্দটি বন্ধুত্বপূর্ণ দেখতে পেয়েছি, তবে প্রযুক্তিগত তাত্পর্যটি বুঝতে পারি নি (আমি ভেবেছিলাম এটির আক্ষরিক অর্থ 'হ্যাজ ইন্টারনেটজ' করতে পারে ')।
বোগদানোভিস্ট

সাহায্য করে আনন্দ পেলাম! আমার উপরে এটি উল্লেখ করা উচিত ছিল, তবে কিছু অনলাইন / ইনক্রিমেন্টাল অ্যালগরিদম আসলে "নতুন" উদাহরণগুলিতে আরও বেশি ওজন দেয় যা আপনার প্রয়োগের উপর নির্ভর করে কার্যকর হতে পারে বা নাও পারে (যেমন, টুইটারের বিষয়ে পূর্বাভাস দেওয়ার জন্য দুর্দান্ত, ক্যান্সারের চেয়ে কম ভয়ঙ্কর) গবেষণা)।
ম্যাট ক্রাউস

12

অনলাইন / ইনক্রিমেন্টাল এসভিএম ইউটিলিটিগুলির বেশিরভাগটি লিনিয়ার কার্নেলের জন্য এবং আমি মনে করি এটি লিনিয়ার কার্নেলের পক্ষে যতটা কঠিন নয়।

বর্তমানে উপলব্ধ কয়েকটি উল্লেখযোগ্য অনলাইন / ইনক্রিমেন্টাল এসভিএম সরঞ্জামসমূহ:
+ লিওন বটসের লসভিএম : এটি লিনিয়ার এবং অ-লিনিয়ার উভয় কার্নেলকে সমর্থন করে। সি ++ কোড
+ বর্ডসের লর্যাঙ্ক : এটি লিনিয়ার এবং অ-রৈখিক উভয় কার্নেল সমর্থন করে। সি ++ কোড। দেখে মনে হচ্ছে লিঙ্কটি এখন ভেঙে গেছে :-(
+ + গার্টি Cauwenberghs 'কোড ক্রমবর্ধমান এবং decremental : সমর্থন উভয় রৈখিক এবং অরৈখিক কার্নেলের মতলব কোড।।
+ + ক্রিস Diehl এর ক্রমবর্ধমান SVM শিক্ষণ ।। সমর্থন উভয় রৈখিক এবং অরৈখিক কার্নেলের মতলব কোড
+ + অ্যালিস্টার শিল্টনের এসভিএম হাইভি : কেবল বাইনারি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন C সি ++ কোড
+ ফ্রান্সেসকো পার্লেলার অনলাইনএসভিআর: কেবলমাত্র রিগ্রেশন। মতলব এবং সি ++।
+ পেগাসোস : লিনিয়ার এবং ননলাইনার উভয়ই। সি এবং মতলব কোড। একটি জাভা ইন্টারফেস
+ ল্যাংফোর্ডের ভোপাল ওয়াব্বিট : নিশ্চিত নয় :-(
+ কোবি ক্র্যামারের এমসিএসভিএম : লিনিয়ার এবং অ-রৈখিক উভয় সি কোড

আমার কোওড়ার উত্তরে আরও একটি আপডেটেড তালিকা পাওয়া যাবে ।


(+1) সাইটে স্বাগতম। এটি বেশ পরিস্কার তালিকা! :)
কার্ডিনাল

4

আর একটি সম্ভাবনা হ'ল আলফা-বীজ । LibSVM এটি সমর্থন করে কিনা তা আমি অবগত নই। ধারণাটি হ'ল বিশাল অঙ্কের প্রশিক্ষণের ডেটাগুলি অংশগুলিতে ভাগ করা divide তারপরে আপনি প্রথম অংশে একটি এসভিএম প্রশিক্ষণ দিন। যেহেতু ফলস্বরূপ সমর্থনকারী ভেক্টরগুলি আপনার ডেটার কয়েকটি নমুনা ব্যতীত আর কিছুই নয়, আপনি সেগুলি নিয়ে যান এবং আপনার এসভিএমকে পরবর্তী খণ্ড দিয়ে প্রশিক্ষণের জন্য ব্যবহার করেন। এছাড়াও, আপনি পরবর্তী পুনরাবৃত্তির (বীজ) জন্য আলফা মানগুলির প্রাথমিক অনুমান গণনা করতে সেই এসভিএম ব্যবহার করেন। অতএব, সুবিধাগুলি দ্বিগুণ: সমস্যাগুলির প্রতিটিই ছোট এবং স্মার্ট ইনিশিয়ালাইজের মাধ্যমে তারা আরও দ্রুত রূপান্তরিত করে। এইভাবে আপনি ধারাবাহিকভাবে আরও সহজ পদক্ষেপের সমাধান করার জন্য একটি বিশাল সমস্যাটিকে সহজ করে তোলেন।


এই পদ্ধতি প্রয়োগ করে কি কোনও লাইব্রেরি আছে?
d.putto

দৃশ্যত libsvm ইতিমধ্যে এটি অ্যালগরিদম এর কিছু বৈচিত্র করে, বা অন্তত work.caltech.edu/~htlin/program/libsvm
jpmuc

1

আপনি যদি "ইনক্রিমেন্টাল" সমাধান খুঁজছেন তবে অন্য একটি বিকল্প এখানে পাওয়া যাবে ...

লিবলাইনারি বর্ধনশীল

লাইব্লায়ারআইএন-এর একটি এক্সটেনশন যা বর্ধিত শিক্ষার জন্য অনুমতি দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.