আরবিএফ এসভিএম ব্যবহারের মামলাগুলি (বনাম লজিস্টিক রিগ্রেশন এবং এলোমেলো বন)


10

রেডিয়াল-বেস ফাংশন কার্নেল সহ সমর্থন ভেক্টর মেশিনগুলি একটি সাধারণ-উদ্দেশ্য তদারকি করা শ্রেণিবদ্ধকারী।

যদিও আমি এই এসভিএমগুলির জন্য তাত্ত্বিক ভিত্তি এবং তাদের দৃ points় বিষয়গুলি জানি, তবে আমি সেসব ক্ষেত্রে সচেতন নই যেখানে তারা পছন্দসই পদ্ধতি। সুতরাং, এমন কি এমন এক শ্রেণির সমস্যা রয়েছে যার জন্য আরবিএফ এসভিএমগুলি অন্যান্য এমএল কৌশলগুলির চেয়ে উচ্চতর? (হয় স্কোরের ক্ষেত্রে বা অন্য হিসাবে - যেমন দৃust়তা, শুরু করার সহজতা, ব্যাখ্যাযোগ্যতা ইত্যাদি)

আমি জিজ্ঞাসা করছি, যেহেতু আমার ডিফল্ট পদ্ধতিটি লজিস্টিক রিগ্রেশন (সম্ভবত কিছু মিথস্ক্রিয়া সহ), এলোমেলো বন এবং কিছুটা নিউরাল নেটওয়ার্ককে কেন্দ্র করে। আমার বন্ধুরা এমএল করছে না কেউ (কিছু কেগল বিজয়ী) একজন এসভিএম-ব্যবহারকারী (তবে এটি আমার সম্প্রদায়ের একটি নিদর্শন হতে পারে, বা তারা যে সমস্যাগুলি মোকাবেলা করে)।

উত্তর:


8

আমি প্রকাশিত প্রমাণ, ব্যক্তিগত অভিজ্ঞতা এবং অনুমানের সংমিশ্রণে এই প্রশ্নের উত্তর দেওয়ার চেষ্টা করব।

ক) প্রকাশিত প্রমাণ।

আমি জানি যে একমাত্র কাগজটি প্রশ্নের উত্তর দিতে সহায়তা করে তা হ'ল দেলগাদো এট আল 2014 - রিয়েল ওয়ার্ল্ড ক্লাসিফিকেশন সমস্যাগুলি সমাধান করার জন্য আমাদের কি কয়েকশ শ্রেণিবদ্ধ দরকার? - জেএমএলআর যা ইউসিআই থেকে 121 ডেটাসেটে শত শত বিভিন্ন অ্যালগরিদম এবং বাস্তবায়ন পরিচালনা করে। তারা দেখতে পান যে যদিও আরবিএফ এসভিএম "সেরা" অ্যালগরিদম না (এটি সঠিকভাবে মনে রাখলে এটি এলোমেলো বন) তবে এটি শীর্ষ 3 (বা 5) এর মধ্যে রয়েছে।

আপনি যদি বিবেচনা করেন যে তাদের ডেটাসেটগুলি নির্বাচন করা বাস্তব জগতের সমস্যার একটি "ভাল নমুনা", এসভিএমের চেয়ে অবশ্যই একটি অ্যালগরিদম যা নতুন সমস্যার জন্য চেষ্টা করা উচিত তবে প্রথমে একটি এলোমেলো বন চেষ্টা করা উচিত!

ফলাফলটি সাধারণীকরণের সীমাটি হ'ল ডেটাসেটগুলি প্রায় সমস্ত লম্বা এবং চর্মসার (n >> p), খুব কম বিরাট নয় - যা আমি অনুমান করি যে আরএফের জন্য আরও বেশি সমস্যা হওয়া উচিত, এবং খুব বড় নয় (এন এবং পি উভয়)।

অবশেষে, এখনও প্রকাশিত প্রমাণে, আমি দুটি সাইট সুপারিশ করি যা এলোমেলো বনগুলির বিভিন্ন বাস্তবায়নকে তুলনা করে:

খ) ব্যক্তিগত অভিজ্ঞতা।

আমি বিশ্বাস করি যে মেশিন লার্নিং সম্প্রদায়ের জন্য দেলগাদো এবং এ জাতীয় সমস্ত কাগজপত্র খুব গুরুত্বপূর্ণ, তাই আমি তাদের ফলাফলগুলি কিছু ভিন্ন শর্তে প্রতিলিপি করার চেষ্টা করেছি। আমি 100+ বাইনারি ডেটাসেটে (দেলগাদোর ডেটাসেটের সেট থেকে) প্রায় 15 টি পৃথক অ্যালগরিদম চালিয়েছি। আমি আরও মনে করি যে হাইপারপ্যারামিটারগুলি সেগুলির ক্ষেত্রে আমি আরও যত্নবান ছিলাম।

আমার ফলাফলগুলি হ'ল এসভিএম হ'ল "সেরা অ্যালগরিদম" (মানে র‌্যাঙ্ক ৪.৯)। আমার গ্রহণযোগ্যতাটি হ'ল এসভিএম আরএফ পাস করেছে কারণ মূল ডেটাসেটটিতে অনেকগুলি মাল্টিক্লাস সমস্যা রয়েছে - যা আমি অনুমানের অংশে আলোচনা করব - এসভিএমের জন্য সমস্যা হওয়া উচিত।

সম্পাদনা (জুন / 16):

কিন্তু আরএফ হয় পথ পথ দ্রুত, এবং এটি 2nd সেরা আলগোরিদিম (গড় র্যাঙ্ক 5.6) gbm (5.8) দ্বারা অনুসরণ nnets (7.2), ইত্যাদি) ছিল। আমি এই সমস্যাগুলিতে স্ট্যান্ডার্ড লজিস্টিক রিগ্রেশন চেষ্টা করি নি, তবে আমি একটি ইলাস্টিক নেট (এল 1 এবং এল 2 নিয়ন্ত্রিত এলআর) চেষ্টা করেছি তবে এটি ভাল সম্পাদন করতে পারেনি (মানে 8.3 রেঙ্ক) ~

আমি ফলাফলগুলি বিশ্লেষণ বা কাগজ লেখার কাজ শেষ করি নি তাই ফলাফলগুলি সহ কোনও প্রযুক্তিগত প্রতিবেদনের দিকেও নির্দেশ করতে পারি না। আশা করি, কয়েক সপ্তাহের মধ্যে আমি এই উত্তরটি পুনরায় সম্পাদনা করতে এবং ফলাফলগুলি সহ কোনও প্রযুক্তিগত প্রতিবেদনের দিকে নির্দেশ করতে পারি।

কাগজটি http://arxiv.org/abs/1606.00930 এ পাওয়া যায় এটি প্রমাণিত হয় যে সম্পূর্ণ বিশ্লেষণের পরে আরএফ এবং এসভিএম প্রত্যাশিত ত্রুটির হারের ক্ষেত্রে প্রায় সমতুল্য এবং এসভিএম দ্রুততম (আমার অবাক হওয়ার জন্য)! আরএফ (গতির ভিত্তিতে) সুপারিশ করার ক্ষেত্রে আমি আর জোরদার নই।

সুতরাং আমার ব্যক্তিগত অভিজ্ঞতা হ'ল যদিও এসভিএম আপনাকে কিছুটা অতিরিক্ত নির্ভুলতা পেতে পারে তবে এটি একটি আরএফ ব্যবহার করা প্রায় সর্বদা একটি ভাল পছন্দ।

এছাড়াও বড় সমস্যাগুলির জন্য, ব্যাচের এসভিএম সলভার ব্যবহার করা অসম্ভব হতে পারে (আমি কখনই কোনও অনলাইন এসভিএম সলভার যেমন এলএএসভিএম বা অন্যদের ব্যবহার করি নি )।

অবশেষে আমি কেবল একটি পরিস্থিতিতে লজিস্টিক রিগ্রেশন ব্যবহার করেছি। আমি একটি চিত্র শ্রেণীবদ্ধের সমস্যাটিতে কিছু "তীব্র" বৈশিষ্ট্য ইঞ্জিনিয়ারিং করছিলাম (যেমন - চিত্রটির দুটি পৃথক বিবরণ এবং বর্ণনার মাত্রিকতা একত্রিত করুন বা না)। এবং আমি অনেক বিকল্পের মধ্যে নির্বাচন করতে লজিস্টিক রিগ্রেশন ব্যবহার করেছি (কারণ এলআর তে হাইপারপ্যারামিটার অনুসন্ধান নেই)। একবার আমরা সর্বোত্তম বৈশিষ্ট্যগুলিতে স্থির হয়ে গেলে (এলআর অনুসারে) আমরা চূড়ান্ত শ্রেণিবদ্ধের জন্য একটি আরএফ (সেরা হাইপারপ্যারামিটারগুলির জন্য নির্বাচন করা) ব্যবহার করি।

গ) জল্পনা

মাল্টিক্লাস সমস্যার ক্ষেত্রে আমি কখনই গুরুত্ব সহকারে কাজ করি নি, তবে আমার অনুভূতি হ'ল এসভিএম তাদের পক্ষে তেমন ভাল নয়। সমস্যাটি এক-বনাম-এক বা এক-বনাম-সমস্ত সমাধানের মধ্যে সমস্যা নয়, তবে যে সমস্ত বাস্তবায়ন আমি জানি, সেগুলি (ওভিও বা ওভিএ) শ্রেণিবদ্ধদের জন্য একই হাইপারপ্যারামিটার ব্যবহার করবে। এসভিএমের জন্য সঠিক হাইপারপ্যারামিটারগুলি নির্বাচন করা এতটাই ব্যয়বহুল যে আমি জানি যে শেল্ফ বাস্তবায়নগুলির কোনওটিই প্রতিটি শ্রেণিবদ্ধের জন্য অনুসন্ধান করবে না। আমি অনুমান করি যে এটি এসভিএমের জন্য সমস্যা (তবে আরএফের জন্য কোনও সমস্যা নয়)।

তারপরে আবার, মাল্টিক্লাস সমস্যার জন্য আমি সরাসরি আরএফতে যাব।


দুর্দান্ত উত্তর! যে কোনও সুযোগে আপনার দেলগাদো এট পরীক্ষার প্রতিলিপিতে কোনও ব্লগ পোস্ট, নোটবুক বা স্ক্রিপ্ট রয়েছে? (ট্যুইকিং প্যারামিটার, স্কেলিং ভেরিয়েবলগুলি সাধারণত একটি অ্যালগরিদমের পছন্দ হিসাবে গুরুত্বপূর্ণ, সুতরাং এটি ছাড়া অ্যালগরিদম শ্রেষ্ঠত্ব সম্পর্কে দৃ strong় দাবি করা কঠিন))
পিয়োটার মিগডাল

2-5,20,25,210,2152-15,2-10.5,2-6,2-1.5,230.5,1,2*পি

0

মন্তব্য লিখতে সক্ষম হওয়ার মতো পর্যাপ্ত অধিকার আমার নেই, সুতরাং আমি এখানে উত্তর হিসাবে আমার ইনপুট / পর্যবেক্ষণগুলি সরবরাহ করব।

আমার অভিজ্ঞতায়, বাইনারি ক্লাসগুলি ভারসাম্যহীন হলে সাপোর্ট ভেক্টর ক্লাসিফায়ার্স (এসভিসি) হয় সমান বা অন্য পদ্ধতিগুলি ছাড়িয়ে যায়। ভারসাম্যহীন ক্লাসের জন্য, এসভিসি খুব খারাপভাবে পারফর্ম করে।

আমি প্রায়শই মাল্টিক্লাস সমস্যার সাথে ডিল করি না, তবে মাল্টিক্লাস সমস্যার জন্য এসভিসির সাথে কিছু ভাল ফলাফলও দেখেছি।

আর একটি জিনিস আমি লক্ষ্য করেছি যে ডাইমেনশিয়ালটির অভিশাপ এসভিসিকে অন্যান্য মডেলিং কৌশলগুলির মতো ততটা প্রভাবিত করে না বলে মনে হয়। অন্য কথায়, আমি যেমন মডেলটিতে আরও পদ যুক্ত করেছি, অন্য কৌশলগুলি প্রশিক্ষণের সেটের তুলনায় পরীক্ষার (বা, হোল্ডআউট) সেটটিতে খারাপ অভিনয় করতে শুরু করে। তবে এসভিসি ব্যবহার করার সময় এতটা না। এই কারণে, যদি মডেল পার্সিমনিটি আপনার অগ্রাধিকার না হয়, তবে এসভিসি আরও ভাল বিকল্প হতে পারে কারণ আপনি অন্যান্য পদ্ধতির মতো ওভার-ফিটিং ছাড়াই প্রচুর পদে ফেলতে পারেন।

এসভিসির সাথে আমার যে সমস্যাগুলি রয়েছে তা হ'ল পর্যবেক্ষণের ক্রমটি অর্ডার করতে সক্ষম হওয়ার জন্য এটি স্পষ্টভাবে কোনও পরিমাপ (পূর্বাভাসযুক্ত সম্ভাবনার মতো) সরবরাহ করে না। আপনি প্ল্যাট স্কেলিং ব্যবহার করতে পারেন (পাইথনে sklearn.svm প্যাকেজে প্রয়োগ করা হয়েছে), তবে আমি কিছু অসঙ্গতি দেখেছি। (কারও আগ্রহী হলে আমি বিশদগুলি ভাগ করতে পারি))

এটি সত্যই আপনার প্রশ্নের উত্তর দেয় কিনা তা নিশ্চিত নই তবে এগুলি আমার পর্যবেক্ষণ। আশা করি এইটি কাজ করবে.


0

আরএফ এবং (আরবিএফ) এসভিএম এর পিছনে বিভিন্ন তত্ত্ব রয়েছে, তবে আপনার কাছে পর্যাপ্ত ডেটা রয়েছে বলে ধরে নিয়ে তারা একইভাবে ভাল সম্পাদন করে। তারা উভয়ই জটিল ফাংশন শিখতে পারে এবং শোরগোল এবং তথ্যহীন পরিবর্তনশীল এবং আউটলিয়ারদের সাথে দুর্দান্তভাবে ডিল করতে পারে।

আপনি যদি কোনও কাগল জাতীয় কিছুর জন্য সেরা ফলাফল পাওয়ার চেষ্টা করছেন তবে আপনি আরএফ এবং এসভিএম সহ একাধিক মডেল জড়ো করবেন।

নন ক্যাগল সেটিংসে আপনি বিবেচনা করতে পারেন মডেলটি বাস্তবায়ন করা, এটি উত্পাদন করতে, ভবিষ্যদ্বাণী করা, ব্যাখ্যা করা, এটি কোনও পরিচালককে ব্যাখ্যা করা ইত্যাদি কতটা শক্ত is

আপনার যদি অল্প পরিমাণে ডেটা থাকে বা আপনি মাত্রিকতার একটি কোর্স নিয়ে কাজ করে থাকেন তবে এসভিএম (লিনিয়ার বা অত্যন্ত নিয়ন্ত্রিত আরবিএফ) অবশ্যই পছন্দনীয় হবে। এর বেশ কয়েকটি কারণ রয়েছে, একটি হ'ল আপনার বৈশিষ্ট্যগুলিতে সিরিজ সেরা বিভাজনের পরিবর্তে সর্বাধিক মার্জিন হাইপারপ্লেনের সন্ধান করা ভাল, এছাড়াও সাধারণত একটি জটিল সীমানার প্রয়োজন হয় না কারণ উচ্চ মাত্রিক স্থানে কিছু হাইপারপ্লেন থাকে যা যাইহোক তথ্য পৃথক করতে পারেন। আর একটি বিষয় হ'ল আরএফ টিউন করা শক্ত (টিউন করার জন্য আরও পরামিতি রয়েছে), সুতরাং আপনার আরও ডেটা প্রয়োজন।

আরেকটি ধারণা, এসভিএম, বিশেষত LOOCV এর পক্ষে ক্রস বৈধকরণ খুব সস্তা এবং দ্রুত হতে পারে। যেহেতু কেবলমাত্র কয়েকটি নমুনা সাপোর্ট ভেক্টর (সর্বদা নয়) তাই আপনাকে প্রতিটি ভাঁজগুলিতে আপনার শ্রেণিবদ্ধকারীটিকে পুনরায় প্রশিক্ষণ করতে হবে না, তবে কেবল যখন পরীক্ষার সেটে থাকা ডেটাগুলি আগে সমর্থনকারী ভেক্টর ছিল। এটি অনলাইন শিখনকে আরও সহজ করে তুলতে পারে।

এছাড়াও, পূর্ণ গাছের চেয়ে সাপোর্ট ভেক্টরগুলি সঞ্চয় করা সস্তা হতে পারে।

শ্রেণিবদ্ধের তুলনায় প্রায়শই সম্ভাব্য মডেল তৈরি করা ভাল। সুতরাং, প্রথমে মডেল তৈরি করুন এবং পরে সিদ্ধান্ত নিন। সেক্ষেত্রে লজিস্টিক রিগ্রেশন পছন্দ করা হবে। এবং আপনি এটিকে নিজের পছন্দমতো আচরণ করার জন্য এখনও কার্নেলগুলি এবং নিয়মিতকরণ ব্যবহার করতে পারেন। এছাড়াও, আপনি এই জাতীয় প্রশ্নের উত্তর দিতে আরএফ ব্যবহার করবেন না: বয়স, জীবনযাপন, লিঙ্গ এবং শিক্ষার জন্য সংশোধন করা, অ্যালকোহল পান করা কি হার্ট অ্যাটাকের রঙিন হওয়ার সম্ভাবনা বাড়ায়?

কিছু অতিরিক্ত সংস্থান যা আমি আকর্ষণীয় পেয়েছি: https://www.quora.com/What-are-the- সুবিধাগুলি- থেকে- differences- শ্রেণিবদ্ধকরণ- আলগোরিদিম http://videolectures.net/solomot_caruana_wslmw/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.