এসভিএম ও তার বিপরীতে র্যান্ডম ফরেস্ট কখন ব্যবহার করবেন?


28

যখন ব্যবহার করেন Random Forestবেশি SVMবিপরীতভাবে এবং ভাইস?

আমি বুঝতে পারি যে cross-validationএবং মডেল তুলনা একটি মডেল চয়ন করার একটি গুরুত্বপূর্ণ দিক, তবে এখানে আমি দুটি পদ্ধতির থাম্ব এবং হিউরিস্টিক সম্পর্কিত নিয়ম সম্পর্কে আরও জানতে চাই to

শ্রেণিবদ্ধের সূক্ষ্মতা, শক্তি এবং দুর্বলতাগুলির পাশাপাশি সমস্যাগুলির, যা তাদের প্রত্যেকের জন্য সবচেয়ে উপযুক্ত, দয়া করে কেউ ব্যাখ্যা করতে পারেন?


1
যথার্থতা স্কোরটি তাদের আপেক্ষিক পারফরম্যান্সের একমাত্র সত্য পরিমাপ, যদিও সেখানে পূর্বের শিল্প থাকতে পারে যা নির্দেশ করে যে প্রচুর পরিমাণে শ্রেণিবদ্ধকারী আপনার ধরণের ডেটাতে আরও ভাল হতে পারে data আপনার প্যারামিটারগুলি সুর করতে কতক্ষণ সময় লাগে তার দ্বারা আপনি আরও সংকীর্ণ হতে পারেন, এ ক্ষেত্রে র্যান্ডম ফরেস্ট সম্ভবত দুজনের সহজ প্রস্তাব প্রমাণ করবে।
ইমেজ_ডোক্টর

উত্তর:


29

আমি বলব, পছন্দটি আপনার কাছে কী ডেটা আছে এবং আপনার উদ্দেশ্য কী তা নির্ভর করে depends কয়েকটি "থাম্বের নিয়ম"।

র্যান্ডম ফরেস্ট অভ্যন্তরীণভাবে মাল্টিক্লাস সমস্যার জন্য উপযুক্ত, এসভিএম অভ্যন্তরীণভাবে দ্বি-শ্রেণীর। মাল্টিক্লাস সমস্যার জন্য আপনার এটি একাধিক বাইনারি শ্রেণিবদ্ধকরণ সমস্যায় কমাতে হবে।

র‌্যান্ডম ফরেস্ট সংখ্যাসূচক এবং শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির মিশ্রণ সহ ভাল কাজ করে। বৈশিষ্ট্যগুলি যখন বিভিন্ন স্কেলের হয় তখন এটিও ঠিক। মোটামুটিভাবে বলতে গেলে, র্যান্ডম ফরেস্টের সাথে আপনি ডেটা যেমন ব্যবহার করতে পারেন তেমন ব্যবহার করতে পারেন। এসভিএম "মার্জিন" সর্বাধিক করে তোলে এবং এইভাবে বিভিন্ন পয়েন্টগুলির মধ্যে "দূরত্ব" ধারণার উপর নির্ভর করে। "দূরত্ব" অর্থবহ কিনা তা সিদ্ধান্ত নেওয়া আপনার পক্ষে। ফলস্বরূপ, বিভাগীয় বৈশিষ্ট্যগুলির জন্য এক-গরম এনকোডিংটি অবশ্যই করা উচিত। তদ্ব্যতীত, প্রিপ্রোসেসিং পদক্ষেপে সর্বনিম্ন সর্বোচ্চ বা অন্যান্য স্কেলিংয়ের সুপারিশ করা হয়।

nmn×nn2

শ্রেণিবদ্ধকরণ সমস্যার জন্য র্যান্ডম ফরেস্ট আপনাকে শ্রেণীর অন্তর্ভুক্ত হওয়ার সম্ভাবনা দেয়। এসভিএম আপনাকে সীমানায় দূরত্ব দেয়, আপনার যদি সম্ভাবনার প্রয়োজন হয় তবে আপনাকে এটিকে কোনও কোনও ক্ষেত্রে রূপান্তর করতে হবে।

এই সমস্যাগুলির জন্য, যেখানে এসভিএম প্রয়োগ করে, এটি সাধারণত র্যান্ডম ফরেস্টের চেয়ে ভাল সম্পাদন করে।

এসভিএম আপনাকে "সাপোর্ট ভেক্টর" দেয়, এটি ক্লাসের মধ্যে সীমানার সবচেয়ে কাছের প্রতিটি ক্লাসের পয়েন্ট। তারা ব্যাখ্যার জন্য নিজেরাই আগ্রহী হতে পারে।


কেবল যোগ করার জন্য: র্যান্ডম অরণ্যের পক্ষে আপনার সম্ভাবনা দেওয়া সোজা নয়। আপনার যদি হয় সিদ্ধান্ত গাছের সম্ভাব্য বাস্তবায়ন প্রয়োজন হয় বা আপনি যদি 'সত্য' সম্ভাবনা চান তবে পরে আপনার লাগানো র্যান্ডম ফরেস্ট মডেলটি ক্রমাঙ্কিত করুন।
আর্চি

5

এসভিএম মডেলগুলি সাধারণভাবে গাছের তুলনায় স্পার্স ডেটাতে আরও ভাল পারফর্ম করে। উদাহরণস্বরূপ নথির শ্রেণিবদ্ধকরণে আপনার হাজার হাজার, এমনকি কয়েক হাজার বৈশিষ্ট্য থাকতে পারে এবং যে কোনও নথির ভ্যাক্টারে কেবলমাত্র এই বৈশিষ্ট্যগুলির একটি ছোট ভগ্নাংশের শূন্যের চেয়ে বেশি মান থাকতে পারে। তাদের মধ্যে সম্ভবত অন্যান্য পার্থক্য রয়েছে, তবে এটি আমার সমস্যাগুলির জন্য খুঁজে পেয়েছি।


3

এটি সত্যিকার অর্থে নির্ভর করে আপনি কী অর্জন করতে চান, আপনার ডেটা দেখতে কেমন হবে এবং ইত্যাদি S এছাড়াও, এসভিএম কম ব্যাখ্যামূলক - উদাহরণস্বরূপ যদি আপনি ব্যাখ্যা করতে চান তবে কেন শ্রেণিবিন্যাসটি এর মতো ছিল - এটি অ-তুচ্ছ হবে। সিদ্ধান্ত গাছগুলির আরও ভাল ব্যাখ্যাযোগ্যতা থাকে, তারা দ্রুত কাজ করে এবং আপনার যদি স্পষ্টিকর / সংখ্যাগত ভেরিয়েবলগুলি এর সূক্ষ্ম হয়, তদুপরি: অ-রৈখিক নির্ভরতা ভালভাবে পরিচালনা করা হয় (এন যথেষ্ট পরিমাণ এন দেওয়া হয়েছে)। এছাড়াও তারা সাধারণভাবে এসভিএম এর চেয়ে দ্রুত প্রশিক্ষণ দেয় তবে তাদের অত্যধিক মানসিকতার প্রবণতা রয়েছে ...

আমি লজিস্টিক রিগ্রেশনও চেষ্টা করব - দুর্দান্ত ব্যাখ্যাযোগ্য শ্রেণিবদ্ধ)

সংক্ষিপ্তসার হিসাবে - থাম্বের বিধিটি হ'ল যে কোনও কিছু চেষ্টা করে তুলনা করে যা আপনাকে সেরা ফলাফল / ব্যাখ্যা দেয়।


1

ইতিমধ্যে বর্ণিত ভাল পয়েন্টগুলি পরিপূরক করতে:

থেকে আমরা কি রিয়াল পৃথিবী ক্লাসিফিকেশন সমস্যার সমাধানের ক্লাসিফায়ার শত শত প্রয়োজন? এলোমেলো বনগুলি এলোমেলো বনগুলির চেয়ে ভাল পারফরম্যান্স অর্জনের সম্ভাবনা বেশি।

এছাড়াও, যেভাবে অ্যালগরিদমগুলি প্রয়োগ করা হয় (এবং তাত্ত্বিক কারণে) এলোমেলো বন সাধারণত (অ লিনিয়ার) এসভিএমগুলির চেয়ে অনেক দ্রুত হয়। প্রকৃতপক্ষে @ আইয়েনোক হিসাবে, এসভিএমগুলি 10 000 ডেটা পয়েন্টের বাইরে অকেজো হতে পারে।

যাইহোক, এসভিএমগুলি নির্দিষ্ট কিছু ডেটাসেটগুলিতে (চিত্রগুলি, মাইক্রোয়ারে ডেটা ...) আরও ভাল সঞ্চালনের জন্য পরিচিত।

সুতরাং, আবারও, কোন পদ্ধতিটি সর্বোত্তমভাবে সম্পাদন করে তা জানার পক্ষে ক্রস যাচাইকরণটি অবশ্যই সর্বোত্তম উপায়।

উত্স: এলোমেলো বন বনাম এসভিএম


উম? "এলোমেলো বনগুলি এলোমেলো বনগুলির চেয়ে ভাল পারফরম্যান্স অর্জনের সম্ভাবনা বেশি।"
সঞ্জয় মনোহর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.