কেন আমাদের এক্সজিবিস্ট এবং র্যান্ডম ফরেস্টের প্রয়োজন?


25

আমি কয়েকটি ধারণা সম্পর্কে পরিষ্কার ছিল না:

  1. এক্সজিবিস্ট দুর্বল শিক্ষার্থীদের শক্তিশালী শিক্ষায় রূপান্তর করে। এটি করার সুবিধা কী? কেবল একটি গাছ ব্যবহারের পরিবর্তে অনেক দুর্বল শিক্ষার্থীদের সংমিশ্রণ?

  2. র্যান্ডম ফরেস্ট গাছ তৈরির জন্য গাছ থেকে বিভিন্ন নমুনা ব্যবহার করে। কেবলমাত্র একক গাছ ব্যবহারের পরিবর্তে এই পদ্ধতির সুবিধা কী?

উত্তর:


35

আপনার দ্বিতীয় প্রশ্ন দিয়ে শুরু করা সহজ এবং তারপরে প্রথমটিতে যান।

থলির কাপড়

র্যান্ডম ফরেস্ট একটি ব্যাগিং অ্যালগরিদম। এটি বৈকল্পিকতা হ্রাস করে।

বলুন যে আপনার কাছে সিদ্ধান্তহীন গাছের মতো খুব অবিশ্বাস্য মডেল রয়েছে। (কেন অবিশ্বস্ত? কেননা আপনি যদি আপনার ডেটাটি খানিকটা পরিবর্তন করেন তবে তৈরি করা সিদ্ধান্তের গাছটি খুব আলাদা হতে পারে) এমন ক্ষেত্রে, আপনি ব্যাগিংয়ের মাধ্যমে একটি দৃ model় মডেল (বৈকল্পিকতা হ্রাস) তৈরি করতে পারেন - ব্যাগিং যখন আপনি বিভিন্ন মডেল তৈরি করেন তখনই হয় ফলাফলটিকে আরও শক্তিশালী করতে আপনার ডেটা পুনরায় মডেল করে।

র্যান্ডম ফরেস্ট যা আমরা ব্যাগিংকে ডাকে সিদ্ধান্ত গাছগুলিতে প্রয়োগ করি, তবে এটি অন্য ব্যাগিং অ্যালগরিদমের চেয়ে আলাদা নয়।

তুমি কেন এটা করতে চাও? এটি সমস্যার উপর নির্ভর করে। তবে সাধারণত, এটি মডেলটি স্থিতিশীল হওয়ার জন্য অত্যন্ত আকাঙ্ক্ষিত।

boosting

বুস্টিং বৈকল্পিকতা হ্রাস করে, এবং পক্ষপাতও হ্রাস করে। এটি বৈকল্পিকতা হ্রাস করে কারণ আপনি একাধিক মডেল (ব্যাগিং) ব্যবহার করছেন। এটি পূর্ববর্তী মডেলগুলি কী কী ত্রুটি করেছে (উত্সাহিত অংশ) তা জানিয়ে পরবর্তী মডেলকে প্রশিক্ষণ দিয়ে পক্ষপাত হ্রাস করে।

দুটি প্রধান অ্যালগোরিদম রয়েছে:

  • অ্যাডাবোস্ট: এটিই মূল অ্যালগরিদম; আপনি পরবর্তী মডেলগুলিকে আগের মডেলগুলির দ্বারা ভুলভাবে আরও বেশি পর্যবেক্ষণের শাস্তি দিতে বলুন
  • গ্রেডিয়েন্ট বুস্টিং: আপনি অবশিষ্টগুলি ব্যবহার করে পরবর্তী প্রতিটি মডেলকে প্রশিক্ষণ দিন (পূর্বাভাস এবং সত্য মানের মধ্যে পার্থক্য)

এই নকশাগুলিতে আপনার বেস লার্নার দুর্বল হতে হবে । যদি এটি ডেটাটিকে অত্যধিক করে তোলে তবে পরবর্তী মডেলগুলি তৈরি করার জন্য কোনও অবশিষ্ট বা ত্রুটি থাকবে না। কেন এই ভাল মডেল? ঠিক আছে, কাগলের মতো ওয়েবসাইটে বেশিরভাগ প্রতিযোগিতা গ্রেডিয়েন্ট বুস্টিং ট্রি ব্যবহার করে জিতেছে। ডেটা সায়েন্স একটি অভিজ্ঞতামূলক বিজ্ঞান, "কারণ এটি কাজ করে" যথেষ্ট ভাল। যাইহোক, লক্ষ্য করুন যে উত্সাহদানকারী মডেলগুলি অত্যধিক উপযোগী হতে পারে (যদিও এটি বৌদ্ধিকভাবে এটি খুব সাধারণ নয়)।

বিশেষত গ্রেডিয়েন্ট বুস্ট করার আরেকটি কারণও বেশ দুর্দান্ত: কারণ ডেরাইভেটিভ উত্তল নয় এমনকি যখন এটি বিভিন্ন ক্ষতির ফাংশনগুলি ব্যবহার করা খুব সহজ করে তোলে। উদাহরণস্বরূপ, সম্ভাব্য পূর্বাভাস ব্যবহার করার সময়, আপনি পিনবল ফাংশন হিসাবে আপনার ক্ষতি ফাংশন হিসাবে স্টাফ ব্যবহার করতে পারেন ; নিউরাল নেটওয়ার্কগুলির সাথে এমন কিছু শক্ত যা (ডেরাইভেটিভ সর্বদা ধ্রুবক থাকে)।

[আকর্ষণীয় historicalতিহাসিক দ্রষ্টব্য: বুস্টিং মূলত একটি তাত্ত্বিক উদ্ভাবন ছিল এই প্রশ্নের দ্বারা অনুপ্রাণিত হয়েছিল "" আমরা কি দুর্বল মডেলগুলি ব্যবহার করে আরও শক্তিশালী মডেল তৈরি করতে পারি "]]


বিজ্ঞপ্তি: লোকেরা কখনও কখনও এলোমেলো বন এবং ধীরে ধীরে বৃদ্ধিকারী গাছগুলিকে বিভ্রান্ত করে, কারণ উভয়ই সিদ্ধান্ত গাছ ব্যবহার করে তবে তারা দুটি খুব আলাদা আলাদা আলাদা পরিবার se


1
বুস্টিং পুনরাবৃত্তভাবে একটি ভারী গড় গ্রহণ করে অবশিষ্টাংশ এবং বৈকল্পিক মডেলিংয়ের মাধ্যমে পক্ষপাত হ্রাস করে; cf. § 5.5 বায়াস, ভেরিয়েন্স এবং স্থিতিশীলতা , পৃষ্ঠা 118, বুস্টিং: ফাউন্ডেশনস এবং অ্যালগরিদমস , রবার্ট ই। শাপ্পায়ার, ইওভা ফ্রেন্ড।
এমরে

এমরে, আপনি অবশ্যই সঠিক কেউ আমার পোস্ট সম্পাদনা করেছেন এবং বৃদ্ধি দ্বারা হ্রাস পরিবর্তন করেছেন । আমি এটি আবার ঘুরিয়েছি।
রিকার্ডো ক্রুজ

8

আপনি যখন একটি গাছ বানাবেন, আপনাকে নোভা বিভক্ত করার জন্য কিছু মানদণ্ড নির্ধারণ করতে হবে। এর মধ্যে ইনফরমেশন গেইন এবং গিনি ইনডেক্সের মতো মেট্রিক রয়েছে। এগুলি তাত্ত্বিক দৃষ্টিভঙ্গি, সর্বোত্তম সম্ভাব্য বিভাজন দেওয়ার গ্যারান্টি নেই ।

আসলে ওজন কিছু বৈশিষ্ট্য কম প্রাসঙ্গিক এবং / বা আরও গোলমাল, এবং অনেক অন্যান্য সমস্যা যা বাস্তব তথ্যতে ঘটে। সংক্ষেপে, আপনি একটি শালীন গণনার সময় একটি নিখুঁত গাছ তৈরি করতে পারবেন না (আপনি অবশ্যই সমস্ত সম্ভাব্য গাছ তৈরি করতে পারেন এবং সেরাটি পরীক্ষা করতে পারেন, তবে তারপরে আপনাকে মাঝারি আকারের ডেটাসেটে প্রশিক্ষণের জন্য কয়েক বছর অপেক্ষা করতে হবে)।

যেহেতু আমাদের সেরা গাছ থাকতে পারে না , তাই আমাদের প্রায় অনুমান হয়। একটি আনুমানিক পরিমাণ হ'ল অনেক গাছ তৈরি করা (বিভিন্ন ডেটা পার্টিশন বা অ্যাট্রিবিউট পার্টিশন ব্যবহার করে), যেহেতু আমরা বেশিরভাগ গাছ কিছুটা সঠিক হওয়ার প্রত্যাশা করি এবং ভোটদান ব্যবস্থায় তাদের শ্রেণিবিন্যাস বিবেচনা করি; এটি বেশিরভাগ শব্দের সাথে মোকাবেলা করা উচিত, উল্লম্ব পার্টিশন অপ্রাসঙ্গিক বৈশিষ্ট্যগুলির সাথে মোকাবিলা করতে পারে, .শ্বরিকের কম গুরুত্ব আছে, এবং অন্যান্য সুবিধাও রয়েছে।


1

আমি ভাল উত্তর একটি সামান্য সংযোজন হবে। মূল সমস্যাটি হ'ল ফিট। আপনার একাধিক প্যারামিটার হওয়ার সাথে সাথে অ-রৈখিক ফাংশন যুক্ত করার সাথে সাথে সমস্ত অ্যালগরিদম অতিরিক্ত মানিয়ে নেওয়া শুরু করে। তারা ডেটাতে এমন কিছু দেখতে পায় যা বিদ্যমান নেই। যখন অন্ধকার হয় বা কুয়াশা প্রবল হয় তখন অন্ধকার / কুয়াশায় এমন কিছু জিনিস থাকে যা অস্তিত্বহীন থাকে। প্রায় সমস্ত গণনামূলক অ্যালগরিদম মানুষের চেয়ে বেশি মানানসই কাজ করে। এমনকি ভেরিয়েবলগুলি খুব বেশি সংযুক্ত হলে লিনিয়ার রিগ্রেশনগুলি অদ্ভুত সহগগুলি দেখাতে শুরু করে। যদি খুব বেশি ফিট না হয় তবে সাধারণ সিদ্ধান্ত গাছগুলি, যার উপর ভিত্তি করে সেই অ্যালগোরিদমগুলি র্যান্ডম ফরেস্ট বা এক্সজিবিস্টের চেয়ে ভাল been

এবং কেন অত্যধিক ফিটনেস ঘটে এবং কেন কিছু অ্যালগরিদম অন্যদের চেয়ে ভাল no তত্ত্বের মধ্যে এআরআইএমএ মডেলগুলি খুব দৃ sound়, তবে অনুশীলন দেখায় যে এক্সফোনেনশিয়াল স্মুথিং কৌশলগুলি ব্যবহার করা আরও ভাল এবং এআরআইএমএ এমনকি আরিমা অনুসারে আচরণ করা পরিবর্তনগুলিও পৃথক করতে পারে না তবে বিভিন্ন পরামিতিগুলির সাথে থাকে।

কিছু নিউরাল নেটওয়ার্ক এবং বিশেষত কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলিতে খুব কম মানানসই বলে মনে হয়। একই সাথে পুরো সংযুক্ত নিউরাল নেটওয়ার্কগুলির মূল ধারণাটি অত্যধিক মানানসই কারণে উচ্চ সংখ্যক নিউরনের সাথে ব্যর্থ হয়।

অতিরিক্ত লড়াইয়ের মূল সম্ভাবনাগুলি হ'ল:

  1. এলোমেলো নমুনা
  2. একাধিক মডেল জুড়ে গড়
  3. মডেলটি এলোমেলোভাবে করা (নিউরনগুলির স্নায়ুবহুল নেটওয়ার্ক প্রশিক্ষণের সময় এলোমেলোভাবে বাদ দেওয়া)

যদি আমি অ্যালগরিদমগুলি সঠিকভাবে বুঝতে পারি তবে র্যান্ডম ফরেস্ট এবং এক্সজিবিস্ট উভয়ই একাধিক মডেল জুড়ে এলোমেলো নমুনা এবং গড় করে এবং এইভাবে ওভারফিটিং হ্রাস করতে পরিচালনা করে।

ইমেজনেট চিত্র স্বীকৃতি প্রতিযোগিতায় ২০১ 2016 সালের সেরা মডেল (শাও এট আল) বেশ কয়েকটি সত্যই ভাল মডেলের সংমিশ্রণ ছিল। তাদের মধ্যে কেউ কেউ আগের বছরগুলিতে প্রতিযোগিতা জিতেছে। এই মডেলটির উপর ভিত্তি করে থাকা যে কোনও মডেলের চেয়ে 20% কম ত্রুটি ছিল। এভাবেই একাধিক মডেল জুড়ে গড়ে ওঠা ওভারফিটের সাথে লড়াইয়ে শক্তিশালী হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.