আপনার দ্বিতীয় প্রশ্ন দিয়ে শুরু করা সহজ এবং তারপরে প্রথমটিতে যান।
থলির কাপড়
র্যান্ডম ফরেস্ট একটি ব্যাগিং অ্যালগরিদম। এটি বৈকল্পিকতা হ্রাস করে।
বলুন যে আপনার কাছে সিদ্ধান্তহীন গাছের মতো খুব অবিশ্বাস্য মডেল রয়েছে। (কেন অবিশ্বস্ত? কেননা আপনি যদি আপনার ডেটাটি খানিকটা পরিবর্তন করেন তবে তৈরি করা সিদ্ধান্তের গাছটি খুব আলাদা হতে পারে) এমন ক্ষেত্রে, আপনি ব্যাগিংয়ের মাধ্যমে একটি দৃ model় মডেল (বৈকল্পিকতা হ্রাস) তৈরি করতে পারেন - ব্যাগিং যখন আপনি বিভিন্ন মডেল তৈরি করেন তখনই হয় ফলাফলটিকে আরও শক্তিশালী করতে আপনার ডেটা পুনরায় মডেল করে।
র্যান্ডম ফরেস্ট যা আমরা ব্যাগিংকে ডাকে সিদ্ধান্ত গাছগুলিতে প্রয়োগ করি, তবে এটি অন্য ব্যাগিং অ্যালগরিদমের চেয়ে আলাদা নয়।
তুমি কেন এটা করতে চাও? এটি সমস্যার উপর নির্ভর করে। তবে সাধারণত, এটি মডেলটি স্থিতিশীল হওয়ার জন্য অত্যন্ত আকাঙ্ক্ষিত।
boosting
বুস্টিং বৈকল্পিকতা হ্রাস করে, এবং পক্ষপাতও হ্রাস করে। এটি বৈকল্পিকতা হ্রাস করে কারণ আপনি একাধিক মডেল (ব্যাগিং) ব্যবহার করছেন। এটি পূর্ববর্তী মডেলগুলি কী কী ত্রুটি করেছে (উত্সাহিত অংশ) তা জানিয়ে পরবর্তী মডেলকে প্রশিক্ষণ দিয়ে পক্ষপাত হ্রাস করে।
দুটি প্রধান অ্যালগোরিদম রয়েছে:
- অ্যাডাবোস্ট: এটিই মূল অ্যালগরিদম; আপনি পরবর্তী মডেলগুলিকে আগের মডেলগুলির দ্বারা ভুলভাবে আরও বেশি পর্যবেক্ষণের শাস্তি দিতে বলুন
- গ্রেডিয়েন্ট বুস্টিং: আপনি অবশিষ্টগুলি ব্যবহার করে পরবর্তী প্রতিটি মডেলকে প্রশিক্ষণ দিন (পূর্বাভাস এবং সত্য মানের মধ্যে পার্থক্য)
এই নকশাগুলিতে আপনার বেস লার্নার দুর্বল হতে হবে । যদি এটি ডেটাটিকে অত্যধিক করে তোলে তবে পরবর্তী মডেলগুলি তৈরি করার জন্য কোনও অবশিষ্ট বা ত্রুটি থাকবে না। কেন এই ভাল মডেল? ঠিক আছে, কাগলের মতো ওয়েবসাইটে বেশিরভাগ প্রতিযোগিতা গ্রেডিয়েন্ট বুস্টিং ট্রি ব্যবহার করে জিতেছে। ডেটা সায়েন্স একটি অভিজ্ঞতামূলক বিজ্ঞান, "কারণ এটি কাজ করে" যথেষ্ট ভাল। যাইহোক, লক্ষ্য করুন যে উত্সাহদানকারী মডেলগুলি অত্যধিক উপযোগী হতে পারে (যদিও এটি বৌদ্ধিকভাবে এটি খুব সাধারণ নয়)।
বিশেষত গ্রেডিয়েন্ট বুস্ট করার আরেকটি কারণও বেশ দুর্দান্ত: কারণ ডেরাইভেটিভ উত্তল নয় এমনকি যখন এটি বিভিন্ন ক্ষতির ফাংশনগুলি ব্যবহার করা খুব সহজ করে তোলে। উদাহরণস্বরূপ, সম্ভাব্য পূর্বাভাস ব্যবহার করার সময়, আপনি পিনবল ফাংশন হিসাবে আপনার ক্ষতি ফাংশন হিসাবে স্টাফ ব্যবহার করতে পারেন ; নিউরাল নেটওয়ার্কগুলির সাথে এমন কিছু শক্ত যা (ডেরাইভেটিভ সর্বদা ধ্রুবক থাকে)।
[আকর্ষণীয় historicalতিহাসিক দ্রষ্টব্য: বুস্টিং মূলত একটি তাত্ত্বিক উদ্ভাবন ছিল এই প্রশ্নের দ্বারা অনুপ্রাণিত হয়েছিল "" আমরা কি দুর্বল মডেলগুলি ব্যবহার করে আরও শক্তিশালী মডেল তৈরি করতে পারি "]]
বিজ্ঞপ্তি: লোকেরা কখনও কখনও এলোমেলো বন এবং ধীরে ধীরে বৃদ্ধিকারী গাছগুলিকে বিভ্রান্ত করে, কারণ উভয়ই সিদ্ধান্ত গাছ ব্যবহার করে তবে তারা দুটি খুব আলাদা আলাদা আলাদা পরিবার se