এলোমেলো বন অ্যালগরিদম পদক্ষেপের পিছনে প্রেরণা


11

এলোমেলো বন গঠনের জন্য আমি যে পদ্ধতিটির সাথে পরিচিত সেগুলি নিম্নরূপ: ( http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm থেকে )

বনে একটি গাছ তৈরি করতে আমরা:

  1. আকার N এর একটি নমুনা বুটস্ট্র্যাপ করুন যেখানে N আমাদের প্রশিক্ষণের সেটের আকার। এই গাছের প্রশিক্ষণ সেট হিসাবে বুটস্ট্র্যাপযুক্ত নমুনাটি ব্যবহার করুন।
  2. গাছের প্রতিটি নোডে এলোমেলোভাবে আমাদের এম বৈশিষ্ট্যগুলির মি নির্বাচন করুন। বিভাজনের জন্য এই এম বৈশিষ্ট্যগুলির মধ্যে সেরাটি নির্বাচন করুন। (যেখানে এম আমাদের র্যান্ডম ফরেস্টের প্যারামিটার)
  3. প্রতিটি গাছ সবচেয়ে বড় পরিমাণে বাড়ান - অর্থাত্ ছাঁটাই করা হয় না।

যদিও এই অ্যালগরিদম একটি পদ্ধতিগত স্তরে উপলব্ধি করে এবং অবশ্যই ভাল ফলাফল দেয় তবে আমি 1, 2, এবং 3 পদক্ষেপের পিছনে তাত্ত্বিক অনুপ্রেরণা কী তা স্পষ্ট করতে পারছি না এবং কেউ কি ব্যাখ্যা করতে পারে যে এই প্রক্রিয়াটি নিয়ে কেউ কাউকে উত্সাহিত করেছিল এবং কেন এত ভাল কাজ করে?

উদাহরণস্বরূপ: কেন আমাদের পদক্ষেপ 1 করা দরকার? দেখে মনে হচ্ছে না যে আমরা তার স্বাভাবিক পরিবর্তনগুলি হ্রাস করার উদ্দেশ্যে বুটস্ট্র্যাপ করছি।

উত্তর:


9

এনসেম্বল পদ্ধতিগুলি (যেমন এলোমেলো বন) পৃথক বেস শ্রেণীবদ্ধকারীদের উপর উত্থিত ডেটাসেটগুলিতে পরিবর্তনের কিছু উপাদানের প্রয়োজন হয় (অন্যথায় এলোমেলো বনগুলি গাছের বনগুলিতে খুব সমান হয়)। যেমন সিদ্ধান্তের গাছগুলি প্রশিক্ষণের সেটে পর্যবেক্ষণগুলির জন্য অত্যন্ত সংবেদনশীল, ততক্ষণে পর্যবেক্ষণগুলির (বুটস্ট্র্যাপ ব্যবহার করে) বিভিন্নতা ছিল, আমি মনে করি, প্রয়োজনীয় বৈচিত্র্য পাওয়ার জন্য একটি প্রাকৃতিক পদ্ধতি। সুস্পষ্ট বিকল্পটি হ'ল ব্যবহৃত বৈশিষ্ট্যগুলি পরিবর্তিত করা, উদাহরণস্বরূপ প্রতিটি গাছকে মূল বৈশিষ্ট্যগুলির একটি উপসেটে প্রশিক্ষণ দিন। বুটস্ট্র্যাপের নমুনাগুলি ব্যবহার করা আমাদেরকে ব্যাগের বাইরে (ওওবি) ত্রুটির হার এবং পরিবর্তনশীল গুরুত্ব অনুমান করতে দেয়।

2 মূলত বনের মধ্যে এলোমেলোভাবে ইনজেকশনের আরেকটি উপায়। গাছগুলির মধ্যে পারস্পরিক সম্পর্ক হ্রাস করার ক্ষেত্রেও এটির প্রভাব রয়েছে (স্বল্প স্তরের মান ব্যবহার করে), বাণিজ্য বন্ধ হওয়ার ফলে (সম্ভাব্য) ভবিষ্যদ্বাণীক শক্তিটি আরও খারাপ হয়ে যায়। প্রচুর পরিমাণে কদমের ব্যবহারের ফলে গাছগুলি একে অপরের সাথে ক্রমশ একইরকম হয়ে উঠবে (এবং চূড়ান্তভাবে আপনি ব্যাগিংয়ের সাথে শেষ করুন)

আমি বিশ্বাস করি যে ছাঁটাই না করার কারণ এটি অন্য যে কোনও কিছুর চেয়ে প্রয়োজনীয় নয় to একটি একক সিদ্ধান্তের গাছের সাহায্যে আপনি সাধারণত ছাঁটাই করে ফেলবেন যেহেতু এটি অত্যধিক মানসিক চাপের পক্ষে অত্যন্ত সংবেদনশীল। তবে বুটস্ট্র্যাপের নমুনাগুলি ব্যবহার করে এবং অনেক গাছ বর্ধন করে এলোমেলোভাবে বনাঞ্চলগুলি এমন গাছগুলি বৃদ্ধি করতে পারে যা পৃথকভাবে শক্তিশালী, তবে একে অপরের সাথে বিশেষভাবে সম্পর্কযুক্ত নয়। মূলত, পৃথক গাছগুলি অত্যধিক উপযোগী তবে তাদের ত্রুটিগুলি বন সম্পর্কিত হয় না তবে যুক্তিসঙ্গতভাবে নির্ভুল হওয়া উচিত।

এটি ভালভাবে কাজ করার কারণটি কন্ডোসার্টের জুরি উপপাদ্যের (এবং উত্সাহ দেওয়ার মতো পদ্ধতির পিছনে যুক্তি হিসাবে) অনুরূপ। মূলত আপনার কাছে প্রচুর দুর্বল শিক্ষার্থী রয়েছে যা এলোমেলো অনুমানের চেয়ে সামান্যতর পারফর্ম করতে হবে। যদি এটি সত্য হয় তবে আপনি দুর্বল শিক্ষার্থীদের যুক্ত করতে পারবেন, এবং সীমাতে আপনি আপনার জমায়েত থেকে নিখুঁত ভবিষ্যদ্বাণী পাবেন। স্পষ্টতই এটি শিখনকারীদের পারস্পরিক সম্পর্কযুক্ত হওয়ার ত্রুটির কারণে সীমাবদ্ধ, যা নকলকারীদের কার্য সম্পাদনকে বাধা দেয়।


সুন্দর উত্তর, এবং কন্ডোরসেটের জুরির উপপাদ্যের সাথে সংযুক্তিটি অর্থবোধ করে। সাধারণত যদিও, এটি ভাল কাজ করার কারণটি জেনসেনের অসমতার কারণে!
জেকুইয়া
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.