কীভাবে সিদ্ধান্ত নিখরচায় শিক্ষাগুলি অ্যালগরিদমগুলি অনুপস্থিত মানগুলির সাথে মোকাবিলা করে (হুডের নীচে)


21

গাছগুলি শেখার অ্যালগরিদমগুলি কীভাবে অনুপস্থিত মানগুলির সাথে মোকাবিলা করতে ব্যবহার করে সেগুলি কী কী?

তারা কি অনুপস্থিত নামক কোনও মান ব্যবহার করে স্লটটি কেবল পূর্ণ করে তোলে?

ধন্যবাদ।

উত্তর:


24

বিভিন্ন সিদ্ধান্ত গাছ ব্যবহার করে বিভিন্ন পদ্ধতি রয়েছে। কেবল অনুপস্থিত মানগুলি উপেক্ষা করুন (যেমন আইডি 3 এবং অন্যান্য পুরাতন অ্যালগরিদমগুলি করেন) বা অনুপস্থিত মানগুলিকে অন্য বিভাগ হিসাবে বিবেচনা করা (নামমাত্র বৈশিষ্ট্যের ক্ষেত্রে) অনুপস্থিত মানগুলি হ্যান্ডলিংয়ের পক্ষে নয়। তবে এই পদ্ধতির সিদ্ধান্ত গাছ বিকাশের প্রাথমিক পর্যায়ে ব্যবহৃত হয়েছিল।

অনুপস্থিত ডেটাতে আসল হ্যান্ডলিং পন্থাগুলি কোনও বিভাজনের মূল্যায়নে নিখোঁজ মানগুলির সাথে ডেটা পয়েন্ট ব্যবহার করে না। যাইহোক, যখন শিশু নোডগুলি তৈরি এবং প্রশিক্ষিত হয়, তখন সেই দৃষ্টান্তগুলি কোনওভাবে বিতরণ করা হয়।

আমি শিশু নোডগুলিতে অনুপস্থিত মান উদাহরণগুলি বিতরণ করার জন্য নিম্নলিখিত পদ্ধতিগুলি সম্পর্কে জানি:

  • সমস্ত নোডে যায় যা ইতিমধ্যে সর্বাধিক সংখ্যক উদাহরণ রয়েছে (কার্ট, প্রাথমিক নিয়ম নয়)
  • সমস্ত শিশুদের মধ্যে বিতরণ করুন, কিন্তু হ্রাসযুক্ত ওজন সহ, প্রতিটি শিশু নোডের উদাহরণের সংখ্যার সাথে আনুপাতিক (সি 45 এবং অন্যান্য)
  • কেবলমাত্র একটি একক শিশু নোডে এলোমেলো বিতরণ করুন, শেষ পর্যন্ত একটি বিস্তৃত বিতরণ অনুযায়ী (আমি দেখেছি যে দ্রুত চলমান সময়ের জন্য C45 এবং কার্টের বিভিন্ন বাস্তবায়নে)
  • চাইল্ড নোডে উদাহরণগুলি বিতরণ করতে সার্গেটগুলি তৈরি করুন, বাছাই করুন এবং ব্যবহার করুন, যেখানে সারোগেটগুলি ইনপুট বৈশিষ্ট্যগুলির সাথে সাদৃশ্যপূর্ণ যা পরীক্ষার বৈশিষ্ট্যটি কীভাবে বাম বা ডান চাইল্ড নোডে ডেটা ইনস্ট্যান্স প্রেরণ করে (কার্ট, যদি এটি ব্যর্থ হয় তবে সংখ্যাগরিষ্ঠ নিয়ম ব্যবহৃত হয়)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.