আপনি যদি পুরো গাছটি বৃদ্ধি করেন তবে সেরা-প্রথম (পাতাযুক্ত) এবং গভীরতা প্রথম (স্তর-ভিত্তিক) একই গাছের ফলস্বরূপ। পার্থক্যটি ক্রমটি বাড়ানো হয়েছে এমন ক্রমে । যেহেতু আমরা সাধারণত গাছগুলি তাদের গভীরতাতে বাড়ায় না, আদেশের বিষয়টি: প্রাথমিক পর্যায়ে থামার মানদণ্ড এবং ছাঁটাইয়ের পদ্ধতি প্রয়োগের ফলে খুব ভিন্ন গাছের ফলস্বরূপ হতে পারে। যেহেতু পাতলাভ বিজ্ঞানীরা বিশ্বব্যাপী ক্ষতির জন্য তাদের অবদানের ভিত্তিতে বিভাজনগুলি বেছে নেয় এবং কেবল কোনও নির্দিষ্ট শাখার ক্ষতি নয়, এটি প্রায়শই (সর্বদা নয়) স্তর-ভিত্তিক নিম্ন-ত্রুটিযুক্ত গাছগুলি "দ্রুত" শিখবে। অর্থাত্ স্বল্প সংখ্যক নোডের জন্য, পাতাযুক্ত সম্ভবত স্তরের ভিত্তিতে সম্পাদন করবে। আপনি আরও নোড যুক্ত করার সাথে সাথে, বন্ধ না করে বা ছাঁটাই ছাড়াই তারা একই কার্য সম্পাদনে রূপান্তরিত হবে কারণ তারা আক্ষরিক অর্থে একই গাছ তৈরি করবে।
রেফারেন্স:
শি, এইচ। (2007) সেরা-প্রথম সিদ্ধান্ত ট্রি লার্নিং (থিসিস, বিজ্ঞান মাস্টার (এমএসসি))। নিউজিল্যান্ডের হ্যামিল্টন, ওয়াইকাটো বিশ্ববিদ্যালয়। Https://hdl.handle.net/10289/2317 থেকে প্রাপ্ত
সম্পাদনা: আপনার প্রথম প্রশ্ন সম্পর্কে, C4.5 এবং কার্ট উভয়ই গভীরতার-প্রথম উদাহরণ, সেরা-প্রথম নয়। উপরোক্ত রেফারেন্স থেকে এখানে কিছু প্রাসঙ্গিক সামগ্রী রয়েছে:
১.১.১ স্ট্যান্ডার্ড সিদ্ধান্ত গাছ
সিদ্ধান্ত গাছের টপ-ডাউন আনার জন্য স্ট্যান্ডার্ড অ্যালগরিদম যেমন সি 4.5 (কুইনলান, 1993) এবং কার্ট (ব্রেইমান এট।, 1984) বিভাজন এবং বিজয়ী কৌশল ব্যবহার করে প্রতিটি পদক্ষেপে গভীরতার প্রথম ক্রমে নোডগুলি প্রসারিত করে। সাধারণত, সিদ্ধান্ত গাছের প্রতিটি নোডে, পরীক্ষায় কেবল একটি একক বৈশিষ্ট্য জড়িত থাকে এবং বৈশিষ্ট্যটির মান একটি ধ্রুবকের সাথে তুলনা করা হয়। স্ট্যান্ডার্ড সিদ্ধান্ত গাছগুলির মূল ধারণাটি হ'ল, প্রথমে মূল নোডে স্থান দেওয়ার জন্য একটি বৈশিষ্ট্য নির্বাচন করুন এবং কিছু মানদণ্ডের (উদাহরণস্বরূপ তথ্য বা গিনি সূচক) এর উপর ভিত্তি করে এই বৈশিষ্ট্যের জন্য কিছু শাখা তৈরি করুন। তারপরে, প্রশিক্ষণের উদাহরণগুলি উপ-বিভাগগুলিতে বিভক্ত করুন, প্রতিটি শাখার জন্য একটি রুট নোড থেকে প্রসারিত। সাবটেটের সংখ্যা শাখার সংখ্যার সমান। তারপরে, এই পদক্ষেপটি একটি নির্বাচিত শাখার জন্য পুনরাবৃত্তি হয়, কেবলমাত্র সেই উদাহরণগুলি ব্যবহার করে যা এটিতে পৌঁছায়। একটি স্থির অর্ডার নোডগুলি প্রসারিত করতে ব্যবহৃত হয় (সাধারণত, বাম থেকে ডানে)। যদি কোনও সময়ে নোডের সমস্ত দৃষ্টান্তে একই শ্রেণীর লেবেল থাকে, যা খাঁটি নোড হিসাবে পরিচিত, বিভাজন বন্ধ হয়ে যায় এবং নোডটি একটি টার্মিনাল নোডে পরিণত হয়। সমস্ত নোড খাঁটি না হওয়া অবধি এই নির্মাণ প্রক্রিয়া অব্যাহত থাকে। তারপরে এটি অতিরিক্ত কমানোর জন্য ছাঁটাই প্রক্রিয়া অনুসরণ করে (বিভাগ 1.3 দেখুন)।
১.২.২ সেরা-প্রথম সিদ্ধান্তের গাছ
আরেকটি সম্ভাবনা, যা এখন পর্যন্ত কেবলমাত্র অ্যালগরিদম (ফ্রিডম্যান এট আল।, ২০০০) বৃদ্ধির প্রেক্ষাপটে মূল্যায়ন করা হয়েছে তা স্থির আদেশের পরিবর্তে সেরা-প্রথম ক্রমে নোডগুলি প্রসারিত করা। এই পদ্ধতিটি প্রতিটি পদক্ষেপে গাছটিতে "সেরা" স্প্লিট নোড যুক্ত করে। "সেরা" নোড হ'ল নোড যা বিভাজনের জন্য উপলব্ধ সমস্ত নোডের মধ্যে সর্বাধিকভাবে অশুচিতা হ্রাস করে (যেমন টার্মিনাল নোড হিসাবে চিহ্নিত করা হয় না)। যদিও এটি সম্পূর্ণরূপে উত্থিত গাছের জন্য স্ট্যান্ডার্ড গভীরতা-প্রথম প্রসারণ হিসাবে একই ফলস্বরূপ, এটি আমাদের নতুন গাছের ছাঁটাই পদ্ধতিতে তদন্ত করতে সক্ষম করে যা সম্প্রসারণের সংখ্যা নির্বাচন করতে ক্রস-বৈধতা ব্যবহার করে। প্রাক-ছাঁটাই এবং ছাঁটাই পরবর্তী উভয়ই এইভাবে সম্পাদন করা যেতে পারে, যা তাদের মধ্যে ন্যায্য তুলনা সক্ষম করে (বিভাগ 1.3 দেখুন)।
সেরা-প্রথম সিদ্ধান্তের গাছগুলি স্ট্যান্ডার্ড গভীরতা-প্রথম সিদ্ধান্ত গাছের মতো বিভাজন এবং বিজয়ী ফ্যাশনে নির্মিত হয়। সেরা-প্রথম গাছটি কীভাবে তৈরি করা যায় তার মূল ধারণাটি নীচে। প্রথমে রুট নোডে রাখার জন্য একটি অ্যাট্রিবিউট নির্বাচন করুন এবং কিছু মানদণ্ডের ভিত্তিতে এই অ্যাট্রিবিটির জন্য কয়েকটি শাখা তৈরি করুন। তারপরে, প্রশিক্ষণ ইনস্ট্যান্টগুলি উপ-বিভাগগুলিতে বিভক্ত করুন, প্রতিটি শাখার জন্য একটি রুট নোড থেকে প্রসারিত। এই থিসিসে কেবল বাইনারি সিদ্ধান্তের গাছগুলি বিবেচনা করা হয় এবং এইভাবে শাখার সংখ্যা হুবহু দুটি। তারপরে, এই পদক্ষেপটি একটি নির্বাচিত শাখার জন্য পুনরাবৃত্তি হয়, কেবলমাত্র সেই উদাহরণগুলি ব্যবহার করে যা এটিতে পৌঁছায়। প্রতিটি পদক্ষেপে আমরা বিস্তারের জন্য উপলভ্য সমস্ত সাবসেটগুলির মধ্যে "সেরা" উপসেটটি বেছে নিই। সমস্ত নোডগুলি খাঁটি না হওয়া বা নির্দিষ্ট সংখ্যক বিস্তৃতি পৌঁছানো অবধি এই নির্মাণ প্রক্রিয়াটি অব্যাহত থাকে। চিত্র 1. 1 অনুমানমূলক বাইনারি সেরা-প্রথম গাছ এবং একটি অনুমানিক বাইনারি গভীরতা-প্রথম গাছের মধ্যে বিভক্ত ক্রমের পার্থক্য দেখায়। নোট করুন যে অন্যান্য অর্ডারগুলি সেরা-প্রথম গাছের জন্য বেছে নেওয়া যেতে পারে যখন গভীরতা-প্রথম ক্ষেত্রে ক্রমটি সর্বদা একই থাকে।