সিদ্ধান্ত গাছ: পাতা-ভিত্তিক (সেরা-প্রথম) এবং স্তর-ভিত্তিক গাছের ট্রাসস


14

সংখ্যা 1:

লাইটজিবিএমের বর্ণনাটি যেভাবে গাছটি প্রসারিত করা হয়েছে সে সম্পর্কে আমি বিভ্রান্ত হয়ে পড়েছি

তারা বলে:

বেশিরভাগ সিদ্ধান্ত গাছ শেখার অ্যালগরিদমগুলি নীচের চিত্রের মতো স্তর (গভীরতা) অনুসারে গাছ বৃদ্ধি করে:

এখানে চিত্র বর্ণনা লিখুন

প্রশ্ন 1 : কোন "সর্বাধিক" অ্যালগরিদমগুলি এভাবে প্রয়োগ করা হয়? যতদূর আমি জানি সি 4.5 এবং কার্ট ডিএফএস ব্যবহার করে। এক্সজিবিস্ট বিএসএফ ব্যবহার করে। কোন অন্যান্য অ্যালগরিদম বা প্যাকেজগুলি সিদ্ধান্ত গাছের জন্য বিএফএস ব্যবহার করে?

সংখ্যা 2:

লাইটজিবিএম জানিয়েছে:

লাইটজিবিএম পাতা-ভিত্তিতে গাছ বর্ধন করে (সেরা-প্রথম) t এটি পাতাগুলি সর্বাধিক ব-দ্বীপের ক্ষতি সহ চয়ন করবে grow একই পাতায় বৃদ্ধি পেলে, পাতা-ভিত্তিক অ্যালগরিদম স্তর-ভিত্তিক অ্যালগরিদমের তুলনায় বেশি ক্ষতি হ্রাস করতে পারে।

এখানে চিত্র বর্ণনা লিখুন

প্রশ্ন 2 : স্তর-ভিত্তিক বৃদ্ধি গাছগুলির সমস্ত পাতার জন্য সমান গভীরতা থাকবে তা কি সঠিক?

প্রশ্ন 3: যদি প্রশ্ন 2 সঠিক না হয়, তবে স্তর-ভিত্তিক এবং পাতাগুলি বৃদ্ধির গাছগুলি ট্র্যাভারসালের শেষে (ছাঁটাই ছাড়াই) শেষ দেখাবে। এটা কি সঠিক বক্তব্য?

প্রশ্ন 4: 3 প্রশ্নটি যদি সঠিক হয় তবে কীভাবে "পাতাযুক্ত অ্যালগরিদম স্তর-ভিত্তিক অ্যালগরিদমের তুলনায় আরও ক্ষতি হ্রাস করতে পারে"? এটি কি ছাঁটাই-পরবর্তী অ্যালগরিদমের সাথে সম্পর্কযুক্ত?

উত্তর:


11

আপনি যদি পুরো গাছটি বৃদ্ধি করেন তবে সেরা-প্রথম (পাতাযুক্ত) এবং গভীরতা প্রথম (স্তর-ভিত্তিক) একই গাছের ফলস্বরূপ। পার্থক্যটি ক্রমটি বাড়ানো হয়েছে এমন ক্রমে । যেহেতু আমরা সাধারণত গাছগুলি তাদের গভীরতাতে বাড়ায় না, আদেশের বিষয়টি: প্রাথমিক পর্যায়ে থামার মানদণ্ড এবং ছাঁটাইয়ের পদ্ধতি প্রয়োগের ফলে খুব ভিন্ন গাছের ফলস্বরূপ হতে পারে। যেহেতু পাতলাভ বিজ্ঞানীরা বিশ্বব্যাপী ক্ষতির জন্য তাদের অবদানের ভিত্তিতে বিভাজনগুলি বেছে নেয় এবং কেবল কোনও নির্দিষ্ট শাখার ক্ষতি নয়, এটি প্রায়শই (সর্বদা নয়) স্তর-ভিত্তিক নিম্ন-ত্রুটিযুক্ত গাছগুলি "দ্রুত" শিখবে। অর্থাত্ স্বল্প সংখ্যক নোডের জন্য, পাতাযুক্ত সম্ভবত স্তরের ভিত্তিতে সম্পাদন করবে। আপনি আরও নোড যুক্ত করার সাথে সাথে, বন্ধ না করে বা ছাঁটাই ছাড়াই তারা একই কার্য সম্পাদনে রূপান্তরিত হবে কারণ তারা আক্ষরিক অর্থে একই গাছ তৈরি করবে।

রেফারেন্স:

শি, এইচ। (2007) সেরা-প্রথম সিদ্ধান্ত ট্রি লার্নিং (থিসিস, বিজ্ঞান মাস্টার (এমএসসি))। নিউজিল্যান্ডের হ্যামিল্টন, ওয়াইকাটো বিশ্ববিদ্যালয়। Https://hdl.handle.net/10289/2317 থেকে প্রাপ্ত


সম্পাদনা: আপনার প্রথম প্রশ্ন সম্পর্কে, C4.5 এবং কার্ট উভয়ই গভীরতার-প্রথম উদাহরণ, সেরা-প্রথম নয়। উপরোক্ত রেফারেন্স থেকে এখানে কিছু প্রাসঙ্গিক সামগ্রী রয়েছে:

১.১.১ স্ট্যান্ডার্ড সিদ্ধান্ত গাছ

সিদ্ধান্ত গাছের টপ-ডাউন আনার জন্য স্ট্যান্ডার্ড অ্যালগরিদম যেমন সি 4.5 (কুইনলান, 1993) এবং কার্ট (ব্রেইমান এট।, 1984) বিভাজন এবং বিজয়ী কৌশল ব্যবহার করে প্রতিটি পদক্ষেপে গভীরতার প্রথম ক্রমে নোডগুলি প্রসারিত করে। সাধারণত, সিদ্ধান্ত গাছের প্রতিটি নোডে, পরীক্ষায় কেবল একটি একক বৈশিষ্ট্য জড়িত থাকে এবং বৈশিষ্ট্যটির মান একটি ধ্রুবকের সাথে তুলনা করা হয়। স্ট্যান্ডার্ড সিদ্ধান্ত গাছগুলির মূল ধারণাটি হ'ল, প্রথমে মূল নোডে স্থান দেওয়ার জন্য একটি বৈশিষ্ট্য নির্বাচন করুন এবং কিছু মানদণ্ডের (উদাহরণস্বরূপ তথ্য বা গিনি সূচক) এর উপর ভিত্তি করে এই বৈশিষ্ট্যের জন্য কিছু শাখা তৈরি করুন। তারপরে, প্রশিক্ষণের উদাহরণগুলি উপ-বিভাগগুলিতে বিভক্ত করুন, প্রতিটি শাখার জন্য একটি রুট নোড থেকে প্রসারিত। সাবটেটের সংখ্যা শাখার সংখ্যার সমান। তারপরে, এই পদক্ষেপটি একটি নির্বাচিত শাখার জন্য পুনরাবৃত্তি হয়, কেবলমাত্র সেই উদাহরণগুলি ব্যবহার করে যা এটিতে পৌঁছায়। একটি স্থির অর্ডার নোডগুলি প্রসারিত করতে ব্যবহৃত হয় (সাধারণত, বাম থেকে ডানে)। যদি কোনও সময়ে নোডের সমস্ত দৃষ্টান্তে একই শ্রেণীর লেবেল থাকে, যা খাঁটি নোড হিসাবে পরিচিত, বিভাজন বন্ধ হয়ে যায় এবং নোডটি একটি টার্মিনাল নোডে পরিণত হয়। সমস্ত নোড খাঁটি না হওয়া অবধি এই নির্মাণ প্রক্রিয়া অব্যাহত থাকে। তারপরে এটি অতিরিক্ত কমানোর জন্য ছাঁটাই প্রক্রিয়া অনুসরণ করে (বিভাগ 1.3 দেখুন)।

১.২.২ সেরা-প্রথম সিদ্ধান্তের গাছ

আরেকটি সম্ভাবনা, যা এখন পর্যন্ত কেবলমাত্র অ্যালগরিদম (ফ্রিডম্যান এট আল।, ২০০০) বৃদ্ধির প্রেক্ষাপটে মূল্যায়ন করা হয়েছে তা স্থির আদেশের পরিবর্তে সেরা-প্রথম ক্রমে নোডগুলি প্রসারিত করা। এই পদ্ধতিটি প্রতিটি পদক্ষেপে গাছটিতে "সেরা" স্প্লিট নোড যুক্ত করে। "সেরা" নোড হ'ল নোড যা বিভাজনের জন্য উপলব্ধ সমস্ত নোডের মধ্যে সর্বাধিকভাবে অশুচিতা হ্রাস করে (যেমন টার্মিনাল নোড হিসাবে চিহ্নিত করা হয় না)। যদিও এটি সম্পূর্ণরূপে উত্থিত গাছের জন্য স্ট্যান্ডার্ড গভীরতা-প্রথম প্রসারণ হিসাবে একই ফলস্বরূপ, এটি আমাদের নতুন গাছের ছাঁটাই পদ্ধতিতে তদন্ত করতে সক্ষম করে যা সম্প্রসারণের সংখ্যা নির্বাচন করতে ক্রস-বৈধতা ব্যবহার করে। প্রাক-ছাঁটাই এবং ছাঁটাই পরবর্তী উভয়ই এইভাবে সম্পাদন করা যেতে পারে, যা তাদের মধ্যে ন্যায্য তুলনা সক্ষম করে (বিভাগ 1.3 দেখুন)।

সেরা-প্রথম সিদ্ধান্তের গাছগুলি স্ট্যান্ডার্ড গভীরতা-প্রথম সিদ্ধান্ত গাছের মতো বিভাজন এবং বিজয়ী ফ্যাশনে নির্মিত হয়। সেরা-প্রথম গাছটি কীভাবে তৈরি করা যায় তার মূল ধারণাটি নীচে। প্রথমে রুট নোডে রাখার জন্য একটি অ্যাট্রিবিউট নির্বাচন করুন এবং কিছু মানদণ্ডের ভিত্তিতে এই অ্যাট্রিবিটির জন্য কয়েকটি শাখা তৈরি করুন। তারপরে, প্রশিক্ষণ ইনস্ট্যান্টগুলি উপ-বিভাগগুলিতে বিভক্ত করুন, প্রতিটি শাখার জন্য একটি রুট নোড থেকে প্রসারিত। এই থিসিসে কেবল বাইনারি সিদ্ধান্তের গাছগুলি বিবেচনা করা হয় এবং এইভাবে শাখার সংখ্যা হুবহু দুটি। তারপরে, এই পদক্ষেপটি একটি নির্বাচিত শাখার জন্য পুনরাবৃত্তি হয়, কেবলমাত্র সেই উদাহরণগুলি ব্যবহার করে যা এটিতে পৌঁছায়। প্রতিটি পদক্ষেপে আমরা বিস্তারের জন্য উপলভ্য সমস্ত সাবসেটগুলির মধ্যে "সেরা" উপসেটটি বেছে নিই। সমস্ত নোডগুলি খাঁটি না হওয়া বা নির্দিষ্ট সংখ্যক বিস্তৃতি পৌঁছানো অবধি এই নির্মাণ প্রক্রিয়াটি অব্যাহত থাকে। চিত্র 1. 1 অনুমানমূলক বাইনারি সেরা-প্রথম গাছ এবং একটি অনুমানিক বাইনারি গভীরতা-প্রথম গাছের মধ্যে বিভক্ত ক্রমের পার্থক্য দেখায়। নোট করুন যে অন্যান্য অর্ডারগুলি সেরা-প্রথম গাছের জন্য বেছে নেওয়া যেতে পারে যখন গভীরতা-প্রথম ক্ষেত্রে ক্রমটি সর্বদা একই থাকে।


আপনি কি দয়া করে প্রথম প্রশ্নের উত্তর দিতে পারেন?
জেকেটারিনা কোকাতজুঃ

আমার উত্তর আপডেট। সংক্ষিপ্ত সংস্করণটি হ'ল সি 4.5 এবং কার্ট উভয়ই প্রথম-প্রথম গভীরতার উদাহরণ।
ডেভিড মার্কস

আমার প্রথম প্রশ্নটি সেরা-প্রথম বা ডিএফএসের সংজ্ঞা বা ব্যাখ্যা সম্পর্কে নয়। এবং আমি নিজেই বলেছি যে সি 4.5 এবং কার্ট ডিএফএস। প্রথম প্রশ্নটি ছিল "কোন" সর্বাধিক "অ্যালগরিদমগুলি স্তর-ভিত্তিক প্রয়োগ করা হয়? [...] কোন অন্যান্য অ্যালগরিদম বা প্যাকেজগুলি সিদ্ধান্ত গাছের জন্য বিএফএস ব্যবহার করে?"
জেকেটারিনা কোকাতজুঃ

1
"গভীরতা-প্রথমে" গাছ বৃদ্ধি হয় স্তর প্রজ্ঞাময়। এটাই আমি আপনাকে বলার চেষ্টা করছিলাম। আমি আপনার জন্য হাইলাইট করা অংশটি পড়ুন। গ্রাফ ট্র্যাভার্সাল ডিএফএস এবং বিএফএসকে এখানে "গভীরতা প্রথম" এবং "সেরা প্রথম" গাছের বৃদ্ধির সাথে গুলিয়ে ফেলবেন না। এগুলি এক নয়, এবং গভীরতার প্রথম বৃদ্ধি আপনাকে "বিএফএস" বলছে, "ডিএফএস" নয় to
ডেভিড মার্কস

আমি যে সমালোচনামূলক পয়েন্টটি সবসময় মিস করছি। ধন্যবাদ.
জেকেরিনা কোকাতজুঃ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.