সিদ্ধান্ত গাছ প্রায় সবসময় বাইনারি গাছ হয়?


21

প্রায় প্রতিটি সিদ্ধান্ত গাছের উদাহরণটি আমি জুড়ে এসেছি বাইনারি ট্রি হিসাবে ঘটে। এটি কি বেশ সার্বজনীন? বেশিরভাগ মানক অ্যালগোরিদম (সি 4.5, কার্ট ইত্যাদি) কেবল বাইনারি গাছকে সমর্থন করে? আমি যা সংগ্রহ করি তা থেকে CHAID বাইনারি গাছগুলির মধ্যে সীমাবদ্ধ নয় তবে এটি একটি ব্যতিক্রম বলে মনে হয়।

একটি দ্বি-দ্বি দ্বিধা এবং তারপরে একটি বাচ্চাদের মধ্যে দুটি দ্বিমুখী বিভাজন একক ত্রি-পথ বিভাজনের মতো জিনিস নয়। এটি একটি একাডেমিক পয়েন্ট হতে পারে তবে আমি সবচেয়ে সাধারণ ব্যবহারের ক্ষেত্রে বুঝতে পারি তা নিশ্চিত করার চেষ্টা করছি।

উত্তর:


18

এটি মূলত একটি প্রযুক্তিগত সমস্যা: আপনি যদি বাইনারি পছন্দগুলিতে সীমাবদ্ধ না রাখেন তবে গাছের পরবর্তী বিভাজনের জন্য খুব বেশি সম্ভাবনা রয়েছে। সুতরাং আপনি অবশ্যই আপনার প্রশ্নে তৈরি সমস্ত পয়েন্ট সঠিক।

সচেতন থাকুন যে বেশিরভাগ গাছের ধরণের অ্যালগোরিদমগুলি ধাপে ধাপে কাজ করে এবং এমনকী যেমন সেরা সম্ভাব্য ফলাফল দেওয়ার গ্যারান্টিযুক্তও না। এটি কেবল একটি অতিরিক্ত ক্যাভিয়েট।

বেশিরভাগ ব্যবহারিক কাজের জন্য, যদিও গাছের নির্মাণ / ছাঁটাইয়ের সময় নয় , দুই প্রকারের বিভক্তি সমান, যদিও তা পরস্পরের পরপরই উপস্থিত হয়।


আপনার প্রথম বিন্দুতে কেবল প্রশস্ত করার জন্য: সম্ভাব্য বিভাজনের সংখ্যা তাত্পর্যপূর্ণভাবে বেড়ে যায়। আপনি যদি 1000 টি স্বতন্ত্র মানগুলির সাথে একটি অবিচ্ছিন্ন পরিবর্তনশীলকে বিভক্ত করে থাকেন তবে 999 বাইনারি বিভাজন রয়েছে তবে 999 * 998 ট্রাইনারি স্প্লিট রয়েছে।
পিটার ফ্লুম - মনিকা পুনরায়

2
(1000-13-1)=999*998/2

5

একটি দ্বি-দ্বি দ্বিখণ্ডনের পরে বাচ্চাদের যে কোনও একটিতে দ্বি-দ্বি দ্বিখণ্ডিত বিভাজন একক ত্রি-পথ বিভাজনের মতো জিনিস নয় is

আপনি এখানে কী বলতে চাইছেন তা আমি নিশ্চিত নই। যে কোনও মাল্টি-ওয়ে বিভক্তিকে দ্বিমুখী বিভাজনের সিরিজ হিসাবে উপস্থাপন করা যেতে পারে। ত্রি-উপায়ে বিভক্ত হওয়ার জন্য, আপনি প্রথমে A&B বনাম সিতে বিভক্ত করে তারপরে A থেকে বি ভাগ করে এ, বি এবং সিতে বিভক্ত করতে পারেন A

প্রদত্ত অ্যালগরিদম সেই নির্দিষ্ট ক্রমটি বেছে না নিতে পারে (বিশেষত, বেশিরভাগ অ্যালগরিদমের মতো, এটি লোভী) তবে এটি অবশ্যই পারে। এবং যদি কোনও এলোমেলোকরণ বা স্টেজওয়াইজ পদ্ধতিগুলি এলোমেলো বন বা উত্সাহিত গাছের মতো করা হয়, তবে বিভাজনের সঠিক ক্রম সন্ধানের সম্ভাবনা বেড়ে যায়। অন্যরা যেমন উল্লেখ করেছে, মাল্টি-ওয়ে স্প্লিটগুলি গণনামূলকভাবে ব্যয়বহুল, সুতরাং এই বিকল্পগুলি দেওয়া, বেশিরভাগ গবেষক বাইনারি বিভাজনগুলি বেছে নিয়েছেন বলে মনে হয়।

আশাকরি এটা সাহায্য করবে


3
হ্যাঁ আমি বুঝতে পারি যে A, B, এবং C প্রথমে A&B বনাম সিতে বিভক্ত হয়ে এবং তারপরে বি থেকে বি বিভাজিত হয়ে অর্জিত হতে পারে point
মাইকেল ম্যাকগোয়ান

2

সিদ্ধান্ত গাছ এবং বিভাজন (অন্যথায় বাইনারি বনাম) এর ব্যবহার সম্পর্কে, আমি কেবল CHAID সম্পর্কে জানি যে নন-বাইনারি বিভাজন রয়েছে তবে সম্ভবত অন্যান্য রয়েছে। আমার জন্য, নন-বাইনারি বিভক্তির মূল ব্যবহারটি ডেটা মাইনিং ব্যায়ামগুলিতে যেখানে আমি দেখছি যে কীভাবে অনেক স্তরের সাথে নামমাত্র পরিবর্তনশীলটিকে অনুকূলভাবে বিন করা যায় to বাইনারি বিভাজনগুলির একটি সিরিজ CHAID দ্বারা করা গোষ্ঠীকরণের মতো কার্যকর নয়।


আপনি মজাদার বিষয়টি মজাদার, কারণ বিনিং সম্পর্কে চিন্তাভাবনা আমাকে এই প্রশ্নটি সম্পর্কে ভাবতে শুরু করেছে (যদিও আমি নামমাত্র ভেরিয়েবলের পরিবর্তে সংখ্যার ভেরিয়েবলগুলি বেনিংয়ের বিষয়ে ভাবছিলাম)।
মাইকেল ম্যাকগোয়ান

@ মিশেল, হ্যাঁ এটি খুব কার্যকর হয় তবে আপনি তথ্য ফেলে দেন। আমি যখন নামমাত্র পরিবর্তনশীলের বিচ্ছিন্ন মাত্রাগুলি একত্রিত করতে চাই তখন আমি এটি ব্যবহার করি - যখন চূড়ান্ত মডেলিং গাছের ধরণের পদ্ধতির ছাড়াই করা হবে (বলুন লজিস্টিক রিগ্রেশন বা এসভিএম এবং অনেকগুলি স্পর্শযুক্ত ডামি ভেরিয়েবল সমস্যা সৃষ্টি করে)
বি_মিনার

0

অনুগ্রহ করে পড়ুন এই

ব্যবহারিক কারণে (সম্মিলিত বিস্ফোরণ) বেশিরভাগ গ্রন্থাগারগুলি বাইনারি বিভাজনযুক্ত সিদ্ধান্ত গাছ প্রয়োগ করে। সুন্দর জিনিসটি হ'ল তারা এনপি-সম্পূর্ণ (হায়াফিল, লরেন্ট এবং রোনাল্ড এল রিভস্ট। "সর্বোত্তম বাইনারি সিদ্ধান্ত গাছগুলি তৈরি করা এনপি-সম্পূর্ণ" "ইনফরমেশন প্রসেসিং লেটারস 5.1 (1976): 15-17)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.