সংক্ষিপ্ত সংস্করণ: আমি এমন একটি আর প্যাকেজ সন্ধান করছি যা সিদ্ধান্ত গাছ তৈরি করতে পারে যেখানে সিদ্ধান্ত গাছের প্রতিটি পাতা একটি সম্পূর্ণ লিনিয়ার রিগ্রেশন মডেল। আফাইক, গ্রন্থাগার rpart
সিদ্ধান্ত গাছ তৈরি করে যেখানে প্রতিটি পাতায় নির্ভরশীল পরিবর্তনশীল স্থির থাকে। এমন কি অন্য কোনও গ্রন্থাগার আছে (বা একটি rpart
সেটিং যা আমি অবগত নই) এমন গাছ তৈরি করতে পারে?
দীর্ঘ সংস্করণ: আমি একটি অ্যালগরিদম সন্ধান করছি যা একটি প্রশিক্ষণ ডেটা সেটের ভিত্তিতে সিদ্ধান্ত গাছ তৈরি করে। গাছের প্রতিটি সিদ্ধান্তই একটি স্বাধীন ভেরিয়েবলের শর্ত অনুসারে প্রশিক্ষণের তথ্যকে দুটি ভাগে বিভক্ত করে। গাছের গোড়ায় সম্পূর্ণ ডেটা সেট থাকে এবং ডেটা সেটে প্রতিটি আইটেম হুবহু একটি পাতাগুলি থাকে।
অ্যালগরিদম এভাবে চলে:
- পূর্ণ ডেটাসেট দিয়ে শুরু করুন যা গাছের মূল নোড। এই নোডটি চয়ন করুন এবং এটিকে ।
- এ ডেটাতে লিনিয়ার রিগ্রেশন মডেল তৈরি করুন ।
- তাহলে এর এর রৈখিক মডেল কিছু থ্রেশহোল্ড বেশী , তাহলে আমরা সঙ্গে সম্পন্ন , তাই চিহ্নিত পাতার হিসেবে এবং পদক্ষেপ 5 ঝাঁপ।
- ব্যবহার করে দেখুন র্যান্ডম সিদ্ধান্ত এবং এক যে শ্রেষ্ঠ উৎপাদ বাছাই subnodes মধ্যে:
- এলোমেলো স্বতন্ত্র ভেরিয়েবল , সেইসাথে একটি এলোমেলো থ্রেশহোল্ড ।
- সিদ্ধান্ত ডাটা সেট splits দুটি নতুন নোড অনুবাদ করে, এবং ।
- এবং both উভয় ক্ষেত্রে লিনিয়ার রিগ্রেশন মডেল তৈরি করুন এবং তাদের গণনা করুন (তাদেরকে এবং call কল করুন )।
- এই সমস্ত টিপলস থেকে , সর্বাধিক দিয়ে একটি নির্বাচন করুন । গাছ এই উৎপাদনের একটি নতুন সিদ্ধান্ত, এবং দুটি নতুন subnodes হয়েছে এবং ।
- আমরা প্রক্রিয়াজাতকরণ শেষ করেছি । একটি নতুন নোড বাছুন যা এখনও প্রক্রিয়া করা হয়নি এবং আবার ধাপ 2 এ ফিরে যান যদি সমস্ত নোড প্রক্রিয়া করা হয়ে থাকে তবে অ্যালগরিদম শেষ হয়।
এটি পুনরাবৃত্তভাবে একটি সিদ্ধান্তের গাছ তৈরি করবে যা ডেটা আরও ছোট অংশে বিভক্ত করে এবং সেই অংশগুলির প্রত্যেকটির জন্য একটি লিনিয়ার মডেল গণনা করে।
পদক্ষেপ 3 হ'ল প্রস্থান শর্ত, যা অ্যালগরিদমকে অতিরিক্ত ফিট করা থেকে বাধা দেয়। অবশ্যই, অন্যান্য সম্ভাব্য প্রস্থান শর্তাবলী:
- যদি গাছের মধ্যে এর গভীরতা উপরে থাকে তবে প্রস্থান করুন
- এ থাকা ডেটা সেট চেয়ে ছোট হলে প্রস্থান করুন
আর প্যাকেজে কি এমন একটি অ্যালগরিদম আছে?