আমি আসলে র্যান্ডম অরণ্যের একটি বাস্তবায়ন লিখছি তবে আমি বিশ্বাস করি যে প্রশ্নটি সিদ্ধান্তের গাছের সাথে সুনির্দিষ্ট (আরএফ থেকে স্বতন্ত্র)।
সুতরাং প্রসঙ্গটি হ'ল আমি একটি সিদ্ধান্তের গাছে একটি নোড তৈরি করছি এবং পূর্বাভাস এবং লক্ষ্য ভেরিয়েবল উভয়ই অবিচ্ছিন্ন। নোডের দুটি সেটে বিভাজন ডেটার জন্য একটি বিভক্ত প্রান্তিকা রয়েছে এবং আমি প্রতিটি সেটের গড় টার্গেট মানের ভিত্তিতে প্রতিটি উপসেটের জন্য একটি নতুন পূর্বাভাস তৈরি করি। এটা কি সঠিক পন্থা?
আমার জিজ্ঞাসার কারণটি হ'ল বাইনারি ভেরিয়েবলগুলির পূর্বাভাস দেওয়ার সময় আমি বিশ্বাস করি যে আদর্শ (সঠিক?) পদ্ধতির প্রতিটি উপসেটের ডেটা সারিগুলির উপরে গড় না নিয়ে ডেটা 0 এবং 1 উপসরে বিভক্ত করা হয়। পরবর্তী বিভাজনগুলি সূক্ষ্ম শস্যযুক্ত উপগ্রহে বিভক্ত হবে এবং প্রতিটি বিভক্ত ফলাফলের গড় ফলস্বরূপ পরবর্তী বিভাজনগুলি (সিদ্ধান্ত গাছের নীচে নীচে) এখন বাইনারি ভেরিয়েবলের পরিবর্তে অবিচ্ছিন্ন ভেরিয়েবলগুলি কীভাবে পরিচালনা করছে (কারণ আমরা মূলের পরিবর্তে অবশিষ্টাংশের ত্রুটির মানগুলিতে কাজ করছি) লক্ষ্যমাত্রা)।
পার্শ্ব প্রশ্ন: দুটি পদ্ধতির (বাইনারি বনাম ধারাবাহিক) মধ্যে পার্থক্য কি তাৎপর্যপূর্ণ - বা তারা আসলে কোনও সম্পূর্ণ সিদ্ধান্ত গাছের জন্য অভিন্ন ফলাফল দেবে?