আমি মেশিন লার্নিং, কার্ট-কৌশল এবং এ জাতীয় মতামতে বেশ নতুন এবং আমি আশা করি আমার ভোদাভুটিও খুব স্পষ্ট নয়।
র্যান্ডম ফরেস্ট কীভাবে একাধিক স্তরের / স্তরক্রমিক ডেটা স্ট্রাকচারগুলি পরিচালনা করে (উদাহরণস্বরূপ যখন ক্রস-লেভেল ইন্টারঅ্যাকশন আগ্রহী)?
এটি হ'ল বিভিন্ন শ্রেণিবদ্ধ স্তরের বিশ্লেষণের ইউনিটগুলির সাথে ডেটা সেট করে ( উদাহরণস্বরূপ , শিক্ষার্থীরা বিদ্যালয়ের ভিতরেই বাসা বেঁধেছিল, শিক্ষার্থী এবং বিদ্যালয় উভয়েরই ডেটা সহ)।
উদাহরণ হিসাবে, প্রথম স্তরের ব্যক্তিদের সাথে একাধিক স্তরের ডেটা সেট বিবেচনা করুন ( উদাহরণস্বরূপ , ভোটদানের আচরণের সাথে ডেটা সহ, ডেমোগ্রাফিকগুলি ইত্যাদি) দ্বিতীয় স্তরের দেশগুলিতে বাসা বেঁধেছে (দেশ-স্তরের ডেটা সহ; যেমন , জনসংখ্যা):
ID voted age female country population
1 1 19 1 1 53.01
2 1 23 0 1 53.01
3 0 43 1 1 53.01
4 1 27 1 1 53.01
5 0 67 0 1 53.01
6 1 34 1 2 47.54
7 0 54 1 2 47.54
8 0 22 1 2 47.54
9 0 78 0 2 47.54
10 1 52 0 2 47.54
আসুন এটি বলি যে voted
প্রতিক্রিয়া / নির্ভরশীল ভেরিয়েবল এবং অন্যগুলি হ'ল ভবিষ্যদ্বাণীকারী / স্বতন্ত্র ভেরিয়েবল। এই ধরণের ক্ষেত্রে মার্জিন এবং কিছু উচ্চ-স্তরের ভেরিয়েবলের ( যেমন , population
) বিভিন্ন পৃথক স্তরের ভেরিয়েবল ইত্যাদির জন্য আংশিক নির্ভরতা (আংশিক নির্ভরতা) এর প্রান্তিক প্রভাবগুলি খুব আকর্ষণীয় হতে পারে। এর অনুরূপ ক্ষেত্রে glm
অবশ্যই আরও উপযুক্ত - তবে যখন অনেকগুলি ভেরিয়েবল, ইন্টারঅ্যাকশন এবং / বা অনুপস্থিত মান এবং / অথবা খুব বড়-স্ক্রিনের ডেটাসেটস থাকে তখন এগুলি glm
নির্ভরযোগ্য নয়।
অনুচ্ছেদ: র্যান্ডম ফরেস্ট কি কোনও উপায়ে এই ধরণের ডেটা কাঠামো স্পষ্টভাবে পরিচালনা করতে পারে? নির্বিশেষে যদি ব্যবহার করা হয় তবে এটি কোন ধরণের পক্ষপাতিত্বের পরিচয় দেয়? র্যান্ডম ফরেস্ট যদি উপযুক্ত না হয়, তবে অন্য কোনও নকশাকৃত ধরণের পদ্ধতি কি এটি?
( গোষ্ঠীভিত্তিক ডেটা সম্পর্কিত প্রশ্ন র্যান্ডম বন সম্ভবত একই রকম, তবে সত্যই এর উত্তর দেয় না))