র্যান্ডম ফরেস্ট মডেলগুলি ব্যবহার করার সময় কখন আপনার ভেরিয়েবলগুলি লগ / এক্সপ্রেস করবেন?


13

আমি বিভিন্ন গুণাবলীর ভিত্তিতে দামের পূর্বাভাস দেওয়ার জন্য র্যান্ডম বন ব্যবহার করে রিগ্রেশন করছি। কোড পাইথনে সাইকিট-লার্ন ব্যবহার করে লেখা হয়েছে।

আপনি কীভাবে সিদ্ধান্ত নেবেন যে আপনার নিজের ভেরিয়েবলগুলি exp/ logব্যবহারের পূর্বে রিগ্রেশন মডেলের সাথে মানানসই তা পরিবর্তন করা উচিত ? র্যান্ডম ফরেস্টের মতো কোনও এনসেম্বল পদ্ধতির ব্যবহার করার সময় কি এটি প্রয়োজনীয়?



3
আমি মনে করি এটি এ প্রশ্ন থেকে কিছুটা আলাদা, এলোমেলো বন / পোশাকের কারণে, তবে অন্য পোস্টটি দেখার পরে প্রশ্নটি সম্ভবত বর্ণিত হতে পারে।
পিটার ফ্লুম - মনিকা পুনরায়

@ পিটারফ্লম আপনি কি আমাকে প্রশ্নটির উত্তর দিতে সহায়তা করতে পারেন? আমি এই ক্ষেত্রে :) যথেষ্ট দক্ষ নই
Nyxynyx

যেভাবে বেশিরভাগ লোকেরা "এনসেম্বল" আরএফ শব্দটি ব্যবহার করেন তা হ'ল একটি পঠনের ক্ষেত্রে কেবল 1 টি সম্ভাব্য ইনপুট।
হ্যাক-আর

উত্তর:


16

র্যান্ডম অরণ্যগুলি যেভাবে নির্মিত হয় তা স্বাধীন ভেরিয়েবলগুলির একঘেয়ে রূপান্তরগুলির জন্য অদম্য। বিভাজনগুলি সম্পূর্ণ অভিন্ন হবে। আপনি যদি কেবল নির্ভুলতার জন্য লক্ষ্য রেখে থাকেন তবে আপনি এতে কোনও উন্নতি দেখতে পাবেন না। আসলে, যেহেতু র্যান্ডম অরণ্যগুলি জটিল অ-রৈখিক (আপনি কেন এই লিনিয়ার রিগ্রেশন বলছেন?) ফ্লাইতে সম্পর্ক এবং পরিবর্তনশীল মিথস্ক্রিয়া খুঁজে পেতে সক্ষম হন, আপনি যদি নিজের স্বাধীন পরিবর্তনশীলকে রূপান্তর করেন তবে আপনি সেই তথ্যটি মসৃণ করতে পারেন যা এই অ্যালগরিদমকে করতে দেয় এটি সঠিকভাবে

কখনও কখনও এলোমেলো বনগুলি একটি কালো বাক্স হিসাবে বিবেচনা করা হয় না এবং অনুমানের জন্য ব্যবহৃত হয়। উদাহরণস্বরূপ, আপনি যে পরিবর্তনশীল গুরুত্বের ব্যবস্থাগুলি সরবরাহ করে তা ব্যাখ্যা করতে পারেন বা আপনার নির্ভরশীল ভেরিয়েবলের উপর আপনার স্বাধীন ভেরিয়েবলের কিছু প্রান্তিক প্রভাবগুলি গণনা করতে পারেন। এটি সাধারণত আংশিক নির্ভরতা প্লট হিসাবে দৃশ্যমান হয়। আমি নিশ্চিত যে এই শেষ জিনিসটি ভেরিয়েবলের স্কেল দ্বারা অত্যন্ত প্রভাবিত, যা এলোমেলো বন থেকে আরও বর্ণনামূলক প্রকৃতির তথ্য পাওয়ার চেষ্টা করার সময় একটি সমস্যা a এই ক্ষেত্রে এটি আপনাকে আপনার ভেরিয়েবলগুলি রূপান্তর করতে সহায়তা করতে পারে (মানক করা), যা আংশিক নির্ভরতা প্লটকে তুলনীয় করে তুলতে পারে। এটি সম্পর্কে পুরোপুরি নিশ্চিত নয়, এটি নিয়ে ভাবতে হবে।

খুব বেশিদিন আগে আমি বেকারড ফরেস্ট ব্যবহার করে গণনা ডেটা পূর্বাভাস দেওয়ার চেষ্টা করেছি, বর্গমূলের উপর নির্ভর করে এবং নির্ভরশীল ভেরিয়েবলের প্রাকৃতিক লগ কিছুটা সাহায্য করেছিল, খুব বেশি নয়, এবং আমাকে মডেলটি রাখার জন্য যথেষ্ট নয়।

কিছু প্যাকেজ যেখানে আপনি নির্ধারিত জন্য এলোমেলো বন ব্যবহার করতে পারেন:

https://uc-r.github.io/lime

https://cran.r-project.org/web/packages/randomForestExplainer/index.html

https://pbiecek.github.io/DALEX_docs/2-2-useCaseApartmetns.html


6

@ জেকুইহুয়া প্রতিধ্বনি করা, র্যান্ডম ফরেস্টের পূর্বাভাসের নির্ভুলতা উন্নত হবে না।

এছাড়াও লক্ষ করুন, আপনি যদি পূর্বসূরি এবং রূপান্তরিত ভবিষ্যদ্বাণী উভয়কেই রাখেন (যেমন প্রায়শই লিনিয়ার রিগ্রেশন করা হয়) তবে আপনার সমস্যা হতে পারে। কারণ এফ এফ এলোমেলোভাবে প্রতিটি গাছের বর্ধনের জন্য ভেরিয়েবলের একটি উপসেট বেছে নিয়েছে এবং আপনি অবশ্যই পরিবর্তিত পরিবর্তনশীলটিকে দু'বারের মধ্যে রেখেছেন। যদি এটি শক্তিশালী ভবিষ্যদ্বাণীকারী হয় তবে এটি ব্যবহার হয়ে যাবে এবং আপনার এলোমেলো বনগুলি যতটা সম্ভব হয়েছে ততটা অপ্রচলিত হবে না যা উচ্চতর বৈচিত্রের দিকে পরিচালিত করে।


1
কোনও রূপান্তরিত এবং অপরিবর্তিত ভবিষ্যদ্বাণীকে যে কোনও মডেলের মধ্যে রেখে দেওয়া একটি ভয়ানক ধারণা। এগুলি পুরোপুরি কোলাইনারি এবং এটি অবশ্যই এলোমেলো বন বা লিনিয়ার রিগ্রেশন হোক না কেন আপনার মডেলটির সাথে অবশ্যই জগাখিচুড়ি করবে।
এমকেটি - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.