এলোমেলো অরণ্যের কি স্কেল বা কেন্দ্রীকরণের জন্য ইনপুট ভেরিয়েবলগুলি দরকার?


16

আমার ইনপুট ভেরিয়েবলগুলির বিভিন্ন মাত্রা রয়েছে। কিছু ভেরিয়েবল দশমিক এবং কিছু কয়েকশ হয়। এলোমেলো বন ব্যবহার করার সময় ডেটাকে মাত্রাবিহীন করতে এই ইনপুট ভেরিয়েবলগুলি কেন্দ্র (বিয়োগের গড়) বা স্কেল (স্ট্যান্ডার্ড বিচ্যুতি দ্বারা বিভাজন) করা কী প্রয়োজনীয়?

উত্তর:


30

না।

এলোমেলো অরণ্য বৃক্ষ বিভাজন অ্যালগরিদমের উপর ভিত্তি করে।

এই হিসাবে, সাধারণ রিগ্রেশন কৌশলগুলিতে প্রাপ্ত গুণফলের কোনও অ্যানালগ নেই, যা স্বাধীন ভেরিয়েবলগুলির ইউনিটগুলির উপর নির্ভর করবে। পরিবর্তে, কেউ পার্টিশন বিধিগুলির সংগ্রহ সংগ্রহ করে, মূলত একটি থ্রেশহোল্ড প্রদত্ত একটি সিদ্ধান্ত এবং এটি স্কেলিংয়ের সাথে পরিবর্তন করা উচিত নয়। অন্য কথায়, গাছগুলি কেবল বৈশিষ্ট্যগুলিতে র‌্যাঙ্ক দেখায়।

মূলত, আপনার ডেটাগুলির কোনও একঘেয়ে রূপান্তর বনকে মোটেও পরিবর্তন করা উচিত নয় (সর্বাধিক সাধারণ বাস্তবায়নে)।

এছাড়াও, সিদ্ধান্ত গাছ সাধারণত সংখ্যাগত অস্থিতিশীলতার পক্ষে দৃ are় হয় যা কখনও কখনও অন্যান্য অ্যালগরিদমে রূপান্তর এবং নির্ভুলতাকে ক্ষতিগ্রস্ত করে।


0

সামগ্রিকভাবে আমি ফায়ারব্যাগের সাথে একমত, তবে আপনি যদি ভবিষ্যদ্বাণীপূর্ণ গুরুত্ব স্কোরগুলিতে আগ্রহী হন তবে আপনার ভেরিয়েবলগুলির মানককরণের কিছু মূল্য থাকতে পারে। আরএফ অত্যন্ত পরিবর্তনশীল অবিচ্ছিন্ন ভবিষ্যদ্বাণীকারীদের পক্ষে যেতে চাইবে কারণ ডেটা বিভাজনের আরও অনেক সুযোগ রয়েছে opportunities এই ইস্যুটি মোকাবেলার জন্য আরও ভাল উপায় হ'ল বিশেষ উপায়গুলি (যেমন শর্তযুক্ত বন ব্যবহার না করে প্রতিস্থাপনের নমুনা) ব্যবহার করা যা এই পক্ষপাতিত্বের পক্ষে আরও দৃust়। Https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-8-25 দেখুন


1
সাইটে স্বাগতম। আমরা প্রশ্নোত্তর আকারে উচ্চমানের পরিসংখ্যান সম্পর্কিত তথ্যের একটি স্থায়ী সংগ্রহস্থল তৈরি করার চেষ্টা করছি। সুতরাং, লিঙ্করোটের কারণে আমরা কেবলমাত্র লিংক-উত্তর থেকে সাবধান। আপনি যদি লিঙ্কে একটি সম্পূর্ণ উদ্ধৃতি এবং তথ্যের সংক্ষিপ্তসার পোস্ট করতে পারেন, তবে এটি মারা গেলে?
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.