র্যান্ডমফরেস্ট শ্রেণিবিন্যাসের পরিবর্তে রিগ্রেশন বেছে নেয়


12

আমি আর এ র্যান্ডমফোরস্ট প্যাকেজটি ব্যবহার করছি এবং আইরিস ডেটা ব্যবহার করছি , উত্পন্ন এলোমেলো বন একটি শ্রেণিবদ্ধকরণ তবে যখন আমি প্রায় 700 টি বৈশিষ্ট্যযুক্ত ডেটাসেট ব্যবহার করি (বৈশিষ্ট্যগুলি প্রতিটি 28x28 পিক্সেলের চিত্রের প্রতিটি পিক্সেলের হয়) এবং লেবেল কলামটির নাম দেওয়া হয় label, randomForestউত্পন্ন হয় প্রতিরোধ। আমি নিম্নলিখিত লাইনটি ব্যবহার করছি:

rf <- randomForest(label ~ ., data=train)

শ্রেণিবিন্যাসের পরিবর্তে রিগ্রেশন কীভাবে ব্যবহৃত হয়? তথ্য মাধ্যমে পড়া হয় read.csv()

উত্তর:


10

ভেরিয়েবলের শ্রেণীর উপর নির্ভর করে র্যান্ডমফোরেস্ট শ্রেণিবদ্ধকরণ বা রিগ্রেশনকে ডিফল্ট করবে। আপনি যদি টাইপ করুন

class(iris$Species)

আপনি দেখতে পাবেন যে এটি একটি ফ্যাক্টর। আপনার কোডে 'লেবেল' সম্ভবত সংখ্যাসূচক, সুতরাং এলোমেলোভাবে র্যান্ডমফোরস্ট ডিফল্ট। শ্রেণিবদ্ধকরণের জন্য আপনাকে এটিকে একটি ফ্যাক্টরে রূপান্তর করতে হবে। আপনি এটিকে রূপান্তর করতে পারেন বা পঠনযোগ্য টেবিলের মধ্যে কলক্লাস সেট করে একটি ফ্যাক্টর হিসাবে এটি পড়তে পারেন।


4

প্রায়শই এটি কারণ আপনি আর কে বলেন নি যে লেবেলটি একটি বিভক্ত পরিবর্তনশীল। read.csvফাংশন চেষ্টা কি ধরনের প্রতিটি কলামের জন্য ব্যবহার করতে অনুমান করা এবং এটি একটি সাংখ্যিক কলাম মত দেখায় তাহলে যে এটা কি ব্যবহার করবে। আপনি কীভাবে আর strফাংশনটি ব্যবহার করে ভেরিয়েবল সঞ্চয় করে তা পরীক্ষা করতে পারেন । আপনি যুক্তিটি read.csvব্যবহার করে ভেরিয়েবলটিকে একটি ফ্যাক্টর (বা সংখ্যাসূচক বা ...) হিসাবে পড়তে বাধ্য করতে পারেন colClasses। অথবা আপনি factorফাংশনটি ব্যবহার করে এটি পড়ার পরে লেবেলগুলিকে কোনও ফ্যাক্টারে পরিবর্তন করতে পারেন ।

যদি এটি না হয় তবে আমাদের আপনার ডেটা সম্পর্কে আরও তথ্যের প্রয়োজন। strআপনার ডেটা ফ্রেমে চলমান থেকে প্রাপ্ত ফলাফলগুলি সম্ভবত কার্যকর হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.