কারণ র্যান্ডমফরেস্ট হ'ল স্বাধীন গাড়ীর সংকলন যা বৈশিষ্ট্যগুলির র্যান্ডম উপসেট এবং প্রশিক্ষণ রেকর্ড করে এটি নিজেকে সমান্তরালে উন্নীত করে। combine()
RandomForest প্যাকেজের মধ্যে ফাংশন একসঙ্গে স্বাধীনভাবে প্রশিক্ষিত বন সেলাই হবে। এখানে একটি খেলনা উদাহরণ। @ এমপিকিউ'র উত্তরে বলা হয়েছে যে আপনি সূত্র স্বরলিপিটি ব্যবহার করবেন না, তবে ভেরিয়েবলগুলির একটি ডেটাফ্রেম / ম্যাট্রিক্স এবং ফলাফলগুলির একটি ভেক্টর দিয়ে পাস করুন। আমি নির্লজ্জভাবে এগুলি ডক্স থেকে তুলে নিয়েছি।
library("doMC")
library("randomForest")
data(iris)
registerDoMC(4) #number of cores on the machine
darkAndScaryForest <- foreach(y=seq(10), .combine=combine ) %dopar% {
set.seed(y) # not really needed
rf <- randomForest(Species ~ ., iris, ntree=50, norm.votes=FALSE)
}
আমি একইভাবে নামযুক্ত .কম্বাইন প্যারামিটারে র্যান্ডমফোরেস্ট কম্বিনেশন ফাংশনটি পাস করেছি (যা লুপের আউটপুটে ফাংশন নিয়ন্ত্রণ করে The
সম্পাদনা:
পোস্টটি পড়ার পরে আমি বুঝতে পারি যে আমি 34+ ফ্যাক্টর ইস্যু সম্পর্কে কিছুই বলি না। একটি সম্পূর্ণ অ-চিন্তিত উত্তর হতে পারে বাইনারি ভেরিয়েবল হিসাবে তাদের উপস্থাপন করা। এটি প্রতিটি ফ্যাক্টর এমন একটি কলাম যা তার উপস্থিতি / অস্তিত্ব সম্পর্কে 0/1 -level ফ্যাক্টরটিকে এনকোড করা হয়। গুরুত্বহীন কারণগুলির উপর কিছু পরিবর্তনশীল নির্বাচন করে সেগুলি সরিয়ে আপনি আপনার স্থানকে খুব বেশি বড় হতে বাধা রাখতে পারেন।