আমি 8 টি ভেরিয়েবলের (বিভিন্ন শরীরের অঙ্গভঙ্গি এবং গতিবিধি) এর উপর ভিত্তি করে 6 টি পশুর আচরণের (যেমন স্ট্যান্ডিং, হাঁটা, সাঁতার ইত্যাদি) শ্রেণিবদ্ধ করার জন্য র্যান্ডমফোরস্ট ব্যবহার করেছি।
র্যান্ডমফোরস্ট প্যাকেজের এমডিএসপ্লট আমাকে এই আউটপুট দেয় এবং ফলাফলটি ব্যাখ্যা করতে আমার সমস্যা হয়। আমি একই ডেটাতে একটি পিসিএ করেছি এবং পিসি 1 এবং পিসি 2 এর সমস্ত শ্রেণীর মধ্যে ইতিমধ্যে একটি দুর্দান্ত বিভাজন পেয়েছি তবে এখানে ডিম 1 এবং ডিম 2 কেবল 3 টি আচরণ বিচ্ছিন্ন বলে মনে হচ্ছে। এর অর্থ কি এই যে তিনটি আচরণ অন্যান্য সমস্ত আচরণের চেয়ে অনেক বেশি আলাদা (তাই এমডিএস ভেরিয়েবলের মধ্যে সর্বাধিক ভিন্নতা খুঁজে পাওয়ার চেষ্টা করে তবে প্রথম ধাপে সমস্ত পরিবর্তনশীল নয়)? তিনটি ক্লাস্টারের অবস্থান (উদাহরণস্বরূপ Dim1 এবং Dim2) কী নির্দেশ করে? যেহেতু আমি আরআই-তে নতুন হয়েছি তারও এই চক্রান্তটির জন্য একটি কিংবদন্তি তৈরি করতে সমস্যা রয়েছে (তবে আমার কাছে ধারণা রয়েছে বিভিন্ন রঙগুলি কী বোঝায়), তবে সম্ভবত কেউ সাহায্য করতে পারে? অনেক ধন্যবাদ!!
আমি র্যান্ডমফোরেস্টে ClassCenter ফাংশন দিয়ে তৈরি একটি প্লট যুক্ত করি। এই ফাংশন প্রোটোটাইপগুলি প্লট করার জন্য প্রক্সিমিটি ম্যাট্রিক্স (এমডিএস প্লটের মতো) ব্যবহার করে। তবে ছয়টি ভিন্ন আচরণের জন্য ডেটাপয়েন্টগুলি দেখে, আমি বুঝতে পারি না কেন প্রক্সিমিটি ম্যাট্রিক্স আমার প্রোটোটাইপগুলি যেমন এটির পরিকল্পনা করে। আমি আইরিস ডেটা সহ ক্লাসেন্টার ফাংশনটিও চেষ্টা করেছি এবং এটি কাজ করে। তবে দেখে মনে হচ্ছে এটি আমার ডেটার জন্য কাজ করে না ...
এই প্লটের জন্য আমি যে কোডটি ব্যবহার করেছি তা এখানে
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
আমার ক্লাস কলামটি প্রথমটি, এরপরে 8 ভবিষ্যদ্বাণীকারী। আমি এক্স এবং y হিসাবে সেরা দুটি ভবিষ্যদ্বাণীকারী ভেরিয়েবল প্লট করেছি।