র্যান্ডমফোরেস্ট - এমডিএস প্লটের ব্যাখ্যা


14

আমি 8 টি ভেরিয়েবলের (বিভিন্ন শরীরের অঙ্গভঙ্গি এবং গতিবিধি) এর উপর ভিত্তি করে 6 টি পশুর আচরণের (যেমন স্ট্যান্ডিং, হাঁটা, সাঁতার ইত্যাদি) শ্রেণিবদ্ধ করার জন্য র্যান্ডমফোরস্ট ব্যবহার করেছি।

র্যান্ডমফোরস্ট প্যাকেজের এমডিএসপ্লট আমাকে এই আউটপুট দেয় এবং ফলাফলটি ব্যাখ্যা করতে আমার সমস্যা হয়। আমি একই ডেটাতে একটি পিসিএ করেছি এবং পিসি 1 এবং পিসি 2 এর সমস্ত শ্রেণীর মধ্যে ইতিমধ্যে একটি দুর্দান্ত বিভাজন পেয়েছি তবে এখানে ডিম 1 এবং ডিম 2 কেবল 3 টি আচরণ বিচ্ছিন্ন বলে মনে হচ্ছে। এর অর্থ কি এই যে তিনটি আচরণ অন্যান্য সমস্ত আচরণের চেয়ে অনেক বেশি আলাদা (তাই এমডিএস ভেরিয়েবলের মধ্যে সর্বাধিক ভিন্নতা খুঁজে পাওয়ার চেষ্টা করে তবে প্রথম ধাপে সমস্ত পরিবর্তনশীল নয়)? তিনটি ক্লাস্টারের অবস্থান (উদাহরণস্বরূপ Dim1 এবং Dim2) কী নির্দেশ করে? যেহেতু আমি আরআই-তে নতুন হয়েছি তারও এই চক্রান্তটির জন্য একটি কিংবদন্তি তৈরি করতে সমস্যা রয়েছে (তবে আমার কাছে ধারণা রয়েছে বিভিন্ন রঙগুলি কী বোঝায়), তবে সম্ভবত কেউ সাহায্য করতে পারে? অনেক ধন্যবাদ!!

6 টি বিভিন্ন প্রাণী আচরণের র‌্যান্ডমফোরেস্ট এমডিএসপ্লট

আমি র‌্যান্ডমফোরেস্টে ClassCenter ফাংশন দিয়ে তৈরি একটি প্লট যুক্ত করি। এই ফাংশন প্রোটোটাইপগুলি প্লট করার জন্য প্রক্সিমিটি ম্যাট্রিক্স (এমডিএস প্লটের মতো) ব্যবহার করে। তবে ছয়টি ভিন্ন আচরণের জন্য ডেটাপয়েন্টগুলি দেখে, আমি বুঝতে পারি না কেন প্রক্সিমিটি ম্যাট্রিক্স আমার প্রোটোটাইপগুলি যেমন এটির পরিকল্পনা করে। আমি আইরিস ডেটা সহ ক্লাসেন্টার ফাংশনটিও চেষ্টা করেছি এবং এটি কাজ করে। তবে দেখে মনে হচ্ছে এটি আমার ডেটার জন্য কাজ করে না ...

এই প্লটের জন্য আমি যে কোডটি ব্যবহার করেছি তা এখানে

be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))

আমার ক্লাস কলামটি প্রথমটি, এরপরে 8 ভবিষ্যদ্বাণীকারী। আমি এক্স এবং y হিসাবে সেরা দুটি ভবিষ্যদ্বাণীকারী ভেরিয়েবল প্লট করেছি।

র‌্যান্ডমফোরেস্ট ক্লাস সেন্টার প্লট করে different টি বিভিন্ন প্রাণী আচরণের জন্য

উত্তর:


10

এমডিএসপ্লট ফাংশনটি (পিসিএ) প্রক্সিমিটি ম্যাট্রিক্স প্লট করে। র্যান্ডমফোরস্টের ডকুমেন্টেশন থেকে, প্রক্সিমিটি ম্যাট্রিক্স হ'ল:

ইনপুটগুলির মধ্যে প্রক্সিমিটি মাপের একটি ম্যাট্রিক্স (ডেটা পয়েন্টগুলির জোড়া একই টার্মিনাল নোডগুলিতে থাকে এমন ফ্রিকোয়েন্সি ভিত্তিতে)।

এই বর্ণনার ভিত্তিতে আমরা অনুমান করতে পারি যে বিভিন্ন প্লট কী বোঝায়। আপনার কাছে কে = 4 নির্দিষ্ট করা হয়েছে বলে মনে হচ্ছে, যার অর্থ 4 উপাদানগুলিতে প্রক্সিমিটি ম্যাট্রিক্সের ক্ষয়। প্লটের এই ম্যাট্রিক্সে প্রতিটি প্রবেশের জন্য (i, j), যা প্লট করা হয় তা হল পিসিএ পচনের মাত্রা বরাবর আমি বনাম পিসিএ পঁচন মাত্রা j সহ।

আমি একই ডেটাতে একটি পিসিএ করেছি এবং পিসি 1 এবং পিসি 2 এর সমস্ত শ্রেণীর মধ্যে ইতিমধ্যে একটি দুর্দান্ত বিভাজন পেয়েছি তবে এখানে ডিম 1 এবং ডিম 2 কেবল 3 টি আচরণ বিচ্ছিন্ন বলে মনে হচ্ছে। এর অর্থ কি এই যে এই তিনটি আচরণ অন্যান্য সমস্ত আচরণের চেয়ে বেশি পৃথক (সুতরাং এমডিএস ভেরিয়েবলের মধ্যে সবচেয়ে বড় বৈসাদ্য খুঁজে পাওয়ার চেষ্টা করে, তবে প্রথম ধাপে সমস্ত পরিবর্তনশীল নয়)?

এমডিএস কেবল তার র্যান্ডমফোরস্টের আউটপুটের উপর বিশ্লেষণ করতে পারে। আপনি যদি আরও ভাল বিচ্ছেদ আশা করছেন, তবে আপনি নিজের র্যান্ডমফরেস্টের শ্রেণিবিন্যাসের কার্যকারিতাটি পরীক্ষা করতে চাইতে পারেন। আরেকটি বিষয় মনে রাখবেন যে আপনার পিসিএ 9-মাত্রিক ডেটা থেকে 2 টি মাত্রায় ম্যাপ করছে, তবে এমডিএস একটি এনএক্সএন-ডাইমেনশনাল প্রক্সিমিটি ম্যাট্রিক্স থেকে 2 মাত্রায় ম্যাপ করছে, যেখানে এনটি ডেটাপয়েন্টগুলির সংখ্যা।

তিনটি ক্লাস্টারের অবস্থান (উদাহরণস্বরূপ Dim1 এবং Dim2) কী নির্দেশ করে?

এটি কেবল আপনাকে জানায় যে এই ক্লাস্টারগুলি একে অপরের থেকে কতটা দূরে (তুলনামূলক)। এটি ভিজ্যুয়ালাইজেশন সহায়তা, সুতরাং আমি এটির অতিরিক্ত ব্যাখ্যা করব না।

যেহেতু আমি আরআই-তে নতুন হয়েছি তারও এই চক্রান্তটির জন্য একটি কিংবদন্তি তৈরি করতে সমস্যা রয়েছে (তবে আমার কাছে ধারণা রয়েছে বিভিন্ন রঙগুলি কী বোঝায়), তবে সম্ভবত কেউ সাহায্য করতে পারে?

যেভাবে আর কাজ করে, বাস্তবের পরে কিংবদন্তি তৈরি করার কোনও উপায় নেই (মতলব বলার মতো নয় যেখানে এই তথ্যটি চিত্রের অবজেক্টের ভিতরে সংরক্ষণ করা হয়েছে)। যাইহোক, এমডিএসপ্লোটের কোডটি দেখে আমরা দেখতে পাচ্ছি যে প্রাসঙ্গিক কোড ব্লকটি হ'ল:

palette <- if (require(RColorBrewer) && nlevs < 12) brewer.pal(nlevs, "Set1")

...

plot(rf.mds$points, col = palette[as.numeric(fac)], pch = pch, ...)

সুতরাং রঙগুলি প্যালেট থেকে নেওয়া হবে এবং আপনি যে কোনও ক্রম দিয়েছিলেন সেগুলিতে (আচরণগুলি) ম্যাপ করা হবে। সুতরাং আপনি যদি কোনও কিংবদন্তির পরিকল্পনা করতে চান:

legend(x,y,levels(fac),col=brewer.pal(nlevs, 'Set1'), pch=pch)

সম্ভবত কাজ করবে।


আপনার উত্তরের জন্য অনেক ধন্যবাদ, এটি সত্যই সহায়ক! আমার এলোমেলো বন মডেলের শ্রেণিবিন্যাসের পারফরম্যান্সটি বেশ ভাল (ওওবি ত্রুটি হার 4.94%, এবং সিভি সহ 95% যথার্থতা), এজন্যই আমি এমডিএস প্লটে আরও ভাল বিচ্ছেদ আশা করছিলাম। ক্লাসের প্রোটোটাইপগুলির জন্য আমি ফাংশন ক্লাস সেন্টারের সাথে একটি চিত্রও প্লট করার চেষ্টা করেছি (আমি আরএফ ম্যানুয়ালিতে আইরিস উদাহরণটি অনুসরণ করেছি), তবে ফাংশনটি যেমন প্রক্সিমিটি ম্যাট্রিক্সও ব্যবহার করে, প্রোটোটাইপগুলি কেবল তা বোঝায় বলে মনে হয় না। তবে এই চক্রান্তে ক্লাসগুলি পৃথকভাবে পৃথকভাবে পৃথক হয়েছে, তবে প্রোটোটাইপগুলি তা দেয় না।
প্যাট

আমি উপরে আমার প্রশ্নের সাথে ClassCenter প্লট যুক্ত করব। আমি আরও ভেবেছিলাম যে আমার ভবিষ্যদ্বাণীকারীদের বিভিন্ন স্কেল সমস্যা হতে পারে তবে এলোমেলো বন ব্যবহার করার সময় মনে হচ্ছে স্কেলিংয়ের দরকার নেই। আমি খুব দ্রুত কিংবদন্তি কমান্ড চেষ্টা করেছিলাম কিন্তু এটি কার্যকর হয়নি, তবে আমি মনে করি এটি সম্ভবত আমার কোনও ভুল করেছে। আগামীকাল এটিকে আরও একবার চেষ্টা করব। আবার ধন্যবাদ!
প্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.