Ggplot বা উপবৃত্তাকার প্যাকেজ সহ 95% সিআই উপবৃত্তের প্লট করার সময় বিভিন্ন ফলাফল পাওয়া


11

আমি protoclust{protoclust}আমার তথ্যকে শ্রেণিবদ্ধ করার জন্য ব্যবহৃত প্রতিটি জোড়ের জন্য স্কেটার প্লট তৈরি করে ক্লাস্টারিংয়ের ফলাফলগুলি ভিজ্যুয়ালাইজ করতে চাই ( ক্লাস দ্বারা রঙ করা এবং উপবৃত্তগুলি ওভারল্যাপিং করে প্রতিটি শ্রেণির জন্য 95% আস্থা অন্তর (যা পরিদর্শন করতে হবে) এলিপেস-ক্লাসগুলি প্রতিটি জুড়ের ভেরিয়েবলের আওতায় পড়ে)

আমি উপবৃত্তাকার অঙ্কন দুটি ভিন্ন উপায়ে প্রয়োগ করেছি এবং ফলিত উপবৃত্তগুলি আলাদা! (প্রথম প্রয়োগের জন্য বৃহত্তর উপবৃত্তাকার!) একটি প্রাইরি যেগুলি কেবলমাত্র আকারে পৃথক হয় (কিছু ডিফেরেন্ট স্কেলিং?), কেন্দ্র এবং কোণগুলির কোণ হিসাবে উভয়ই একইরকম বলে মনে হয়। আমি অনুমান করি যে আমি অবশ্যই তাদের মধ্যে একটি ব্যবহার করে কিছু ভুল করছি (আশা করি উভয়ের সাথে নয়!), বা যুক্তি দিয়ে।

কেউ আমাকে বলতে পারে যে আমি কী ভুল করছি?

এখানে দুটি বাস্তবায়নের জন্য কোড; উভয়ই একটি জিপিপ্লাট 2 স্ক্রেটারপ্লোটে ডেটা উপবৃত্তাকে কীভাবে সুপারমপোজ করা যায় তার উত্তরের উপর ভিত্তি করে

### 1st implementation 
### using ellipse{ellipse}
library(ellipse)
library(ggplot2) 
library(RColorBrewer)
colorpal <- brewer.pal(10, "Paired")

x <- data$x
y <- data$y
group <- data$group
df <- data.frame(x=x, y=y, group=factor(group))

df_ell <- data.frame() 
for(g in levels(df$group)){df_ell <- rbind(df_ell, cbind(as.data.frame(with(df[df$group==g,], ellipse(cor(x, y),scale=c(sd(x),sd(y)),centre=c(mean(x),mean(y))))),group=g))} 

p1 <- ggplot(data=df, aes(x=x, y=y,colour=group)) + geom_point() + 
  geom_path(data=df_ell, aes(x=x, y=y,colour=group))+scale_colour_manual(values=colorpal)

### 2nd implementation 
###using function ellipse_stat() 
###code by Josef Fruehwald available in: https://github.com/JoFrhwld/FAAV/blob/master/r/stat-ellipse.R

p2 <-qplot(data=df, x=x,y=y,colour=group)+stat_ellipse(level=0.95)+scale_colour_manual(values=colorpal)

এখানে দুটি প্লট একসাথে রয়েছে (বাম গ্রাফটি p1বাস্তবায়ন ( ellipse()):

এখানে চিত্র বর্ণনা লিখুন

ডেটা এখানে উপলভ্য: https://www.DPboxbox.com/sh/xa8xrisa4sfxyj0/l5zaGQmXJt


এটি কোনও বিষয় নয়, তবে আমি যখন আপনার কোডটি চালাচ্ছি তখন আমি একটি সতর্কতা পাই Warning message: In cov.trob(cbind(data$x, data$y)) : Probable convergence failureযখন আপনি কোডটি চালাবেন তখন কি এটি ঘটছে?
আতিরেতু

@atiretoo হ্যাঁ, আমি কোডটি চালানোর সময় এটিও ঘটে। আমি জানি না কেন। অন্য কেউ হয়ত জানেন? Jose
josetanago

উত্তর:


9

আপনি কোনও ভুল করছেন না, দুটি ফাংশন ডেটা বিতরণ সম্পর্কে বিভিন্ন অন্তর্নিহিত অনুমান করছে। আপনার প্রথম প্রয়োগটি মাল্টিভারিয়েটকে স্বাভাবিক হিসাবে ধরে নিয়েছে এবং ২ য় বার মাল্টিভারিয়েট টি-বিতরণ (প্যাকেজ এমএএসএস-এ cov.trob দেখুন)। আপনি যদি একটি গ্রুপ বের করেন তবে এর প্রভাবটি আরও সহজ:

#pull out group 1
pick = group ==1
p3 <- qplot(data=df[pick,], x=x, y=y)
tl = with(df[pick,], 
     ellipse(cor(x, y),scale=c(sd(x),sd(y)),
             centre=c(mean(x),mean(y))))
p3 <- p3 + geom_path(data=as.data.frame(tl), aes(x=x, y=y))
p3 <- p3 + stat_ellipse(level=0.95)
p3 # looks off center
p3 <- p3 + geom_point(aes(x=mean(x),y=mean(y),size=2,color="red"))
p3

সুতরাং এটি একই কেন্দ্র এবং ওরিয়েন্টেশনের কাছাকাছি হলেও তারা এক নয়। আপনি cov.trob()পাস করার জন্য পারস্পরিক সম্পর্ক এবং স্কেলটি ব্যবহার ellipse()করে এবং টি আর্গুমেন্টটি ব্যবহার করে স্কেলিংটিকে একটি এফ-ডিস্ট্রিবিউনের সমান সেট করার জন্য একই আকারের উপবৃত্তের কাছাকাছি আসতে পারেন stat_ellipse()

tcv = cov.trob(data[pick,2:3],cor=TRUE)
tl = with(df[pick,], 
          ellipse(tcv$cor[2,1],scale=sqrt(diag(tcv$cov)),
                  t=qf(0.95,2,length(x)-1),
                  centre=tcv$center))
p3 <- p3 + geom_path(data=as.data.frame(tl), aes(x=x, y=y,color="red"))
p3

তবে চিঠিপত্রটি এখনও সঠিক নয়। কোভেরিয়েন্স ম্যাট্রিক্সের কোলেস্কি পচন ব্যবহার এবং পারস্পরিক সম্পর্ক এবং স্ট্যান্ডার্ড বিচ্যুতি থেকে স্কেলিং তৈরি করার মধ্যে পার্থক্যটি অবশ্যই উত্থাপিত হবে। পার্থক্যটি ঠিক কোথায় তা দেখার জন্য আমি একজন গণিতবিদের পক্ষে যথেষ্ট নই।

কোনটি সঠিক? এটি আপনার সিদ্ধান্ত! stat_ellipse()বাস্তবায়ন, কম ও পার্শ্ববর্তী পয়েন্ট সংবেদনশীল হতে প্রথম বেশি রক্ষণশীল হতে হবে।


1
এই প্রশ্নটি সমাধান করার জন্য আপনার সময় দেওয়ার জন্য অনেক ধন্যবাদ! এটা এখন আমার কাছে পরিষ্কার। Jose
josetanago

1
আমি প্লটগুলিতে উপবৃত্তাকার পছন্দ করি, সুতরাং এই ফাংশনগুলি কার্যত দেখলে মজা লাগছিল।
এটিরেটু - মোনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.