মাল্টিভারিয়েট স্বাভাবিক বিতরণের কোয়ান্টাইলগুলি (আইসোলাইনস) কীভাবে নির্ধারণ করবেন?


24

এখানে চিত্র বর্ণনা লিখুন

আমি আগ্রহী যে কেউ কীভাবে বহুবিধ বিতরণের পরিমাণের গণনা করতে পারে। পরিসংখ্যানগুলিতে, আমি একটি প্রদত্ত অবিচ্ছিন্ন স্বাভাবিক বিতরণ (বাম) এর 5% এবং 95% কোয়ান্টাইল আঁকছি। ডান মাল্টিভারিয়েট স্বাভাবিক বিতরণের জন্য, আমি কল্পনা করছি যে এনালগটি এমন একটি আইসোলিন হবে যা ঘনত্বের ফাংশনের ভিত্তিটি ঘিরে ফেলে। প্যাকেজটি ব্যবহার করে এটি গণনা করার আমার চেষ্টার উদাহরণ নীচে রয়েছে mvtnorm- তবে কোনও সাফল্য হয়নি। আমি মনে করি মাল্টিভারিয়েট ডেনসিটি ফাংশনের ফলাফলের কনট্যুর গণনা করে এটি করা যেতে পারে তবে আমি ভাবছিলাম যে এর বাইরে অন্য কোনও বিকল্প রয়েছে ( যেমন , এনালগ qnorm)। আপনার সাহায্যের জন্য ধন্যবাদ.

উদাহরণ:

mu <- 5
sigma <- 2 
vals <- seq(-2,12,,100)
ds <- dnorm(vals, mean=mu, sd=sigma)

plot(vals, ds, t="l")
qs <- qnorm(c(0.05, 0.95), mean=mu, sd=sigma)
abline(v=qs, col=2, lty=2)


#install.packages("mvtnorm")
require(mvtnorm)
n <- 2
mmu <- rep(mu, n)
msigma <- rep(sigma, n)
mcov <- diag(msigma^2)
mvals <- expand.grid(seq(-2,12,,100), seq(-2,12,,100))
mvds <- dmvnorm(x=mvals, mean=mmu, sigma=mcov)

persp(matrix(mvds,100,100), axes=FALSE)
mvqs <- qmvnorm(0.95, mean=mmu, sigma=mcov, tail = "both") #?

#ex. plot   
png("tmp.png", width=8, height=4, units="in", res=400)
par(mfcol=c(1,2))

#univariate
plot(vals, ds, t="l")
qs <- qnorm(c(0.05, 0.95), mean=mu, sd=sigma)
abline(v=qs, col=2, lty=2)

#multivariate
pmat <- persp(seq(-2,12,,100), seq(-2,12,,100), matrix(mvds,100,100), axes=FALSE, shade=TRUE, lty=0)
cont <- contourLines(seq(-2,12,,100), seq(-2,12,,100), matrix(mvds,100,100), levels=0.05^2)
lines(trans3d(cont[[1]]$x, cont[[1]]$y, cont[[1]]$level, pmat), col=2, lty=2)

dev.off()

3
একটি ম্যাথামেটিকাল সমাধান দেওয়া (এবং 3D ক্ষেত্রে জন্য সচিত্র) এ হয় mathematica.stackexchange.com/questions/21396/... । এটি স্বীকৃতি দেয় যে কনট্যুর স্তরগুলি চি-স্কোয়ার বিতরণ দ্বারা দেওয়া হয়।
whuber

@ হুবুহু - "" ... আত্মবিশ্বাসের উপবৃত্তটি কোভেরিয়েন্স ম্যাট্রিক্সের বিপরীতমুখী একটি কনট্যুর "বলে আপনি কী বোঝাতে চাইছেন তা কি মনে করবে? চিয়ার্স।
মার্ক

2
এই এক মাত্রা, যেখানে "সহভেদাংক ম্যাট্রিক্স" (একটি স্যাম্পলিং বিতরণের জন্য) একটি সংখ্যা দেখতে সবচেয়ে সহজ পদ্ধিতি হল , তাই তার বিপরীত হয় 1 / s 2 , একটি দ্বিঘাত মানচিত্র হিসেবে ভাবা আর 1 মাধ্যমে এক্স এক্স 2 / গুলি 2 । পর্যায়ে কনট্যুর λ সংজ্ঞা দ্বারা সেট এক্স , যার জন্য x 2 / s 2 = λ ; অর্থাৎ x 2 = λ s 2 বা সমতুল্য x = ± √ √s21/s2R1xx2/s2λxx2/s2=λx2=λs2। যখনλহয়1-αএকটি এর সমাংশকχ2(1)বন্টন,x=±λsλ1αχ2(1) হয়1-αএকটি এর সমাংশকটি(1), বিতরণ কোথা আমরা স্বাভাবিক আস্থা সীমা পুনরুদ্ধার±টি 1 - α ; 1 এসλ1αt(1)±t1α;1s
হোবার

আপনি প্রথম সূত্র ব্যবহার করতে পারে এই চয়ন করে উত্তর মধ্যে ( 0 , 1 ) সংশ্লিষ্ট উপবৃত্তাকার প্রাপ্ত এস α কোন (লাল ড্যাশ আপনার প্লট মধ্যে লাইন) এক্সআর 2α(0,1)SαxR2
user603

উত্তর:


25

কনট্যুর লাইন একটি উপবৃত্তাকার। কারণটি হ'ল কারণ আপনাকে ক্ষতিকারক যুক্তির দিকে তাকাতে হবে, মাল্টিভারিয়েট সাধারণ বিতরণের পিডিএফ: আইসোলাইনগুলি একই যুক্তির সাথে লাইন হবে। তারপরে আপনি যেখানে Σ হল সমবায় ম্যাট্রিক্স। এটি হ'ল উপবৃত্তের সমীকরণ; সবচেয়ে সহজ ক্ষেত্রে, μ = ( 0 , 0 ) এবং Σ হ'ল তির্যক, যাতে আপনি পান ( এক্স)

(xμ)TΣ1(xμ)=c
Σμ=(0,0)Σ যদিdiaতির্যক না হয়, তির্যক হয় তবে আপনি একই ফল পাবেন।
(xσx)2+(yσy)2=c
Σ

এখন, আপনাকে উপবৃত্তের ভিতরে (বা বাইরে) মাল্টিভারিয়েটের পিডিএফ সংহত করতে হবে এবং অনুরোধ করতে হবে যে এটি আপনি চান সেই পরিমাণের সমান। ধরা যাক যে আপনার কোয়ান্টাইলগুলি স্বাভাবিকের মতো নয়, তবে নীতিগতভাবে উপবৃত্তাকার (যেমন টিম উত্তরটি দেখায় আপনি সর্বাধিক ঘনত্ব অঞ্চল, এইচডিআর সন্ধান করছেন)। আমি পিডিএফ-তে ভেরিয়েবলগুলি , কোণে সংহত করে এবং তারপরে z থেকে 0 থেকে √ করবz2=(x/σx)2+(y/σy)2z0 1-α=c তারপর আপনি বিকল্প গুলি = - z- র 2 / 2 :

1α=0cdzzez2/22π02πdθ=0czez2/2
s=z2/2
0czez2/2=c/20esds=(1ec/2)

সুতরাং নীতিগতভাবে, আপনাকে ll এবং কার্যকর ব্যাসার্ধের ইউজভেক্টরগুলির উপর অক্ষ সহ কেন্দ্রিক উপবৃত্তাকার সন্ধান করতে হবে - 2 এলএনμΣ : ( এক্স - μ ) টি Σ - 1 ( এক্স - μ ) = - 2 Ln α2lnα

(xμ)TΣ1(xμ)=2lnα

4

আপনি মাল্টিভারিয়েট স্বাভাবিক সম্পর্কে জিজ্ঞাসা করেছিলেন, তবে সাধারণভাবে "একটি মাল্টিভারিয়েট বিতরণের পরিমাণ হিসাবে" জিজ্ঞাসা করে আপনার প্রশ্নটি শুরু করেছিলেন started আপনার প্রশ্নের বাক্যে কথন এবং প্রদত্ত উদাহরণ থেকে মনে হচ্ছে যে আপনি আগ্রহী সর্বোচ্চ ঘনত্ব অঞ্চলে । এগুলি হ্যান্ডম্যান (1996) দ্বারা নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়েছে

যাক একটি এলোপাতাড়ি ভেরিয়েবলের ঘনত্ব ফাংশন হতে এক্স । তারপর 100 ( 1 - α ) % এই HDR উপসেট আর ( α ) নমুনা স্থান এক্স যেমন যেf(z)X100(1α)%R(fα)X

R(fα)={x:f(x)fα}

fαPr(XR(fα))1a

Y=f(x)fαPr(f(x)fα)1ααYy1,...,ymf(x)


হেন্ডম্যান, আরজে (1996)। সর্বোচ্চ ঘনত্ব অঞ্চলে গণনা এবং গ্রাফিং। আমেরিকান পরিসংখ্যানবিদ, 50 (2), 120-126।


2

2ln(α)

0czez2/2=c/20esds=(1ec/2)

1

আপনি মহালানোবিস দূরত্বের সাথে সম্পর্কিত একটি উপবৃত্ত আঁকতে পারেন।

library(chemometrics)
data(glass)
data(glass.grp)
x=glass[,c(2,7)]
require(robustbase)
x.mcd=covMcd(x)
drawMahal(x,center=x.mcd$center,covariance=x.mcd$cov,quantile=0.90)

বা প্রায় 95%, 75%, এবং 50% ডেটা চেনাশোনাগুলির সাথে

drawMahal(x,center=x.mcd$center,covariance=x.mcd$cov,quantile=c(0.95,.75,.5))

4
Welcome to the site @user98114. Can you provide some text to explicate what this code is doing & how it resolves the OP's issue?
gung - Reinstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.