মাল্টিভিয়ারেট স্বাভাবিক বিতরণটি গোলাকারভাবে প্রতিসম হয়। বন্টন আপনি ব্যাসার্ধ কাটছাঁট করে নেওয়া এ নিচের । এই মাপদণ্ডটি কেবলমাত্র দৈর্ঘ্যের উপর নির্ভর করে , ছাঁটাই হওয়া বিতরণটি গোলাকারভাবে প্রতিসাম্য রইল। যেহেতু গোলাকার কোণ থেকেএবং একটি বিতরণ রয়েছে , সুতরাং আপনি কেবল কয়েকটি সাধারণ পদক্ষেপে ছাঁটাই করা বিতরণ থেকে মানগুলি তৈরি করতে পারেন:Xρ=||X||2aXρX/||X||ρσχ(n)
জেনারেট করুন ।X∼N(0,In)
এ কাটা একটি বিতরণের বর্গমূল হিসাবে উত্পন্ন করুন ।Pχ2(d)(a/σ)2
যাক।Y=σPX/||X||
ধাপ 1 এ, একটি ক্রম হিসাবে প্রাপ্ত হয় একটি প্রমিত স্বাভাবিক পরিবর্তনশীল স্বাধীন উপলব্ধির।Xd
ধাপ 2 সালে নির্দ্ধিধায় সমাংশক ফাংশন ইনভার্টারিং দ্বারা উৎপন্ন হয় একটি এর বন্টন: একটি অভিন্ন পরিবর্তনশীল উৎপন্ন সীমার মধ্যে সমর্থিত (quantiles এর) মধ্যে এবং এবং সেট ।PF−1χ2(d)UF((a/σ)2)1P=F(U)−−−−−√
নীচে at কেটে কাটা এর জন্য এর জন্য এর স্বতন্ত্র উপলব্ধি এর একটি হিস্টগ্রাম এখানে । তৈরি করতে প্রায় এক সেকেন্ড সময় লেগেছিল, অ্যালগরিদমের দক্ষতার প্রমাণ দিয়ে।105σPσ=3n=11a=7
লাল বক্ররেখা tr দ্বারা মাপা একটি কাটা বিতরণের ঘনত্ব । হিস্টগ্রামের সাথে এর ঘনিষ্ঠ মিল এই কৌশলটির বৈধতার প্রমাণ isχ(11)σ=3
ছাঁটাই জন্য একটি অনুভূতি পেতে, যদি বিবেচনা , মধ্যে মাত্রা। বিপরীতে স্ক্র্যাপপ্লট এখানে রয়েছে ( স্বতন্ত্র উপলব্ধির জন্য)। এটি স্পষ্টভাবে ব্যাসার্ধের গর্তটি দেখায় :a=3σ=1n=2Y2Y1104a
পরিশেষে, দ্রষ্টব্য: (1) উপাদানগুলির অবশ্যই অভিন্ন বিতরণ থাকতে হবে (গোলাকার প্রতিসাম্যের কারণে) এবং (2) যখন ব্যতীত , সাধারণ বিতরণটি স্বাভাবিক নয়। বস্তুত, যেমন বৃহৎ বৃদ্ধি পাচ্ছে (univariate) সাধারন বন্টন দ্রুত হ্রাস বহুচলকীয় স্বাভাবিক spherically ছেঁটে ফেলা সম্ভাবনা অধিকাংশ পৃষ্ঠের কাছাকাছি ক্লাস্টারে ঘটায় -sphere (ব্যাসার্ধ্যের )। প্রান্তিক বিতরণ অবশ্যই ব্যবহূত বিতরণ আনুমানিক একটি আকারযুক্ত প্রতিসৃত বিটা আনুমানিক । এটি পূর্ববর্তী স্ক্রেটারপ্লোটে স্পষ্ট, যেখানেXia=0an−1a((n−1)/2,(n−1)/2)(−a,a)a=3σইতিমধ্যে দুটি মাত্রায় বড়: পয়েন্টগুলি ব্যাসার্ধ একটি রিং (একটি স্পিয়ার) লম্বা করে ।2−13σ
এখানে আকারের একটি সিমুলেশন থেকে প্রান্তিক ডিস্ট্রিবিউশন এর histograms হয় মধ্যে সঙ্গে মাত্রা , (যার জন্য approximating বিটা বন্টন অভিন্ন হয়):1053a=10σ=1(1,1)
যেহেতু প্রশ্নটিতে বর্ণিত পদ্ধতির প্রথম মার্জিনালগুলি স্বাভাবিক (নির্মাণের মাধ্যমে), তাই সেই পদ্ধতিটি সঠিক হতে পারে না।n−1
নিম্নলিখিত R
কোডটি প্রথম চিত্র তৈরি করেছে। এটি উত্পাদনের জন্য সমান্তরাল পদক্ষেপের জন্য 1-3 । এটা তোলে পরিবর্তন ভেরিয়েবল দ্বিতীয়টি চিত্রে জেনারেট করতে পরিবর্তন হয়েছিল , , , এবং এবং তারপর চক্রান্ত কমান্ডের পর তৈরি করেছিল।Ya
d
n
sigma
plot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010")
y
উচ্চতর সংখ্যাসূচক রেজোলিউশনের জন্য কোডটিতে এর প্রজন্মটি সংশোধিত হয়: কোডটি আসলে উত্পন্ন করে এবং এটি গণনা করতে ব্যবহার করে ।U1−UP
একটি অনুমিত অ্যালগরিদম অনুযায়ী ডেটা সিমুলেট করার একই কৌশল, একটি হিস্টোগ্রামের সাথে সংক্ষিপ্ত করে এবং হিস্টোগ্রামকে সুপারমোসিং করা প্রশ্নটিতে বর্ণিত পদ্ধতিটি পরীক্ষা করতে ব্যবহার করা যেতে পারে। এটি নিশ্চিত করবে যে পদ্ধতিটি প্রত্যাশার মতো কাজ করে না।
a <- 7 # Lower threshold
d <- 11 # Dimensions
n <- 1e5 # Sample size
sigma <- 3 # Original SD
#
# The algorithm.
#
set.seed(17)
u.max <- pchisq((a/sigma)^2, d, lower.tail=FALSE)
if (u.max == 0) stop("The threshold is too large.")
u <- runif(n, 0, u.max)
rho <- sigma * sqrt(qchisq(u, d, lower.tail=FALSE))
x <- matrix(rnorm(n*d, 0, 1), ncol=d)
y <- t(x * rho / apply(x, 1, function(y) sqrt(sum(y*y))))
#
# Draw histograms of the marginal distributions.
#
h <- function(z) {
s <- sd(z)
hist(z, freq=FALSE, ylim=c(0, 1/sqrt(2*pi*s^2)),
main="Marginal Histogram",
sub="Best Normal Fit Superimposed")
curve(dnorm(x, mean(z), s), add=TRUE, lwd=2, col="Red")
}
par(mfrow=c(1, min(d, 4)))
invisible(apply(y, 1, h))
#
# Draw a nice histogram of the distances.
#
#plot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010") # For figure 2
rho.max <- min(qchisq(1 - 0.001*pchisq(a/sigma, d, lower.tail=FALSE), d)*sigma,
max(rho), na.rm=TRUE)
k <- ceiling(rho.max/a)
hist(rho, freq=FALSE, xlim=c(0, rho.max),
breaks=seq(0, max(rho)+a, by=a/ceiling(50/k)))
#
# Superimpose the theoretical distribution.
#
dchi <- function(x, d) {
exp((d-1)*log(x) + (1-d/2)*log(2) - x^2/2 - lgamma(d/2))
}
curve((x >= a)*dchi(x/sigma, d) / (1-pchisq((a/sigma)^2, d))/sigma, add=TRUE,
lwd=2, col="Red", n=257)