পিডিএফ


15

ধরুন X1,X2,...,Xn থেকে N(μ,σ2) সাথে অজানা μR এবং σ2>0

যাক Z=X1X¯S,এস হ'ল মানক বিচ্যুতি।

এটি দেখানো যেতে পারে যে Z লেবেসগু পিডিএফ রয়েছে

f(z)=nΓ(n12)π(n1)Γ(n22)[1nz2(n1)2]n/22I(0,(n1)/n)(|Z|)

আমার প্রশ্ন তাহলে এই পিডিএফ কিভাবে পাব?

প্রশ্ন থেকে এখানে এর UMVUE এটি উদাহরণ 3.3.4 মধ্যে P(X1c) । আমি উমভিউইউ খুঁজে পেতে যুক্তি এবং পদ্ধতিগুলি বুঝতে পারি তবে পিডিএফ কীভাবে পেতে হয় তা জানি না।

আমি মনে করি এ প্রশ্নও এই সঙ্গে সম্পর্কযুক্ত এক

সহায়তার জন্য আপনাকে অনেক ধন্যবাদ বা সম্পর্কিত সম্পর্কিত উল্লেখগুলিও বরাদ্দ দেওয়া হবে।

উত্তর:


14

এই ফলাফলটির জন্য যা উদ্বেগজনক তা হ'ল এটি কতটা নির্ভর করে একটি সহসম্পূর্ণ সহগের বিতরণ। একটি কারণ আছে।


ধরুন শূন্য পারস্পরিক সম্পর্ক এবং সাধারণ ভ্যারিয়েন্স সঙ্গে bivariate স্বাভাবিক σ 2 উভয় ভেরিয়েবল জন্য। একটি আইডির নমুনা আঁকুন ( x 1 , y 1 ) , , ( x n , y n ) । এটি সুপরিচিত, এবং সহজেই জ্যামিতিকভাবে প্রতিষ্ঠিত হয়েছিল (যেমন ফিশার এক শতাব্দী আগে করেছিলেন) যে নমুনা পারস্পরিক সম্পর্ক সহগের বিতরণ(X,Y)σ2(x1,y1),,(xn,yn)

r=i=1n(xix¯)(yiy¯)(n1)SxSy

হয়

f(r)=1B(12,n21)(1r2)n/22, 1r1.

(Here, as usual, x¯ and y¯ are sample means and Sx and Sy are the square roots of the unbiased variance estimators.) B is the Beta function, for which

(1)1B(12,n21)=Γ(n12)Γ(12)Γ(n21)=Γ(n12)πΓ(n21).

গনা , আমরা মধ্যে ঘুর্ণন অধীনে তার invariance কাজে লাগান পারে আর এন দ্বারা উত্পন্ন লাইন প্রায় ( 1 , 1 , ... , 1 ) , একই ঘুর্ণন অধীনে নমুনা বিতরণের invariance সহ, এবং পছন্দ করে নিন Y আমি / এস y এমন কোনও ইউনিট ভেক্টর হতে হবে যার উপাদানগুলি শূন্য। এ জাতীয় একটি ভেক্টর v = এর সাথে আনুপাতিক ( এন - 1 , - 1 , , -rRn(1,1,,1)yi/Sy। এটির আদর্শ বিচ্যুতিv=(n1,1,,1)

Sv=1n1((n1)2+(1)2++(1)2)=n.

ফলস্বরূপ, এর একই বন্টন থাকতে হবেr

i=1n(xix¯)(viv¯)(n1)SxSv=(n1)x1x2xn(n1)Sxn=n(x1x¯)(n1)Sxn=nn1Z.

Therefore all we need to is rescale r to find the distribution of Z:

fZ(z)=|nn1|f(nn1z)=1B(12,n21)nn1(1n(n1)2z2)n/22

for |z|n1n. Formula (1) shows this is identical to that of the question.


Not entirely convinced? Here is the result of simulating this situation 100,000 times (with n=4, where the distribution is uniform).

Figure

The first histogram plots the correlation coefficients of (xi,yi),i=1,,4 while the second histogram plots the correlation coefficients of (xi,vi),i=1,,4) for a randomly chosen vector vi that remains fixed for all iterations. They are both uniform. The QQ-plot on the right confirms these distributions are essentially identical.

Here's the R code that produced the plot.

n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n)             # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")

Reference

R. A. Fisher, Frequency-distribution of the values of the correlation coefficient in samples from an indefinitely large population. Biometrika, 10, 507. See Section 3. (Quoted in Kendall's Advanced Theory of Statistics, 5th Ed., section 16.24.)


The link to the reference is broken.
Sextus Empiricus

@Martijn Thank you for checking. I see what you mean--the link works, but it doesn't go to anything relevant! I have fixed it up.
whuber

4

I'd like to suggest this way to get the pdf of Z by directly calculating the MVUE of P(Xc) using Bayes' theorem although it's handful and complex.

Since E[I(,c)(X1)]=P(X1c) and Z1=X¯, Z2=S2 are joint complete sufficient statistic, MVUE of P(Xc) would be like this:

ψ(z1,z2)=E[I(,c)(X1)|z1,z2]=I(,c)fX|Z1,Z2(x1|z1,z2)dx1

Now using Bayes' theorem, we get

fX|Z1,Z2(x1|z1,z2)=fZ1,Z2|X1(z1,z2|x1)fX1(x1)fZ1,Z2(z1,z2)

The denominator fZ1,Z2(z1,z2)=fZ1(z1)fZ2(z2) can be written in closed form because Z1N(μ,σ2n), Z2Γ(n12,2σ2n1) are independent of each other.

To get the closed form of numerator, we can adopt these statistics:

W1=i=2nXin1
W2=i=2nXi2(n1)W12(n1)1

which is the mean and the sample variance of X2,X3,...,Xn and they are independent of each other and also independent of X1. We can express these in terms of Z1,Z2.

W1=nZ1X1n1, W2=(n1)Z2+nZ12X12(n1)W12n2

We can use transformation while X1=x1,

fZ1,Z2|X1(z1,z2|x1)=nn2fW1,W2(w1,w2)=nn2fW1(w1)fW2(w2)

Since W1N(μ,σ2n1), W2Γ(n22,2σ2n2) we can get the closed form of this. Note that this holds only for w20 which restricts x1 to z1n1nz2x1z1+n1nz2.

So put them all together, exponential terms would disappear and you'd get,

fX|Z1,Z2(x1|z1,z2)=Γ(n12)πΓ(n22)nz2(n1)(1(n(x1z1)z2(n1))2)
where z1n1nz2x1z1+n1nz2 and zero elsewhere.

From this,at this point, we can get the pdf of Z=X1z1z2 using transformation.

By the way, the MVUE would be like this :

ψ(z1,z2)=Γ(n12)πΓ(n22)π2θccosn3θdθ
while θc=sin1(n(cz1)(n1)z1) and would be 1 if cz1+n1nz2

I am not a native English speaker and there could be some awkward sentences. I am studying statistics by myself with text book introduction to mathmatical statistics by Hogg. So there could be some grammatical or mathmatical conceptual mistakes. It would be appreciated if someone correct them.

Thank you for reading.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.