আর-স্কোয়ারের শর্তসাপেক্ষ প্রত্যাশা


18

সাধারণ লিনিয়ার মডেলটি বিবেচনা করুন:

yy=Xββ+ϵ

যেখানে ϵii.i.d.N(0,σ2) এবং XRn×p ,p2 এবংX এর ধ্রুবকের কলাম রয়েছে contains

আমার প্রশ্ন, দেওয়া হয় E(XX) , β এবং σ , একটি অ তুচ্ছ উপরের উপর আবদ্ধ জন্য একটি সূত্র E(R2) *? (ধরে নিলাম মডেলটি ওএলএস দ্বারা অনুমান করা হয়েছিল)।

* আমি ধরে নিয়েছি, এটি লিখেছিলাম যে E(R2) নিজেই সম্ভব হবে না।

EDIT1

স্টাফেন লরেন্ট দ্বারা উত্পন্ন দ্রবণটি ব্যবহার করে (নীচে দেখুন) আমরা উপর একটি তুচ্ছ ওভার বেঁধে পেতে পারি E(R2)। কিছু সংখ্যাসূচক সিমুলেশন (নীচে) দেখায় যে এই সীমাটি আসলে বেশ শক্ত।

স্টাফেন লরেন্ট নিম্নলিখিত উত্পন্ন: R2B(p1,np,λ) যেখানে B(p1,np,λ) অ-কেন্দ্রীভূত প্যারামিটার সহ একটি অ-কেন্দ্রীয় বিটা বিতরণ λ সহ

λ=||XβE(X)β1n||2σ2

সুতরাং

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

যেখানে হ'ল একটি কেন্দ্রিয় χ 2 যার সাথে প্যারামিটার λ এবং কে ডিগ্রি স্বাধীনতা রয়েছে। সুতরাং ( আর 2 ) এর জন্য একটি তুচ্ছ ত্রিভুজ বাউন্ড হয়χk2(λ)χ2λkE(R2)

λ+p1λ+n1

এটি খুব আঁটসাঁট (আমি যা আশা করেছিলাম তার চেয়ে অনেক বেশি শক্ত হওয়া সম্ভব হবে):

উদাহরণস্বরূপ, ব্যবহার করে:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

গড় 1000 সিমিউলেশন হয় । উপরের তাত্ত্বিক উপরের আবদ্ধ দেয় । সীমাটি 2 টির অনেকগুলি মানকে সমানভাবে সুনির্দিষ্ট বলে মনে হচ্ছে । সত্যিই অবাক!R20.9608190.9609081R2

EDIT2:

আরো গবেষণার পর মনে হচ্ছে, যে ঊর্ধ্বসীমা পড়তা মান ভাল হিসাবে পাবেন λ + + P বাড়ে (এবং সব অন্য সমান λ সঙ্গে বাড়ে এন )।E(R2)λ+pλn


এর কেবলমাত্র এন এবং পি এর উপর নির্ভর করে পরামিতিগুলির সাথে একটি বিটা বিতরণ রয়েছে। না? R2np
স্টাফেন লরেন্ট

1
ওওপ্পস দুঃখিত, আমার আগের দাবিটি কেবল "নাল মডেল" (কেবলমাত্র বিরতি) এর অনুমানের অধীনে সত্য। অন্যথায় বিতরণটি অজানা প্যারামিটারগুলির সাথে জড়িত একটি কেন্দ্রীভূত প্যারামিটার সহ একটি কেন্দ্রহীন বিটা বিতরণের মতো কিছু হওয়া উচিত। R2
স্টাফেন লরেন্ট

@ স্টাফেনলরেন্ট: ধন্যবাদ আপনি কি অজানা প্যারামিটার এবং বিটার পরামিতিগুলির মধ্যে সম্পর্ক সম্পর্কে আরও জানতে পারবেন? আমি আটকে আছি, সুতরাং যে কোনও পয়েন্টারটি স্বাগতম! ...
ব্যবহারকারী 60

আপনার কি সাথে ডিল করার দরকার আছে ? সম্ভবত [ আর 2 / ( 1 - আর 2 ) ] এর জন্য একটি সাধারণ সঠিক সূত্র রয়েছে । E[R2]E[R2/(1R2)]
স্টাফেন লরেন্ট

1
আমার উত্তরের স্বরলিপিগুলির সাথে, কিছু স্কেলার কে এবং অ কেন্দ্রিক এফ- বিতরণের প্রথম মুহুর্তটি সহজ। R2/(1R2)=kFkF
স্টাফেন লরেন্ট

উত্তর:


13

কোন রৈখিক মডেল লিখিত যাবে যেখানে জি উপর আদর্শ সাধারন বন্টনের হয়েছে আর এন এবং μ একটি রৈখিক subspace অন্তর্গত বলে ধরা হয় ওয়াট এর আর এন । আপনার ক্ষেত্রে ডাব্লু = ইম ( এক্স )Y=μ+σGGRnμWRnW=Im(X)

যাক এক-মাত্রিক রৈখিক subspace ভেক্টর দ্বারা উত্পন্ন হতে ( 1 , 1 , ... , 1 ) । গ্রহণ ইউ = [ 1 ] নীচে আর 2 অত্যন্ত শাস্ত্রীয় ফিশার পরিসংখ্যাত সঙ্গে সম্পর্কযুক্ত এফ = পি জেড ওয়াই 2 / ( মি - )[1]W(1,1,,1)U=[1]R2 অনুমান পরীক্ষার জন্যএইচ0:{μইউ}যেখানেইউওয়াটএকটি রৈখিক subspace, এবং বাচক জেড=ইউওয়াটএর লম্ব সম্পূরকইউমধ্যেওয়াট, এবং বাচকমি=অস্পষ্ট(ওয়াট)এবং=অস্পষ্ট(ইউ)

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U) (তারপরে আপনার পরিস্থিতিতে = পি এবং= 1 )।m=p=1

আসলে, কারণ সংজ্ঞাআর2হয় আর2=পি জেড ওয়াই 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

Obviously PZY=PZμ+σPZG and PWY=σPWG.

When H0:{μU} is true then PZμ=0 and therefore

F=PZG2/(m)PWG2/(nm)Fm,nm
has the Fisher Fm,nm distribution. Consequently, from the classical relation between the Fisher distribution and the Beta distribution, R2B(m,nm).

In the general situation we have to deal with PZY=PZμ+σPZG when PZμ0. In this general case one has PZY2σ2χm2(λ), the noncentral χ2 distribution with m degrees of freedom and noncentrality parameter λ=PZμ2σ2, and then FFm,nm(λ) (noncentral Fisher distribution). This is the classical result used to compute power of F-tests.

The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. Finally R2 has the noncentral beta distribution with "shape parameters" m and nm and noncentrality parameter λ. I think the moments are available in the literature but they possibly are highly complicated.

Finally let us write down PZμ. Note that PZ=PWPU. One has PUμ=μ¯1 when U=[1], and PWμ=μ. Hence PZμ=μμ¯1 where here μ=Xβ for the unknown parameters vector β.


1
PZx is the orthogoanl projection of x on the linear subspace Z. And P denotes projection on the orthogonal.
Stéphane Laurent

1
Beware of PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
μ¯=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.