Grad স্কুল এক বছর পরে, "পরিমেয় লিস্ট স্কোয়ার" এর আমার বোঝার নিম্নলিখিত হল: দিন y∈Rn , X কিছু হতে n×p নকশা ম্যাট্রিক্স, একটি প্যারামিটার হতে ভেক্টর, একটি ত্রুটি ভেক্টর হতে যেমন যে , যেখানে এবং । তারপরে
β∈Rpϵ∈Rnϵ∼N(0,σ2V)V=diag(v1,v2,…,vn)σ2>0
y=Xβ+ϵ
অনুমানের অধীনে "ওজনযুক্ত সর্বনিম্ন স্কোয়ার" মডেল বলা হয়। ডাব্লুএলএস সমস্যাটি সমাপ্তি
করুন
\ mathbf {y} = \ শুরু {bmatrix } y_1 & \ বিন্দু & y_n \ শেষ {bmatrix} ^ {টি} ,
\ boldsymbol \ বিটা = \ শুরু {bmatrix} \ beta_1 & \ বিন্দু & \ beta_p \ শেষ {bmatrix} ^ {টি} , এবং
\ mathbf {x } = \ শুরু {বম্যাট্রিক্স} x_ {11} & \ সিডটস এবং x_ {1 পি} \\ x_ {21} & d সিডটস এবং x_ {2 পি} \\ \ ভিডটস & d ভিডটস & \ ভিডটস \\ x_ {n1} & d সিডটস এবং এক্স_ {এনপি} \ এন্ড {বম্যাট্রিক্স} = \ শুরু {বম্যাট্রিক্স \ th ম্যাথবিএফ {এক্স} _ {1} ^ {টি} \\ \ টি ম্যাথবিএফ {এক্স} _ {2} ^ {টি} \\ \ ভিডটস \ th mathbf {x} _ {n} ^ {T} \ শেষ {bmatrix} \ পাঠ্য {{argminβ(y−Xβ)TV−1(y−Xβ).
y=[y1…yn]Tβ=[β1…βp]TX=⎡⎣⎢⎢⎢⎢⎢x11x21⋮xn1⋯⋯⋮⋯x1px2p⋮xnp⎤⎦⎥⎥⎥⎥⎥=⎡⎣⎢⎢⎢⎢⎢xT1xT2⋮xTn⎤⎦⎥⎥⎥⎥⎥.
xTiβ∈R1 , সুতরাং
y−Xβ=⎡⎣⎢⎢⎢⎢⎢y1−xT1βy2−xT2β⋮yn−xTnβ⎤⎦⎥⎥⎥⎥⎥.
এটি
\ start {align} (\ mathbf {y} - th mathbf {X} \ boldsymbol \ beta) {} T} gives দেয় gives
mathbf {V} ^ {- 1} & = \ start {bmatrix} y_1- \ mathbf {x} _ {1} ^ {T} \ boldsymbol \ beta & y_2- th mathbf {x} _ {2} ^} T} \ বোল্ডসাইম্বল \ বিটা ও d সিডটস এবং y_n- \ ম্যাথবিএফ {এক্স} _ {এন} ^ {টি} \ বোল্ডসিমবোল \ বিটা \ শেষ {বম্যাট্রিক্স \ \ পাঠ্য {ডায়াগ} (v_1 ^ {- 1}, ভি 2 ^ {- 1 }, \ বিন্দু, v_n ^ {- 1}) \\ & = \ শুরু {বম্যাট্রিক্স} v_1 ^ {- 1} (y_1- \ mathbf {x} _ {1} ^} টি} \ বোল্ডসাইম্বল \ বিটা) & v_2 ^ {-1} (y_2- \ mathbf {x} _ {2} ^ T} \ সাহসী স্মৃতি \ বিটা) & d সিডটস এবং(y−Xβ)TV−1=[y1−xT1βy2−xT2β⋯yn−xTnβ]diag(v−11,v−12,…,v−1n)=[v−11(y1−xT1β)v−12(y2−xT2β)⋯v−1n(yn−xTnβ)]
v_n ^ {- 1} (y_n- \ mathbf {x} _ {n} ^ {T} \ boldsymbol \ beta) \ শেষ {bmatrix \ \ end {align}
এভাবে প্রদান
argminβ(y−Xβ)TV−1(y−Xβ)=argminβ∑i=1nv−1i(yi−xTiβ)2.
β অনুমান করা হয়
β^=(XTV−1X)−1XTV−1y.
I আমি যে জ্ঞানের সাথে পরিচিত সেটির এটিই পরিধি। আমাকে কখনই শিখানো হয়নি যে কীভাবে
v1,v2,…,vn নির্বাচন করা উচিত, যদিও মনে হয়,
এখানে বিচার করে , সাধারণত
\ পাঠ্য {ভার} (\ সাহসী মাইন্ডস \ এপসিলন Var(ϵ)=diag(σ21,σ22,…,σ2n), যা স্বজ্ঞাত অর্থে তোলে। (ডাব্লুএলএস সমস্যায় অত্যন্ত পরিবর্তনশীল ওজন কম ওজন দিন এবং কম পরিবর্তনশীল বেশি ওজন সহ পর্যবেক্ষণ দিন))
আমি যে বিষয়ে বিশেষভাবে আগ্রহী তা হ'ল যখন ওজনকে পূর্ণসংখ্যার হিসাবে নির্ধারিত করা হয় তখন ফাংশনে R
ওজন কীভাবে পরিচালনা করা lm()
হয়। ব্যবহার থেকে ?lm
:
অ- NULL
ওজনকে বিভিন্ন পর্যবেক্ষণের বিভিন্ন রূপ রয়েছে তা বোঝাতে ব্যবহার করা যেতে পারে (ওজনের মানগুলির সাথে বৈকল্পিকগুলির সাথে বিপরীত অনুপাত হয়); বা সমতুল্যভাবে, যখন ওজনের উপাদানগুলি ধনাত্মক পূর্ণসংখ্যার , প্রতিটি প্রতিক্রিয়া হ'ল ইউনিট-ওজন পর্যবেক্ষণের মাধ্যম (যে ক্ষেত্রে
পর্যবেক্ষণ সমান এবং ডেটা সংক্ষিপ্ত করা হয়েছে) সহ)wiyiwiwiyi
আমি এই অনুচ্ছেদটি বেশ কয়েকবার পুনরায় পড়েছি এবং এটি আমার কাছে বোধগম্য নয়। আমি উপরে যে ফ্রেমওয়ার্কটি বিকাশ করেছি তা ব্যবহার করে, ধরুন আমার কাছে নিম্নলিখিত সিমুলেটেড মান রয়েছে:
x <- c(0, 1, 2)
y <- c(0.25, 0.75, 0.85)
weights <- c(50, 85, 75)
lm(y~x, weights = weights)
Call:
lm(formula = y ~ x, weights = weights)
Coefficients:
(Intercept) x
0.3495 0.2834
আমি উপরে যে কাঠামোটি তৈরি করেছি তা ব্যবহার করে, এই পরামিতিগুলি কীভাবে উত্পন্ন হয়? এখানে হাতে এই কাজ আমার প্রয়াস আছে: অভিমানী , আমরা
এবং এটি প্রদান করে (নোট করুন যে ইনভার্টিবিলিটি এই ক্ষেত্রে কাজ করে না, তাই আমি একটি সাধারণ বিপরীত ব্যবহার করেছি):V=diag(50,85,75)
[β^0β^1]=⎛⎝⎜⎜⎡⎣⎢111111⎤⎦⎥diag(1/50,1/85,1/75)⎡⎣⎢111111⎤⎦⎥T⎞⎠⎟⎟−1⎡⎣⎢111111⎤⎦⎥Tdiag(1/50,1/85,1/75)⎡⎣⎢0.250.750.85⎤⎦⎥
R
X <- matrix(rep(1, times = 6), byrow = T, nrow = 3, ncol = 2)
V_inv <- diag(c(1/50, 1/85, 1/75))
y <- c(0.25, 0.75, 0.85)
library(MASS)
ginv(t(X) %*% V_inv %*% X) %*% t(X) %*% V_inv %*% y
[,1]
[1,] 0.278913
[2,] 0.278913
এগুলি lm()
আউটপুট থেকে মানগুলির সাথে মেলে না । আমি কি ভুল করছি?