নীচে মহালানোবিসের দূরত্ব সম্পর্কে আমার বিবরণটি মহালানোবিসের দূরত্বের শীর্ষের ব্যাখ্যা পর্যন্ত? দুটি মূল ফলাফল অন্তর্ভুক্ত:
সংজ্ঞা অনুসারে, রেজিস্ট্রারগুলি সমানভাবে স্থানান্তরিত হলে এটি পরিবর্তন হয় না।
ভেক্টর মধ্যে মহলানবিশ দূরত্ব ছক এবং দেওয়া হয় যেখানে ডেটার সহভেদাংক হয়।xyD2(x,y)=(x−y)′Σ−1(x−y)
Σ
(1) আমাদের নিবন্ধকের মাধ্যমগুলি সমস্ত শূন্য বলে ধরে নিতে সহায়তা করে। এটি গণনা করা । তবে দাবিটি সত্য হওয়ার জন্য আমাদের আরও একটি অনুমান যুক্ত করতে হবে:hi
মডেলটিতে অবশ্যই একটি বাধা অন্তর্ভুক্ত করা উচিত।
এই জন্য, যার ফলে দিন সেখানে regressors এবং ডেটা, regressor মান লেখা পর্যবেক্ষণ জন্য যেমন । এই কলাম ভেক্টর যাক regressor মান লেখা যেতে এবং এইসব সারি ভেক্টর পর্যবেক্ষণ মান লেখা যেতে । তারপরে মডেল ম্যাট্রিক্স হয়k≥0njixijnjx,jkixi
X=⎛⎝⎜⎜⎜⎜11⋮1x11x21⋮xn1⋯⋯⋮⋯x1kx2k⋮xnk⎞⎠⎟⎟⎟⎟
এবং, সংজ্ঞা অনুসারে, টুপি ম্যাট্রিক্স হয়
H=X(X′X)−1X′,
তির্যক বরাবর কোথা থেকে প্রবেশi
hi=hii=(1;xi)(X′X)−1(1;xi)′.(1)
কেন্দ্রীয় ম্যাট্রিক্স বিপরীতমুখীভাবে কাজ করা ছাড়া আর কিছুই নেই - তবে প্রথম মূল ফলাফল অনুসারে এটি সহজ, বিশেষত যখন আমরা এটি ব্লক-ম্যাট্রিক্স আকারে লিখি:
X′X=n(100′C)
যেখানে এবং0=(0,0,…,0)′
Cjk=1n∑i=1nxijxik=n−1nCov(xj,xk)=n−1nΣjk.
(আমি লিখেছি জন্য নমুনা regressors কোভ্যারিয়েন্স ম্যাট্রিক্স।) কারণ এই ব্লক তির্যক, তার বিপরীত খুঁজে পাওয়া যেতে পারে কেবল ব্লক ইনভার্টারিং দ্বারা:Σ
(X′X)−1=1n(100′C−1)=(1n00′1n−1Σ−1).
সংজ্ঞা আমরা পাই(1)
hi=(1;xi)(1n00′1n−1Σ−1)(1;xi)′=1n+1n−1xiΣ−1x′i=1n+1n−1D2(xi,0).
স্কোয়ারের মহালানোবিসের দৈর্ঘ্যের জন্য সমাধান করা ফলনD2i=D2(xi,0)
D2i=(n−1)(hi−1n),
Qed ।
পিছনে ফিরে তাকালে, আমরা একটি ইন্টারসেপ্টের উপস্থিতিতে সংযোজনীয় শব্দটি সনাক্ত করতে পারি, যা ম্যাট্রিক্স মডেলগুলির মধ্যে কলামগুলি প্রবর্তন করে । গুণনশীল মেয়াদ মহলানবিশ দূরত্ব অভিমানী পর হাজির ব্যবহার করে গণনা করা হবে নমুনা সহভেদাংক অনুমান (যা দ্বারা স্কোয়ার এবং পণ্য অঙ্কের ভাগ ) বদলে ডাটা সহভেদাংক ম্যাট্রিক্স (যা বর্গের সমষ্টি বিভেদ সৃষ্টি করেন এবং পণ্য দ্বারা )।1/nXn−1এন - 1 এনn−1n
এই বিশ্লেষণের প্রধান মূল্য হ'ল লিভারেজের জন্য জ্যামিতিক ব্যাখ্যা প্রদান করা হয়, যা পর্যবেক্ষণের সময় প্রতিক্রিয়াতে ইউনিট কতটা পরিবর্তন করে তা পর্যবেক্ষণের উপযুক্ত মানকে পরিবর্তন করব: উচ্চ-উত্তোলন পর্যবেক্ষণ সেন্ট্রয়েড থেকে বড় মহালানোবিস দূরত্বে রয়েছে রেজিস্ট্রারগুলির মধ্যে, ঠিক যেমন একটি যান্ত্রিকভাবে দক্ষ লিভারটি তার পুরো অংশ থেকে একটি বিশাল দূরত্বে কাজ করে।i
আর কোডটি দেখানোর জন্য যে সম্পর্কটি প্রকৃতপক্ষে রয়েছে:
x <- mtcars
# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))
# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)
# Compare.
all.equal(M, D2) # TRUE
print(signif(cbind(M, D2), 3))