মহালানোবিসের দূরত্ব এবং লিভারেজের মধ্যে সম্পর্ক প্রমাণ করুন?


12

আমি উইকিপিডিয়ায় সূত্র দেখেছি যা মহালানোবিসের দূরত্ব এবং উত্সাহ সম্পর্কিত:

মহলানবিশ দূরত্ব ঘনিষ্ঠভাবে লিভারেজ পরিসংখ্যাত, সঙ্গে সম্পর্কযুক্ত , কিন্তু একটি ভিন্ন স্কেল রয়েছে:h

D2=(N1)(h1N).

একটি লিঙ্ক নিবন্ধ , উইকিপিডিয়া বর্ণনা এই শর্তাবলীতে:h

লিনিয়ার রিগ্রেশন মডেলটিতে, ডেটা ইউনিটের লিভারেজের স্কোরটি এই হিসাবে সংজ্ঞায়িত করা হয়: টুপি ম্যাট্রিক্স এর তির্যক উপাদান , যেখানে the ম্যাট্রিক্স ট্রান্সপোজকে বোঝায়।ith

hii=(H)ii,
ithH=X(XX)1X

আমি কোথাও একটি প্রমাণ খুঁজে পাচ্ছি না। আমি সংজ্ঞা থেকে শুরু করার চেষ্টা করেছি তবে আমি কোনও অগ্রগতি করতে পারি না। কেউ কি কিছু ইঙ্গিত দিতে পারে?

উত্তর:


11

নীচে মহালানোবিসের দূরত্ব সম্পর্কে আমার বিবরণটি মহালানোবিসের দূরত্বের শীর্ষের ব্যাখ্যা পর্যন্ত? দুটি মূল ফলাফল অন্তর্ভুক্ত:

  1. সংজ্ঞা অনুসারে, রেজিস্ট্রারগুলি সমানভাবে স্থানান্তরিত হলে এটি পরিবর্তন হয় না।

  2. ভেক্টর মধ্যে মহলানবিশ দূরত্ব ছক এবং দেওয়া হয় যেখানে ডেটার সহভেদাংক হয়।xy

    D2(x,y)=(xy)Σ1(xy)
    Σ

(1) আমাদের নিবন্ধকের মাধ্যমগুলি সমস্ত শূন্য বলে ধরে নিতে সহায়তা করে। এটি গণনা করা । তবে দাবিটি সত্য হওয়ার জন্য আমাদের আরও একটি অনুমান যুক্ত করতে হবে:hi

মডেলটিতে অবশ্যই একটি বাধা অন্তর্ভুক্ত করা উচিত।

এই জন্য, যার ফলে দিন সেখানে regressors এবং ডেটা, regressor মান লেখা পর্যবেক্ষণ জন্য যেমন । এই কলাম ভেক্টর যাক regressor মান লেখা যেতে এবং এইসব সারি ভেক্টর পর্যবেক্ষণ মান লেখা যেতে । তারপরে মডেল ম্যাট্রিক্স হয়k0njixijnjx,jkixi

X=(1x11x1k1x21x2k1xn1xnk)

এবং, সংজ্ঞা অনুসারে, টুপি ম্যাট্রিক্স হয়

H=X(XX)1X,

তির্যক বরাবর কোথা থেকে প্রবেশi

(1)hi=hii=(1;xi)(XX)1(1;xi).

কেন্দ্রীয় ম্যাট্রিক্স বিপরীতমুখীভাবে কাজ করা ছাড়া আর কিছুই নেই - তবে প্রথম মূল ফলাফল অনুসারে এটি সহজ, বিশেষত যখন আমরা এটি ব্লক-ম্যাট্রিক্স আকারে লিখি:

XX=n(100C)

যেখানে এবং0=(0,0,,0)

Cjk=1ni=1nxijxik=n1nCov(xj,xk)=n1nΣjk.

(আমি লিখেছি জন্য নমুনা regressors কোভ্যারিয়েন্স ম্যাট্রিক্স।) কারণ এই ব্লক তির্যক, তার বিপরীত খুঁজে পাওয়া যেতে পারে কেবল ব্লক ইনভার্টারিং দ্বারা:Σ

(XX)1=1n(100C1)=(1n001n1Σ1).

সংজ্ঞা আমরা পাই(1)

hi=(1;xi)(1n001n1Σ1)(1;xi)=1n+1n1xiΣ1xi=1n+1n1D2(xi,0).

স্কোয়ারের মহালানোবিসের দৈর্ঘ্যের জন্য সমাধান করা ফলনDi2=D2(xi,0)

Di2=(n1)(hi1n),

Qed

পিছনে ফিরে তাকালে, আমরা একটি ইন্টারসেপ্টের উপস্থিতিতে সংযোজনীয় শব্দটি সনাক্ত করতে পারি, যা ম্যাট্রিক্স মডেলগুলির মধ্যে কলামগুলি প্রবর্তন করে । গুণনশীল মেয়াদ মহলানবিশ দূরত্ব অভিমানী পর হাজির ব্যবহার করে গণনা করা হবে নমুনা সহভেদাংক অনুমান (যা দ্বারা স্কোয়ার এবং পণ্য অঙ্কের ভাগ ) বদলে ডাটা সহভেদাংক ম্যাট্রিক্স (যা বর্গের সমষ্টি বিভেদ সৃষ্টি করেন এবং পণ্য দ্বারা )।1/nXn1এন - 1 এনn1n


এই বিশ্লেষণের প্রধান মূল্য হ'ল লিভারেজের জন্য জ্যামিতিক ব্যাখ্যা প্রদান করা হয়, যা পর্যবেক্ষণের সময় প্রতিক্রিয়াতে ইউনিট কতটা পরিবর্তন করে তা পর্যবেক্ষণের উপযুক্ত মানকে পরিবর্তন করব: উচ্চ-উত্তোলন পর্যবেক্ষণ সেন্ট্রয়েড থেকে বড় মহালানোবিস দূরত্বে রয়েছে রেজিস্ট্রারগুলির মধ্যে, ঠিক যেমন একটি যান্ত্রিকভাবে দক্ষ লিভারটি তার পুরো অংশ থেকে একটি বিশাল দূরত্বে কাজ করে।i


আর কোডটি দেখানোর জন্য যে সম্পর্কটি প্রকৃতপক্ষে রয়েছে:

x <- mtcars

# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))

# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)

# Compare.
all.equal(M, D2)               # TRUE
print(signif(cbind(M, D2), 3))

দুর্দান্ত উত্তর, কঠোরতা এবং স্বজ্ঞাততা সহ খুব ভাল ed চিয়ার্স!
সিগ্রুডজ

পোস্ট @ শুবারের জন্য ধন্যবাদ! স্যানিটি চেক করার জন্য, এখানে আর কোডটি দেখানোর জন্য এখানে সম্পর্কটি প্রকৃতপক্ষে ধারণ করেছে: x <- এমটিকার্স রওনাম (এক্স) <- নুল কলনাম (এক্স) <- নল এন <- নরো (এক্স) এইচ <- টুপি (এক্স, টি) মহালানোবিস (এক্স, কোলিমিয়ানস (এক্স), কোভ (এক্স)) (এন -1) * (এইচ - 1 / এন) all.equal (মহালানোবিস (এক্স, কোলমিনস (এক্স), কোভ (এক্স)), (এন-1 ) * (এইচ - 1 / এন))
তাল গালি

1
@ টাল আমি মনে করি না যে আমার একটি স্যানিটি চেক দরকার - তবে কোডটির জন্য আপনাকে ধন্যবাদ। :-) আমি এটির এবং এর আউটপুটটি একটু স্পষ্ট করতে পরিবর্তন করেছি।
whuber

1
@ হুবুহু, আমি একটি উদাহরণ চেয়েছিলাম যা দেখায় যে কীভাবে সাম্যতা কাজ করে (আমার কাছে পরিষ্কার করে দেওয়া যে আমি অনুমানগুলি সঠিকভাবে পেয়েছি)। আমি প্রাসঙ্গিক উইকি এন্ট্রিটিও প্রসারিত করেছি: en.wikedia.org/wiki/… (আপনি যেভাবে ফিট দেখছেন সেখানেও এটি ব্যয় করতে নির্দ্বিধায় :))
তাল গ্যালি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.