ডেটা ম্যাট্রিক্স জন্য কি


107

প্রদত্ত ডেটা ম্যাট্রিক্স (কলামে ভেরিয়েবল এবং সারিগুলিতে ডেটা পয়েন্ট সহ) এর জন্য মনে হয় যে পরিসংখ্যানগুলিতে গুরুত্বপূর্ণ ভূমিকা পালন করে। উদাহরণস্বরূপ, এটি সাধারণ ন্যূনতম স্কোয়ারগুলির বিশ্লেষণাত্মক সমাধানের একটি গুরুত্বপূর্ণ অঙ্গ। বা, পিসিএর জন্য, এর আইজেনভেেক্টরগুলি হ'ল ডেটার প্রধান উপাদান।টিAATA

আমি কীভাবে গণনা করব তা বুঝতে পেরেছি , তবে আমি ভাবছিলাম যে এই ম্যাট্রিক্সের প্রতিনিধিত্ব করে এমন একটি অন্তর্নিহিত ব্যাখ্যা আছে যা এর গুরুত্বপূর্ণ ভূমিকা নিয়ে যায়?ATA


2
Stats.stackexchange.com/a/66295/919 এ বিশ্লেষণ করে কিছু অন্তর্দৃষ্টি সাধ্য হতে পারে ।
whuber

উত্তর:


125

জ্যামিতিকভাবে ম্যাট্রিক্স স্কেলার পণ্যগুলির ম্যাট্রিক্স (= বিন্দু পণ্য, = অভ্যন্তরীণ পণ্য) বলা হয়। বীজগণিতভাবে, একে সম-অফ-স্কোয়ারস এবং ক্রস-পণ্যগুলি ম্যাট্রিক্স ( এসএসসিপি ) বলা হয়।AA

এর -th তির্যক উপাদানটি সমান , যেখানে এর তম কলামের মানগুলিকে বোঝায় এবং সারি জুড়ে যোগফল। -th বন্ধ-তির্যক উপাদান তাতে রয়েছে ।a 2 ( i ) a ( i ) i A i j a ( i ) a ( j )ia(i)2a(i)iAija(i)a(j)

এখানে অনেকগুলি গুরুত্বপূর্ণ এসোসিয়েশন সহগ রয়েছে এবং তাদের স্কোয়ার ম্যাট্রিকগুলিকে কৌণিক মিল বা এসএসসিপি-ধরণের মিল বলে:

  • এসএসসিপি ম্যাট্রিক্সকে দ্বারা , নমুনার আকার বা r বিএফ এর সারিগুলির সংখ্যা , আপনি এমএসসিপি (গড়-বর্গাকার এবং ক্রস-পণ্য) ম্যাট্রিক্স পাবেন। এই সমিতি পরিমাপের জোড়ের সূত্রটি তাই (ভেক্টর এবং সাথে এর কলামগুলির একটি জোড়া )।x ynA xyxynxyA

  • আপনি যদি কেন্দ্রীভূত এর কলাম (ভেরিয়েবল) , তারপর হয় ছিটান (অথবা সহ-ছিটান, যদি কঠোর হতে) ম্যাট্রিক্স এবং হল সহভেদাংক ম্যাট্রিক্স। সহভেদাংক এর pairwise সূত্র সঙ্গে এবং centerted কলাম বাচক।/ ( এন - ) সি এক্স সি ওয়াইAAAAA/(n1)xycxcyn1cxcy

  • আপনি Z- যদি প্রমিত এর কলাম (বিয়োগ কলাম গড় এবং মানক চ্যুতির দ্বারা বিভক্ত করা), তারপর পিয়ারসন হয় পারস্পরিক সম্পর্ক ম্যাট্রিক্স: পারস্পরিক সম্পর্ক প্রমিত ভেরিয়েবলের জন্য সহভেদাংক হয়। পারস্পরিক সম্পর্কের pairwise সূত্র সঙ্গে এবং প্রমিত কলাম বাচক। পারস্পরিক সম্পর্ককে রৈখিকতার সহগ বলা হয়।/ ( এন - 1 ) z x z yAAA/(n1) zxzyzxzyn1zxzy

  • যদি আপনি এর ইউনিট- স্কেল কলামগুলি (তাদের এসএস, সমষ্টিগুলির সমষ্টি 1 এ নিয়ে যান), তবে হ'ল কোসাইন মিলের ম্যাট্রিক্স। সমতুল্য pairwise সূত্র এইভাবে করছে বলে মনে হচ্ছে সঙ্গে এবং ও L2-সাধারণ কলাম বাচক । কোসিনের মিলকে অনুপাতের সহগ বলা হয়।ইউ এক্স ইউ ওয়াই = এক্স ওয়AAA uxuyuxuy=xyx2y2uxuy

  • আপনি যদি কেন্দ্রীভূত এবং তারপর unit- স্কেল এর কলাম , তারপর আবার পিয়ারসন হয় পারস্পরিক সম্পর্ক ম্যাট্রিক্স, কারণ পারস্পরিক সম্পর্ক কেন্দ্রিক ভেরিয়েবলের জন্য কোসাইন হয় 1 , 2 : Σ তোমার দর্শন লগ করা এক্সতোমার দর্শন লগ করা Y = Σ এক্স YAAA1,2cuxcuy=cxcycx2cy2

এই চারটি মূল সমিতির ব্যবস্থার পাশাপাশি এটিকে শীর্ষে রাখার জন্য আসুন আমরা এর ভিত্তিতে আরও কিছু উল্লেখ করতে পারি। এগুলি কোসাইন মিলের বিকল্প হিসাবে দেখা যেতে পারে কারণ তারা সূত্রের ডিনমিনেটর থেকে এটি স্বাভাবিককরণ থেকে আলাদা গ্রহণ করে:AA

  • এর সহগ পরিচয় [Zegers & দশ Berge, 1985] গাণিতিক আকারে তার হর হয়েছে বরং জ্যামিতিক গড় চেয়ে বলতে চাইছেন: । এটি 1 হতে পারে এবং কেবল যদিAএরতুলনা করা কলামগুলিঅভিন্ন হয়।xy(x2+y2)/2A

  • এর মতো অন্য ব্যবহারযোগ্য সহগকে সমতা অনুপাত বলা হয় : xyx2+y2xy=xyxy+(xy)2

  • শেষ অবধি , যদি এর মানগুলি অবৈজ্ঞানিক হয় এবং কলামগুলির মধ্যে তাদের যোগফল 1 হয় (যেমন তারা অনুপাত হয়), তবে A হলবিশ্বস্ততাবাভট্টাচার্যসহগেরম্যাট্রিক্স।AA


একাধিক পরিসংখ্যান বা কোভেরিয়েন্স ম্যাট্রিক্স গণনা করার জন্য, যা অনেক স্ট্যাটিস্টিকাল প্যাকেজগুলি ব্যবহার করে, তথ্যকে কেন্দ্র করে বাইপাস করে এসএসসিপি ম্যাট্রিক্স থেকে সরাসরি প্রস্থান করে। যাক গুলি ডেটা কলাম অঙ্কের সারি ভেক্টর হতে একজন যখন এন তথ্য সারি সংখ্যা। তারপর (1) গনা যেমন ছিটান ম্যাট্রিক্স সি = একটি ' একজন - গুলি ' গুলি / এন [সেখান সি / ( এন - 1 ) সহভেদাংক ম্যাট্রিক্স হবে]; (2) এর তির্যক1AAsAnC=AAss/nC/(n1)Cস্কোয়ার বিচ্যুতির পরিমাণ, সারি ভেক্টর ; (3) গণনা সম্পর্কিত ম্যাট্রিক্স আর = সি / dR=C/dd

একজন তীব্র কিন্তু পরিসংখ্যানগতভাবে নবীন পাঠক পারস্পরিক সম্পর্কের দুটি সংজ্ঞা মিলিয়ে নিতে অসুবিধাজনক হতে পারে - "covariance" হিসাবে (যার মধ্যে নমুনা আকারের গড় হিসাবে অন্তর্ভুক্ত থাকে,ডিএফ= "এন -1"দ্বারা বিভাজন) এবং "কোসাইন" হিসাবে (যা কোনও বোঝায় না যেমন গড়)। তবে বাস্তবে পারস্পরিক সম্পর্কের প্রথম সূত্রে কোনও গড় গড় হয় না। জিনিস যে স্ট্যান্ড। বিচ্যুতি, যার মাধ্যমে জেড-মানিকরণ অর্জন করা হয়েছিল, একইডিএফদ্বারা বিভাজনের সাথে গণনা করা হয়েছিল; এবং সুতরাং সংশ্লেষ-সম-কোভেরিয়েন্স সূত্রের ডিনোমিনেটর সম্পূর্ণভাবে বাতিল করে যদি আপনি সূত্রটি মোড়ক করেন:সূত্রটি কোসাইনের সূত্রে রূপান্তরিত হয়। পরীক্ষামূলক পারস্পরিক সম্পর্কের মান গণনা করার জন্য আপনাকে n জানতেহবেনা2n (কেন্দ্রের সাথে গড়ের গণনা করার সময় বাদে)।


42

ম্যাট্রিক্স সমস্ত সকল কলাম ভেতরের পণ্য রয়েছে একটি । তির্যকটি এইভাবে কলামগুলির বর্গক্ষেত্রের নিয়মাবলী ধারণ করে। আপনি জ্যামিতি এবং লম্ব অনুমান কলাম দ্বারা দৃশ্যও কলাম স্থান সম্মুখের সম্পর্কে যদি মনে করেন একটি আপনি প্রত্যাহার করতে পারে যে নিয়ম ও ভেক্টর এই স্থান spanning অভ্যন্তরীণ পণ্য প্রজেকশন গণনার একটি কেন্দ্রীয় ভূমিকা পালন করে। অল্প স্কোয়ারের রিগ্রেশন পাশাপাশি মূল উপাদানগুলি অर्थোগোনাল অনুমানের ক্ষেত্রে বোঝা যায়।ATAAA

আরও মনে রাখবেন যে যদি এর কলামগুলি অর্থনোর্মাল হয়, এইভাবে কলাম স্থানের জন্য একটি orthonormal ভিত্তি তৈরি করে, তবে A T A = I - পরিচয় ম্যাট্রিক্স।AATA=I


39

@ এনআরএইচ একটি ভাল প্রযুক্তিগত উত্তর দিয়েছে।

আপনি কিছু সত্যিই মৌলিক চান, আপনি মনে করতে পারেন ম্যাট্রিক্স সমতুল্য হিসাবে একটি 2 স্কেলের জন্য।ATAA2


5
যদিও অন্যান্য উত্তরগুলি আরও "প্রযুক্তিগতভাবে" সঠিক, এটি সবচেয়ে স্বজ্ঞাত উত্তর।
বিড়াললভজাজ

3

জ্যামিতি একটি গুরুত্বপূর্ণ দৃশ্য এই (দৃষ্টিকোণ জোরালোভাবে এ "রৈখিক বীজগণিত এবং তার অ্যাপ্লিকেশন" স্ট্রং এর বই জোর) হল: ধরুন, একজন একটি হল মি × এন র্যাঙ্ক k এর -matrix, একটি রৈখিক মানচিত্র প্রতিনিধিত্বমূলক একটি : আর nR মি । কর্নেল (একটি) এবং সারি (একটি) কলাম এবং সারি শূণ্যস্থান হতে দিন একটি । তারপরAAm×nA:RnRmA

(AA):RnRn{e1,...,en}d1,,dk

(AA)(x1e1++xnen)=d1x1e1+...+dkxkek

(খ) পরিসর (এ) = কর্নেল (এ), কর্নেল (এ) এর সংজ্ঞা অনুসারে। সুতরাং A | সারি (A) সারি (A) কে কর্নেল (A) তে মানচিত্র করে।

Av=0v is in Kernel(A)vis in orthogonal complement of Row(A)

A(Rn)=A(Row(A))A|Row(A):Row(A)Col(A)

Reason: If v = r+k (r \in Row(A), k \in Kernel(A),from (c)) then
A(v) = A(r) + 0 = A(r) where A(r) = 0 <==> r = 0$.

[ঘটনাচক্রে একটি প্রমাণ দেয় যে সারি র‌্যাঙ্ক = কলাম র‌্যাঙ্ক!]

A|:Col(A)=Row(A)Col(A')=Row(A)

AA(Rn)=Row(A)


2
LATEX

1

ATA

ATArowpATcolpAdot(rowp,colp)(p,p)ATA

pATkAdot(rowp,colk)(p,k)

(p,k)ATArowpcolkrowicoljrowicolj, এবং বিপরীতভাবে.

Aiji

এখানে চিত্র বর্ণনা লিখুন


0

xE[x2]AATA

xxi

a=[x1x2xn]

x

x2¯=aan
ATA

σ2=E[x2]ATAATA

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.