আমি ভেক্টরদের জন্য ছোট-বড় অক্ষর এবং ম্যাট্রিক্সের জন্য বড় হাতের অক্ষর ব্যবহার করব।
ফর্মের রৈখিক মডেলের ক্ষেত্রে:
y=Xβ+ε
যেখানে হ'ল একটি ম্যাট্রিক্স , এবং আমরা ধরে নিই ।Xn×(k+1)k+1≤nε∼N(0,σ2)
আমরা অনুমান করতে পারেন দ্বারা , যেহেতু of এর বিপরীত উপস্থিত।β^(X⊤X)−1X⊤yX⊤X
এখন, আনোভা মামলার জন্য আমাদের কাছে full পুরোপুরি নয় full এর প্রভাবটি হ'ল আমাদের কাছে এবং আমাদের জেনারালাইজড ইনভার্সের জন্য নিষ্পত্তি করতে হবে ।X(X⊤X)−1(X⊤X)−
এই সাধারণ বিপরীতটি ব্যবহার করার একটি সমস্যা হ'ল এটি অনন্য নয়। আর একটি সমস্যা হ'ল আমরা for এর জন্য একটি নিরপেক্ষ অনুমানকটি খুঁজে পাচ্ছি না , যেহেতু
β
β^=(X⊤X)−X⊤y⟹E(β^)=(X⊤X)−X⊤Xβ.
সুতরাং, আমরা অনুমান করতে পারবে না । তবে আমরা কী s এর রৈখিক সংমিশ্রণ অনুমান করতে পারি ?ββ
আমরা যে একটি রৈখিক সমন্বয় আছে s 'এর বলে হল শ্রদ্ধেয় যদি অস্তিত্ব আছে একটি ভেক্টর যে এই ধরনের ।βg⊤βaE(a⊤y)=g⊤β
বৈপরীত্য শ্রদ্ধেয় ফাংশন একটি বিশেষ ক্ষেত্রে যা এর কোফিসিয়েন্টস এর সমষ্টি হয় শূন্য সমান।g
এবং, লিনিয়ার মডেলটিতে শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলির প্রসঙ্গে বিপরীতে উঠে আসে। (যদি আপনি @ অ্যামিবার সাথে যুক্ত ম্যানুয়ালটি পরীক্ষা করেন তবে দেখতে পাবেন যে তাদের সমস্ত বিপরীতে কোডিং শ্রেণিবদ্ধ ভেরিয়েবলের সাথে সম্পর্কিত)। তারপরে, @ করিয়াস এবং @ অ্যামিবার জবাব দিয়ে, আমরা দেখতে পাচ্ছি যে তারা আনোভাতে উত্থিত হয়েছে, তবে কেবলমাত্র ধ্রুবক ভবিষ্যদ্বাণীকারীদের সাথে "খাঁটি" রিগ্রেশন মডেল হিসাবে নয় (আমরা এএনসিওএতে বিপরীত সম্পর্কেও কথা বলতে পারি, যেহেতু এটিতে আমাদের কিছু স্পষ্টিকর পরিবর্তনশীল রয়েছে)।
এখন, মডেলটিতে যেখানে full পূর্ণ-পদমর্যাদার নয়, এবং , লিনিয়ার ফাংশন estima অনুমিত হয় যদি সেখানে ভেক্টর that যেমন । অর্থাৎ সারি একটি রৈখিক সমন্বয় । এছাড়াও, ভেক্টর of এর অনেক পছন্দ রয়েছে , যেমন , যেমন আমরা নীচের উদাহরণে দেখতে পারি।
y=Xβ+ε
XE(y)=X⊤βg⊤βaa⊤X=g⊤g⊤Xaa⊤X=g⊤
উদাহরণ 1
একমুখী মডেলটি বিবেচনা করুন:
yij=μ+αi+εij,i=1,2,j=1,2,3.
X=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢111111111000000111⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥,β=⎡⎣⎢μτ1τ2⎤⎦⎥
এবং ধরুন , সুতরাং আমরা অনুমান করতে চাই ।g⊤=[0,1,−1][0,1,−1]β=τ1−τ2
আমরা সেখানে ভেক্টরের বিভিন্ন পছন্দ দেখতে পারেন যে ফলন : নিতে ; বা ; বা ।aa⊤X=g⊤a⊤=[0,0,1,−1,0,0]a⊤=[1,0,0,0,0,−1]a⊤=[2,−1,0,0,1,−2]
উদাহরণ 2
দ্বি-মুখী মডেলটি ধরুন:
।
yij=μ+αi+βj+εij,i=1,2,j=1,2
X=⎡⎣⎢⎢⎢11111100001110100101⎤⎦⎥⎥⎥,β=⎡⎣⎢⎢⎢⎢⎢⎢μα1α2β1β2⎤⎦⎥⎥⎥⎥⎥⎥
আমরা সারি সমন্বয় রৈখিক গ্রহণ করে শ্রদ্ধেয় কার্যক্রম সংজ্ঞায়িত করতে পারবেন ।X
সারি 2, 3 এবং 4 থেকে সারি 1 বিয়োগ করা হচ্ছে ( ):
X
⎡⎣⎢⎢⎢1000−10−1−10011−1−1−0−10101⎤⎦⎥⎥⎥
এবং চতুর্থ সারির থেকে সারি 2 এবং 3 নিচ্ছেন:
⎡⎣⎢⎢⎢1000−10−1−00010−1−1−0−00100⎤⎦⎥⎥⎥
এটিকে ফলন দিয়ে গুণন করা :
β
g⊤1βg⊤2βg⊤3β=μ+α1+β1=β2−β1=α2−α1
সুতরাং, আমাদের তিনটি রৈখিক স্বাধীন অনুমানযোগ্য ফাংশন রয়েছে। এখন, শুধুমাত্র এবং , বৈপরীত্য বিবেচনা করা যেতে পারে তার কোফিসিয়েন্টস এর সমষ্টি (অথবা, সারি থেকে সংশ্লিষ্ট ভেক্টরের যোগফল ) শূন্যের সমান।g⊤2βg⊤3βg
একমুখী ভারসাম্যপূর্ণ মডেলটিতে ফিরে যাওয়া
yij=μ+αi+εij,i=1,2,…,k,j=1,2,…,n.
এবং ধরুন আমরা হাইপোথিসিস পরীক্ষা করতে চাই ।H0:α1=…=αk
এই সেটিংয়ে ম্যাট্রিক্স full পুরো-র্যাঙ্কের নয়, তাই অনন্য নয় এবং অনুমানযোগ্যও নয়। এটিকে অনুমানযোগ্য করে তোলার জন্য আমরা দ্বারা , যতক্ষণ । অন্য কথায়, অনুমিত হয় iff ।Xβ=(μ,α1,…,αk)⊤βg⊤∑igi=0∑igiαi∑igi=0
কেন এটা সত্য?
আমরা জানি যে অনুমানযোগ্য যদি সেখানে কোনও ভেক্টর থাকে যেমন যে । টেকিং স্বতন্ত্র সারি এবং , তারপর:
g⊤β=(0,g1,…,gk)β=∑igiαiag⊤=a⊤XXa⊤=[a1,…,ak]
[0,g1,…,gk]=g⊤=a⊤X=(∑iai,a1,…,ak)
এবং ফলাফল অনুসরণ করে।
যদি আমরা একটি নির্দিষ্ট বৈপরীত্য পরীক্ষা করতে চাই, আমাদের অনুমানটি । উদাহরণস্বরূপ, , যা হিসেবে লেখা যেতে পারে , তাই আমরা তুলনা করা হয় এর গড়ে পৌঁছাতে এবং ।H0:∑giαi=0H0:2α1=α2+α3H0:α1=α2+α32α1α2α3
এই অনুমানটি হিসাবে প্রকাশ করা যেতে পারে , যেখানে । এক্ষেত্রে , এবং আমরা নিম্নলিখিত পরিসংখ্যানগুলির সাথে এই অনুমানটি পরীক্ষা করি:
H0:g⊤β=0g⊤=(0,g1,g2,…,gk)q=1
F=[g⊤β^]⊤[g⊤(X⊤X)−g]−1g⊤β^SSE/k(n−1).
যদি as হিসাবে প্রকাশ করা হয় যেখানে ম্যাট্রিক্সের সারিগুলি
পারস্পরিক orthogonal বিপরীতে রয়েছে ( ), তারপরে আমরা পরিসংখ্যান , যেখানেH0:α1=α2=…=αkGβ=0
G=⎡⎣⎢⎢⎢⎢⎢g⊤1g⊤2⋮g⊤k⎤⎦⎥⎥⎥⎥⎥
g⊤igj=0H0:Gβ=0F=SSHrank(G)SSEk(n−1)SSH=[Gβ^]⊤[G(X⊤X)−1G⊤]−1Gβ^।
উদাহরণ 3
এটি আরও ভালভাবে বুঝতে, আসুন আমরা ব্যবহার করি এবং ধরা যাক আমরা করতে যা হিসাবে প্রকাশ করা যেতে পারে
k=4H0:α1=α2=α3=α4,
H0:⎡⎣⎢α1−α2α1−α3α1−α4⎤⎦⎥=⎡⎣⎢000⎤⎦⎥
অথবা, হিসাবে :
H0:Gβ=0
H0:⎡⎣⎢000111−1−0−0−0−1−1−0−0−1⎤⎦⎥G,our contrast matrix⎡⎣⎢⎢⎢⎢⎢⎢μα1α2α3α4⎤⎦⎥⎥⎥⎥⎥⎥=⎡⎣⎢000⎤⎦⎥
সুতরাং, আমরা দেখতে পাই যে আমাদের বিপরীতে ম্যাট্রিক্সের তিনটি সারি সুদের বৈপরীত্যের সহগগুলি দ্বারা সংজ্ঞায়িত করা হয়েছে। এবং প্রতিটি কলামটি আমাদের তুলনায় আমরা যে ফ্যাক্টর স্তরটি ব্যবহার করছি তা দেয়।
খুব সুন্দর আমি যা লিখেছি সেগুলি রেনচার অ্যান্ড স্কালজে, "পরিসংখ্যানগুলিতে লিনিয়ার মডেলগুলি", অধ্যায় 8 এবং 13 (উদাহরণ, উপপাদাগুলির শব্দবন্ধ, কিছু ব্যাখ্যা) থেকে নেওয়া হয়েছে, তবে "বিপরীতে ম্যাট্রিক্স" শব্দটির মতো অন্যান্য জিনিসও নেওয়া হয়েছিল "(যা প্রকৃতপক্ষে এই বইটিতে প্রকাশিত হয় না) এবং এখানে দেওয়া সংজ্ঞাটি আমার নিজস্ব ছিল।
আমার উত্তরের সাথে ওপির কনট্রাস্ট ম্যাট্রিক্স সম্পর্কিত
ওপির ম্যাট্রিক্সের একটি (যা এই ম্যানুয়ালটিতেও পাওয়া যাবে ) নিম্নলিখিত:
> contr.treatment(4)
2 3 4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1
এই ক্ষেত্রে, আমাদের ফ্যাক্টরের 4 টি স্তর রয়েছে এবং আমরা মডেলটি নিম্নরূপে লিখতে পারি: এটি ম্যাট্রিক্স আকারে এইভাবে লেখা যেতে পারে:
⎡⎣⎢⎢⎢y11y21y31y41⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢⎢μμμμ⎤⎦⎥⎥⎥⎥+⎡⎣⎢⎢⎢a1a2a3a4⎤⎦⎥⎥⎥+⎡⎣⎢⎢⎢ε11ε21ε31ε41⎤⎦⎥⎥⎥
বা
⎡⎣⎢⎢⎢y11y21y31y41⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢11111000010000100001⎤⎦⎥⎥⎥X⎡⎣⎢⎢⎢⎢⎢⎢μa1a2a3a4⎤⎦⎥⎥⎥⎥⎥⎥β+⎡⎣⎢⎢⎢ε11ε21ε31ε41⎤⎦⎥⎥⎥
এখন, একই ম্যানুয়ালটিতে ডামি কোডিং উদাহরণের জন্য, তারা রেফারেন্স গ্রুপ হিসাবে ব্যবহার করে । সুতরাং, আমরা ম্যাট্রিক্স in এর প্রতিটি অন্যান্য সারি থেকে সারি 1 বিয়োগ করি , যা :a1XX˜
⎡⎣⎢⎢⎢1000−1−1−1−1010000100001⎤⎦⎥⎥⎥
যদি আপনি কনট্রাস্ট্রিটমেন্টমেন্ট (4) ম্যাট্রিক্সে সারি এবং কলামগুলির সংখ্যা পর্যবেক্ষণ করেন তবে আপনি দেখতে পাবেন যে তারা সমস্ত সারি এবং কেবল 2, 3 এবং 4 এর সাথে সম্পর্কিত কলামগুলিকে বিবেচনা করে in উপরের ম্যাট্রিক্স ফলন:
⎡⎣⎢⎢⎢010000100001⎤⎦⎥⎥⎥
এইভাবে, কনট্রাস্ট্রিটমেন্ট (৪) ম্যাট্রিক্স আমাদের জানিয়ে দিচ্ছে যে তারা 2, 3 এবং 4 টি ফ্যাক্টর 1 এর সাথে তুলনা করছে এবং 1 টির সাথে ধ্রুবকের সাথে তুলনা করছে (এটি আমার উপরের বোঝা)।
এবং, সংজ্ঞায়িত করা (যেমন উপরের ম্যাট্রিক্সে কেবলমাত্র সারিগুলি গ্রহণ করে):
G
⎡⎣⎢000−1−1−1100010001⎤⎦⎥
আমরা এবং বিপরীতে অনুমানের সন্ধান করতে পারি।H0:Gβ=0
hsb2 = read.table('http://www.ats.ucla.edu/stat/data/hsb2.csv', header=T, sep=",")
y<-hsb2$write
dummies <- model.matrix(~factor(hsb2$race)+0)
X<-cbind(1,dummies)
# Defining G, what I call contrast matrix
G<-matrix(0,3,5)
G[1,]<-c(0,-1,1,0,0)
G[2,]<-c(0,-1,0,1,0)
G[3,]<-c(0,-1,0,0,1)
G
[,1] [,2] [,3] [,4] [,5]
[1,] 0 -1 1 0 0
[2,] 0 -1 0 1 0
[3,] 0 -1 0 0 1
# Estimating Beta
X.X<-t(X)%*%X
X.y<-t(X)%*%y
library(MASS)
Betas<-ginv(X.X)%*%X.y
# Final estimators:
G%*%Betas
[,1]
[1,] 11.541667
[2,] 1.741667
[3,] 7.596839
এবং অনুমান এক।
আমার সম্পর্কে @ttnphns এর উত্তর সম্পর্কিত।
তাদের প্রথম উদাহরণে, সেটআপটির একটি শ্রেণীবদ্ধ ফ্যাক্টর এ রয়েছে যার তিনটি স্তর রয়েছে। আমরা মডেল হিসাবে এটি লিখতে পারি (ধরুন, সরলতার জন্য, সেই ):
j=1
yij=μ+ai+εij,for i=1,2,3
এবং ধরুন আমরা আমাদের রেফারেন্স গোষ্ঠী / ফ্যাক্টর হিসাবে দিয়ে , বা করতে ।H0:a1=a2=a3H0:a1−a3=a2−a3=0a3
এটি ম্যাট্রিক্স আকারে লিখিত হতে পারে:
⎡⎣⎢y11y21y31⎤⎦⎥=⎡⎣⎢μμμ⎤⎦⎥+⎡⎣⎢a1a2a3⎤⎦⎥+⎡⎣⎢ε11ε21ε31⎤⎦⎥
বা
⎡⎣⎢y11y21y31⎤⎦⎥=⎡⎣⎢111100010001⎤⎦⎥X⎡⎣⎢⎢⎢μa1a2a3⎤⎦⎥⎥⎥β+⎡⎣⎢ε11ε21ε31⎤⎦⎥
এখন, আমরা যদি সারি 1 এবং সারি 2 থেকে সারি 3টি বিয়োগ করি তবে আমাদের কাছে সেই হয়ে যায় (আমি এটিকে call বলব :XX˜
X˜=⎡⎣⎢001100010−1−1−1⎤⎦⎥
@Ttnphns 'ম্যাট্রিক্স সাথে উপরে ম্যাট্রিক্স গত 3 কলাম তুলনা । আদেশ সত্ত্বেও, তারা বেশ অনুরূপ। প্রকৃতপক্ষে, যদি , আমরা পাই:LX˜β
⎡⎣⎢001100010−1−1−1⎤⎦⎥⎡⎣⎢⎢⎢μa1a2a3⎤⎦⎥⎥⎥=⎡⎣⎢a1−a3a2−a3μ+a3⎤⎦⎥
সুতরাং, আমাদের অনুমানযোগ্য ফাংশন রয়েছে: ; ; ।c⊤1β=a1−a3c⊤2β=a2−a3c⊤3β=μ+a3
যেহেতু , আমরা উপরের দিক থেকে দেখতে পাচ্ছি যে আমরা আমাদের ধ্রুবককে রেফারেন্স গ্রুপ (a_3) এর সহগের সাথে তুলনা করছি; গ্রুপ -1 এর গুণফল জি-জি 3 এর সহগ; এবং গ্রুপ 2 এর সহগটি গ্রেইপ 3 তে। বা, যেমন @ এনটিএনফেন্স বলেছে: "আমরা সহসংখ্যককে অবিলম্বে দেখতে পাচ্ছি, অনুমানীকৃত কনস্ট্যান্ট রেফারেন্স গ্রুপে ওয়াইয়ের সমান হবে; সেই প্যারামিটার বি 1 (অর্থাত্ ডামি ভেরিয়েবল এ 1) পার্থক্যের সমান হবে: Y1 গ্রুপ 1 বিয়োগের মধ্য দিয়ে হবে জিআউপি 3 এর মধ্যে ই মানে; এবং প্যারামিটার বি 2 হ'ল পার্থক্য: গ্রুপ 2 বিয়োগের গড় মানে গ্রেইপ 3।H0:c⊤iβ=0
তদ্ব্যতীত, লক্ষ্য করুন যে (বিপরীতে সংজ্ঞাটি অনুসরণ করে: অনুমানযোগ্য ফাংশন + সারি যোগ = 0), যে ভেক্টরগুলি এবং বৈপরীত্য। এবং, যদি আমরা একটি ম্যাট্রিক্স const সীমাবদ্ধতা তৈরি করি, আমাদের আছে:c1c2G
G=[001001−1−1]
test পরীক্ষা করার জন্য আমাদের বিপরীতে ম্যাট্রিক্সH0:Gβ=0
উদাহরণ
আমরা @ttnphns এর "ব্যবহারকারী সংজ্ঞায়িত বিপরীতে উদাহরণ" হিসাবে একই ডেটা ব্যবহার করব (আমি উল্লেখ করতে চাই যে আমি এখানে যে তত্ত্বটি লিখেছি তাতে ইন্টারঅ্যাকশন সহ মডেলগুলি বিবেচনা করার জন্য কয়েকটি পরিবর্তন প্রয়োজন, সে কারণেই আমি এই উদাহরণটি বেছে নিয়েছি However তবে , বিপরীতে সংজ্ঞাগুলির সংজ্ঞা এবং - আমি যাকে বলি - বিপরীতে ম্যাট্রিক্স একই থাকে)।
Y<-c(0.226,0.6836,-1.772,-0.5085,1.1836,0.5633,0.8709,0.2858,0.4057,-1.156,1.5199,
-0.1388,0.4865,-0.7653,0.3418,-1.273,1.4042,-0.1622,0.3347,-0.4576,0.7585,0.4084,
1.4165,-0.5138,0.9725,0.2373,-1.562,1.3985,0.0397,-0.4689,-1.499,-0.7654,0.1442,
-1.404,-0.2201,-1.166,0.7282,0.9524,-1.462,-0.3478,0.5679,0.5608,1.0338,-1.161,
-0.1037,2.047,2.3613,0.1222)
F_<-c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,
5,5,5,5,5,5,5,5,5,5,5)
dummies.F<-model.matrix(~as.factor(F_)+0)
X_F<-cbind(1,dummies.F)
G_F<-matrix(0,4,6)
G_F[1,]<-c(0,3,3,-2,-2,-2)
G_F[2,]<-c(0,1,-1,0,0,0)
G_F[3,]<-c(0,0,0,2,-1,-1)
G_F[4,]<-c(0,0,0,0,1,-1)
G
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0 3 3 -2 -2 -2
[2,] 0 1 -1 0 0 0
[3,] 0 0 0 2 -1 -1
[4,] 0 0 0 0 1 -1
# Estimating Beta
X_F.X_F<-t(X_F)%*%X_F
X_F.Y<-t(X_F)%*%Y
Betas_F<-ginv(X_F.X_F)%*%X_F.Y
# Final estimators:
G_F%*%Betas_F
[,1]
[1,] 0.5888183
[2,] -0.1468029
[3,] 0.6115212
[4,] -0.9279030
সুতরাং, আমরা একই ফলাফল।
উপসংহার
এটা আমার মনে হচ্ছে যে সেখানে নেই এক কি একটি বৈসাদৃশ্য ম্যাট্রিক্স হয় সংজ্ঞায়িত ধারণা।
আপনি যদি শেফী ("বিশ্লেষণের বিশ্লেষণ", পৃষ্ঠা) 66) প্রদত্ত বিপরীতে সংজ্ঞাটি গ্রহণ করেন, আপনি দেখতে পাবেন যে এটি একটি অনুমানযোগ্য ফাংশন যার সহগের পরিমাণগুলি শূন্য। সুতরাং, আমরা আমাদের নিঃশর্ত ভেরিয়েবল কোফিসিয়েন্টস বিভিন্ন রৈখিক সমন্বয় পরীক্ষা করতে চান, আমরা ব্যবহার ম্যাট্রিক্স । এটি এমন একটি ম্যাট্রিক্স যেখানে সারিগুলি শূন্যের সমান হয়, আমরা সেই সহগগুলি অনুমানযোগ্য করে তোলার জন্য আমাদের সহগের ম্যাট্রিক্সকে গুণিত করতে ব্যবহার করি। এর সারিগুলি বিপরীতগুলির বিভিন্ন লিনিয়ার সংমিশ্রণগুলি নির্দেশ করে যা আমরা পরীক্ষা করছি এবং এর কলামগুলি নির্দেশ করে যে কোন উপাদানগুলির (সহগুণ) সাথে তুলনা করা হচ্ছে।G
উপরের ম্যাট্রিক্স এমনভাবে নির্মিত হয়েছে যে এর প্রতিটি সারি একটি বিপরীতে ভেক্টর দ্বারা গঠিত (যার সমষ্টি 0), এটি আমার কাছে contrast to কে "বিপরীতে ম্যাট্রিক্স" বলা বোধ করে ( মোহনাহান - "লিনিয়ার মডেলগুলির একটি প্রাইমার" - এছাড়াও এই পরিভাষা ব্যবহার করে)।GG
যাইহোক, @ttnphns দ্বারা সুন্দরভাবে ব্যাখ্যা করা হিসাবে, সফ্টওয়্যারগুলি অন্য কিছুকে "বিপরীতে ম্যাট্রিক্স" বলে ডাকে, এবং আমি ম্যাট্রিক্স এবং এসপিএস-এর অন্তর্নির্মিত কমান্ড / ম্যাট্রিক্সের মধ্যে সরাসরি সম্পর্ক খুঁজে পাইনি (@ttnphns ) বা আর (ওপির প্রশ্ন), কেবল মিল। তবে আমি বিশ্বাস করি যে এখানে উপস্থাপন করা সুন্দর আলোচনা / সহযোগিতা এ জাতীয় ধারণা এবং সংজ্ঞা পরিষ্কার করতে সহায়তা করবে।G