সারাংশ
জটিল-মূল্যবান ভেরিয়েবলগুলিতে সর্বনিম্ন-স্কোয়ারের রিগ্রেশনটির সাধারণকরণ সাধারণভাবে ম্যাট্রিক্স সূত্রে কনজুগেট ট্রান্সপোজ দ্বারা ম্যাট্রিক্স ট্রান্সপোজ প্রতিস্থাপনের সমন্বয়ে গঠিত for একটি জটিল-মূল্যবান রিগ্রেশন যদিও জটিল জটিল বহুবিধ রেজিস্ট্রেশনের সাথে সামঞ্জস্য করে যার সমাধানটি স্ট্যান্ডার্ড (রিয়েল ভেরিয়েবল) পদ্ধতি ব্যবহার করে আরও বেশি কঠিন হতে পারে। সুতরাং, যখন জটিল-মূল্যবান মডেলটি অর্থবহ হয়, তখন সমাধান পাওয়ার জন্য জটিল গাণিতিক ব্যবহারের জন্য দৃ strongly়ভাবে সুপারিশ করা হয়। এই উত্তরের সাথে ডেটা প্রদর্শন এবং ফিটের ডায়াগনস্টিক প্লট উপস্থাপনের জন্য কিছু প্রস্তাবিত উপায়ও অন্তর্ভুক্ত রয়েছে।
সরলতার জন্য, আসুন সাধারণ (অবিবাহিত) রিগ্রেশন-এর ক্ষেত্রে আলোচনা করা যাক, যা লেখা যেতে পারে
zj=β0+β1wj+εj.
আমি স্বতন্ত্র পরিবর্তনশীল এবং নির্ভরশীল ভেরিয়েবল নামকরণের স্বাধীনতা নিয়েছি , যা প্রচলিত (উদাহরণস্বরূপ, লার্স অ্যালফারস, কমপ্লেক্স অ্যানালাইসিস ) দেখুন। নীচের সমস্তগুলি একাধিক রিগ্রেশন সেটিংসে প্রসারিত করার জন্য সোজা।জেডWZ
ব্যাখ্যা
এই মডেলটির সহজেই ভিজ্যুয়ালাইজড জ্যামিতিক ব্যাখ্যার রয়েছে: দ্বারা গুণিতক ডাব্লু_জে এর মডুলাস দ্বারা করবে এবং এটি যুক্তি দ্বারা উত্সের চারদিকে ঘুরবে । পরবর্তীকালে, যুক্ত করা এই ফলাফল দ্বারা অনুবাদ করে। প্রভাব "জিটার" এর কাছে অনুবাদটি কিছুটা। সুতরাং, regressing উপর এই পদ্ধতিতে 2D পয়েন্ট সংগ্রহ বুঝতে করার প্রয়াস থাকবে 2D পয়েন্ট সমষ্টির থেকে উদ্ভূত হিসাবেডব্লু জে β 1 β 1 β 0 ε জে জে জে ডাব্লু জে ( জেড জে ) ( ডব্লু জে )β1 wjβ1β1β0εjzjwj(zj)(wj)প্রক্রিয়া কিছু ত্রুটি জন্য অনুমতি, যেমন একটি রূপান্তর মাধ্যমে। এটি "রূপান্তর হিসাবে ফিট করুন" শিরোনামের চিত্রের সাথে নীচে চিত্রিত।
মনে রাখবেন যে উদ্ধার এবং ঘূর্ণন বিমানের কেবল কোনও রৈখিক রূপান্তর নয়: উদাহরণস্বরূপ, তারা স্কিউ রূপান্তরকে অস্বীকার করে। সুতরাং এই মডেলটি চারটি পরামিতি সহ দ্বিবিভক্ত একাধিক রিগ্রেশন হিসাবে একই নয়।
সাধারণ লিস্ট স্কোয়ার
জটিল কেসটিকে আসল কেসের সাথে সংযুক্ত করতে, লিখি
zj=xj+iyj নির্ভরশীল ভেরিয়েবলের মানগুলির জন্য
wj=uj+ivj স্বাধীন ভেরিয়েবলের মানগুলির জন্য।
তদ্ব্যতীত, পরামিতিগুলির জন্য লিখুন
β 1 = γ 1 + i δ 1β0=γ0+iδ0 এবং । β1=γ1+iδ1
প্রবর্তিত নতুন পদগুলির প্রত্যেকটি অবশ্যই, আসল এবং কাল্পনিক যখন ডেটা সূচক করে।জে = 1 , 2 , … , এনi2=−1j=1,2,…,n
OLS ঔজ্জ্বল্যের প্রেক্ষাপটে খুঁজে বের করে এবং যে চ্যুতির বর্গের সমষ্টি কমান, β 1β^0β^1
∑j=1n||zj−(β^0+β^1wj)||2=∑j=1n(z¯j−(β^0¯+β^1¯w¯j))(zj−(β^0+β^1wj)).
সাধারণত এটি সাধারণ ম্যাট্রিক্স গঠনের অনুরূপ: একে তুলনা করুন শুধু পার্থক্য আমরা যে নকশা ম্যাট্রিক্স TRANSPOSE হয় দ্বারা প্রতিস্থাপিত হয় অনুবন্ধী TRANSPOSE। ফলস্বরূপ ফর্মাল ম্যাট্রিক্স সমাধান হয়এক্স ′ এক্স ∗ = ˉ এক্স ′(z−Xβ)′(z−Xβ).X′ X∗=X¯′
β^=(X∗X)−1X∗z.
একই সময়ে, একে খাঁটি বাস্তব-পরিবর্তনশীল সমস্যার মধ্যে ফেলে দিয়ে কী সম্পাদিত হতে পারে তা দেখার জন্য আমরা ওএলএসের উদ্দেশ্যটি বাস্তব উপাদানগুলির আকারে লিখতে পারি:
∑j=1n(xj−γ0−γ1uj+δ1vj)2+∑j=1n(yj−δ0−δ1uj−γ1vj)2.
স্পষ্টরূপে এই দুই প্রতিনিধিত্ব করে লিঙ্ক বাস্তব রিগ্রেশন: তাদের মধ্যে একজন regresses উপর এবং , অন্যান্য regresses উপর এবং ; এবং আমরা প্রয়োজন যে জন্য সহগ নেতিবাচক হতে জন্য সহগ এবং জন্য সহগ সমান জন্য সহগ । অধিকন্তু, মোট কারণতোমার দর্শন লগ করা v Y তোমার দর্শন লগ করা বনাম বনাম এক্স তোমার দর্শন লগ করা Y তোমার দর্শন লগ করা x বনাম Y এক্স Yxuvyuvvxuyuxvyদুটি রিগ্রেশন থেকে অবশিষ্টাংশের বর্গক্ষেত্রকে হ্রাস করতে হবে, সাধারণত এটি হবে না যে কোনও সহগের সেটটি কেবল বা জন্য সেরা অনুমান দেয় । এটি নীচের উদাহরণে নিশ্চিত করা হয়েছে, যা দুটি বাস্তব সংবিচ্ছেদ পৃথকভাবে বহন করে এবং জটিল সমাধানের সাথে তাদের সমাধানগুলির তুলনা করে।xy
এই বিশ্লেষণটি এটিকে সুস্পষ্ট করে তোলে যে প্রকৃত অংশগুলির (1) পদগুলিতে জটিল রিগ্রেশন পুনরায় লেখার জন্য সূত্রগুলি জটিল করে তোলে, (২) সরল জ্যামিতিক ব্যাখ্যাকে অস্পষ্ট করে এবং (3) একটি সাধারণীকরণের বহুভুক্ত একাধিক রিগ্রেশন (ভেরিয়েবলগুলির মধ্যে ননতান্ত্রিক সংযোগ সহ) প্রয়োজন হবে ) সমাধান করা. আমরা আরও ভাল করতে পারি
উদাহরণ
উদাহরণস্বরূপ, আমি জটিল প্লেনে উত্সের নিকটে অবিচ্ছেদ্য পয়েন্টগুলিতে মানগুলির একটি গ্রিড গ্রহণ করি । রূপান্তরিত মানগুলিতে ডাব্লু- যুক্ত হয় তবে আইভির ত্রুটি বিভাজনে গাউসীয় বিতরণ থাকে: বিশেষত, ত্রুটিগুলির আসল এবং কল্পিত অংশগুলি স্বতন্ত্র নয়।W βwwβ
জটিল ভেরিয়েবলের জন্য এর সাধারণ কঠিন , কারণ এটি চার মাত্রায় পয়েন্ট নিয়ে গঠিত। পরিবর্তে আমরা তাদের আসল এবং কল্পিত অংশগুলির স্ক্যাটারপ্লট ম্যাট্রিক্স দেখতে পারি।(wj,zj)
আপাতত ফিট উপেক্ষা করুন এবং শীর্ষ চারটি সারি এবং চারটি বাম কলাম দেখুন: এগুলি ডেটা প্রদর্শন করে। এর বিজ্ঞপ্তি গ্রিড উপরের বাম দিকের স্পষ্ট; এটি পয়েন্ট আছে। এর উপাদানগুলির বিরুদ্ধে এর উপাদানগুলির স্ক্যাটারপ্লটগুলি সুস্পষ্ট পারস্পরিক সম্পর্ক দেখায়। এর মধ্যে তিনটির নেতিবাচক সম্পর্ক রয়েছে; শুধুমাত্র (এর কাল্পনিক অংশ ) এবং (আসল অংশ ) ইতিবাচকভাবে সম্পর্কিত করা হয়।81 w z y z u ww81wzyzuw
এই ডেটাগুলির জন্য, আসল মান হ'ল । এটি দ্বারা একটি বিস্তৃতি এবং 120 ডিগ্রির একটি ঘড়ির কাঁটার বিপরীতে ঘূর্ণন এবং তারপরে ইউনিট বামে এবং ইউনিট অনুবাদ করে translation আমি তিনটি ফিট গণনা করি: তুলনা করার জন্য জটিলতম সর্বনিম্ন স্কোয়ার দ্রবণ এবং এবং আলাদাভাবে দুটি ।( - 20 + + 5 আমি , - 3 / 4 + + 3 / 4 √β3/2205(এক্সঞ)(Yঞ)(−20+5i,−3/4+3/43–√i)3/2205(xj)(yj)
Fit Intercept Slope(s)
True -20 + 5 i -0.75 + 1.30 i
Complex -20.02 + 5.01 i -0.83 + 1.38 i
Real only -20.02 -0.75, -1.46
Imaginary only 5.01 1.30, -0.92
এটি সর্বদা ক্ষেত্রে হবে যে প্রকৃত-একমাত্র ইন্টারসেপ্ট জটিল ইন্টারসেপ্টের আসল অংশের সাথে একমত এবং কল্পিত-কেবল ইন্টারসেপ্ট জটিল বাধা দেওয়ার জন্য কাল্পনিক অংশের সাথে সম্মত হয়। এটি প্রকৃতপক্ষে এবং কল্পিত-কেবল opালু জটিল opeাল সহগের সাথেই একে অপরের সাথে একমত হয় নি ঠিক যেমন পূর্বাভাস দেওয়া হয়েছিল।
জটিল ফিটগুলির ফলাফলগুলি ঘনিষ্ঠভাবে দেখে নেওয়া যাক। প্রথমত, অবশিষ্টাংশের একটি প্লট তাদের দ্বিখণ্ডিত গাউসিয়ান বিতরণের একটি ইঙ্গিত দেয়। (অন্তর্নিহিত বিতরণটির প্রান্তিক মান বিচ্যুতি এবং একটি সম্পর্কিত ) লাগানো মানগুলির বিরুদ্ধে: এই প্লটটি আকার এবং রঙের এলোমেলো বিতরণের মতো দেখতে হবে যা এটি করে does0.820.8
শেষ পর্যন্ত, আমরা বেশ কয়েকটি উপায়ে ফিটকে চিত্রিত করতে পারি। ফিট স্ক্যাটারপ্ল্লট ম্যাট্রিক্স ( কিউভি ) এর সর্বশেষ সারি এবং কলামগুলিতে উপস্থিত হয়েছিল এবং এই পয়েন্টটি আরও ঘনিষ্ঠভাবে দেখার জন্য উপযুক্ত হতে পারে। বামদিকে নীচে খালি নীল চেনাশোনা এবং তীরগুলি (অবশিষ্টাংশের প্রতিনিধিত্বকারী) হিসাবে ডেটাগুলির সাথে সংযোগ স্থাপন করে শক্ত লাল বৃত্ত হিসাবে দেখানো হয়েছে fits ডানদিকে তাদের যুক্তিগুলির সাথে সামঞ্জস্যপূর্ণ রঙে পূর্ণ খোলা কালো বৃত্ত হিসাবে দেখানো হয়েছে; এগুলি এর সম্পর্কিত মানগুলির সাথে তীর দ্বারা সংযুক্ত । মনে রাখবেন যে প্রতিটি তীর উত্সের চারপাশে দ্বারা বিস্তৃতি , ডিগ্রি দ্বারা আবর্তন এবং দ্বারা অনুবাদ , এবং সেই দ্বিবিড়ীয় গ্যাসিয়ান ত্রুটি উপস্থাপন করে।( z- র ঞ ) 3 / 2 120 ( - 20 , 5 )(wj)(zj)3/2120(−20,5)
এই ফলাফলগুলি, প্লটগুলি এবং ডায়াগনস্টিক প্লটগুলি বোঝায় যে জটিল রিগ্রেশন সূত্রটি সঠিকভাবে কাজ করে এবং ভেরিয়েবলের আসল এবং কল্পিত অংশগুলির পৃথক লিনিয়ার রেগ্রেশনগুলির চেয়ে আলাদা কিছু অর্জন করে।
কোড
R
কোড ডেটা, তড়কা তৈরি করতে, এবং প্লট নীচে প্রদর্শিত হবে। মনে রাখবেন যে আসল সমাধানটি কোডের একক লাইনে পাওয়া যায়। অতিরিক্ত কাজ - তবে এটির খুব বেশি নয় - সাধারণত সর্বনিম্ন স্কোয়ার আউটপুট পেতে প্রয়োজন হবে: ফিটের মান, ত্রুটি, পি-মান ইত্যাদির ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স etc.β^
#
# Synthesize data.
# (1) the independent variable `w`.
#
w.max <- 5 # Max extent of the independent values
w <- expand.grid(seq(-w.max,w.max), seq(-w.max,w.max))
w <- complex(real=w[[1]], imaginary=w[[2]])
w <- w[Mod(w) <= w.max]
n <- length(w)
#
# (2) the dependent variable `z`.
#
beta <- c(-20+5i, complex(argument=2*pi/3, modulus=3/2))
sigma <- 2; rho <- 0.8 # Parameters of the error distribution
library(MASS) #mvrnorm
set.seed(17)
e <- mvrnorm(n, c(0,0), matrix(c(1,rho,rho,1)*sigma^2, 2))
e <- complex(real=e[,1], imaginary=e[,2])
z <- as.vector((X <- cbind(rep(1,n), w)) %*% beta + e)
#
# Fit the models.
#
print(beta, digits=3)
print(beta.hat <- solve(Conj(t(X)) %*% X, Conj(t(X)) %*% z), digits=3)
print(beta.r <- coef(lm(Re(z) ~ Re(w) + Im(w))), digits=3)
print(beta.i <- coef(lm(Im(z) ~ Re(w) + Im(w))), digits=3)
#
# Show some diagnostics.
#
par(mfrow=c(1,2))
res <- as.vector(z - X %*% beta.hat)
fit <- z - res
s <- sqrt(Re(mean(Conj(res)*res)))
col <- hsv((Arg(res)/pi + 1)/2, .8, .9)
size <- Mod(res) / s
plot(res, pch=16, cex=size, col=col, main="Residuals")
plot(Re(fit), Im(fit), pch=16, cex = size, col=col,
main="Residuals vs. Fitted")
plot(Re(c(z, fit)), Im(c(z, fit)), type="n",
main="Residuals as Fit --> Data", xlab="Real", ylab="Imaginary")
points(Re(fit), Im(fit), col="Blue")
points(Re(z), Im(z), pch=16, col="Red")
arrows(Re(fit), Im(fit), Re(z), Im(z), col="Gray", length=0.1)
col.w <- hsv((Arg(w)/pi + 1)/2, .8, .9)
plot(Re(c(w, z)), Im(c(w, z)), type="n",
main="Fit as a Transformation", xlab="Real", ylab="Imaginary")
points(Re(w), Im(w), pch=16, col=col.w)
points(Re(w), Im(w))
points(Re(z), Im(z), pch=16, col=col.w)
arrows(Re(w), Im(w), Re(z), Im(z), col="#00000030", length=0.1)
#
# Display the data.
#
par(mfrow=c(1,1))
pairs(cbind(w.Re=Re(w), w.Im=Im(w), z.Re=Re(z), z.Im=Im(z),
fit.Re=Re(fit), fit.Im=Im(fit)), cex=1/2)