জটিল তথ্য নিয়ে বিশ্লেষণ, আলাদা কিছু?


31

উদাহরণস্বরূপ বলুন আপনি লিনিয়ার মডেল করছেন, তবে ডেটা জটিল।y

y=xβ+ϵ

আমার ডেটা সেট জটিল, যেমন তে সমস্ত সংখ্যা ফর্মের । এই জাতীয় ডেটা নিয়ে কাজ করার সময় কি পদ্ধতিগতভাবে আলাদা কিছু আছে?y(a+bi)

আমি জিজ্ঞাসা করছি কারণ, আপনি জটিল কোভেরিয়েন্স ম্যাট্রিক্স এবং পরীক্ষার পরিসংখ্যান যা জটিল মূল্যবান পেয়ে যাবেন ..

ন্যূনতম স্কোয়ারগুলি করার সময় আপনার কি ট্রান্সপোসের পরিবর্তে কনজুগেট ট্রান্সপোজ ব্যবহার করা দরকার? একটি জটিল মূল্যবান সমবায় অর্থবহ?


3
জটিল সংখ্যাটিকে দুটি পৃথক ভেরিয়েবল হিসাবে বিবেচনা করুন এবং সেভাবে আমি আপনার সমস্ত সমীকরণ থেকে মুছে ফেলব। অন্যথায় এটি একটি দুঃস্বপ্ন হবে ...
সাশকেলো

বা সম্পর্কে কোনও তথ্য ? xβ
স্টিজন

3
@ সাশকেলো কী "দুঃস্বপ্ন"? যখন আপনি জটিল সংখ্যা ব্যবহার করেন তখন মাত্রাগুলি অর্ধেক হয়ে যায়, তাই যুক্তিযুক্তভাবে এটি সরলিকরণ। তাছাড়া, আপনি পরিণত হয়েছে একটি bivariate মধ্যে একটি ডিভি univariate ডিভি, যা একটি বিশাল সুবিধা। পিটাররবিট: হ্যাঁ, কনজুগেট ট্রান্সপোজ দরকার are জটিল কোভেরিয়েন্স ম্যাট্রিক্স হর্মাইটিয়ান ইতিবাচক-নির্দিষ্ট ite এর আসল প্রতিরূপের মতো, এর এখনও ইতিবাচক বাস্তব উদ্যান রয়েছে, যা অর্থবহতার প্রশ্নকে সম্বোধন করে।
whuber

2
@ হুবুহু সমস্যাটি যদি দেখানো হয় তবে জটিল সংখ্যায় যাব তা আমার বোধগম্য নয়। জটিল সংখ্যাগুলি মোকাবেলা করা সহজ নয় - অন্যথায় এখানে কোনও প্রশ্নই আসবে না। জটিল সংখ্যার সাথে সবকিছু ঠিকঠাক কাজ করবে না এবং আপনি কী করছেন তা যদি আপনি না জানেন তবে এটি কোনও সরল পরিবর্তন নয়। এই সমস্যাটিকে আসল জায়গায় রূপান্তর করা সমান এবং আপনি জটিল পরিসরে কাজ করে কি না তা উদ্বেগ ছাড়াই সমস্ত পরিসংখ্যানগত কৌশল প্রয়োগ করতে পারেন।
সাশকেলো

1
@ শুভ উত্তর এবং দুর্দান্ত ব্যাখ্যা। একজনের থেকে অন্যটিতে রূপান্তরটি পাওয়ার সাথে সাথে আমি বলতে চাই এটা সত্যিই কঠিন নয় ...
সাশকেলো

উত্তর:


40

সারাংশ

জটিল-মূল্যবান ভেরিয়েবলগুলিতে সর্বনিম্ন-স্কোয়ারের রিগ্রেশনটির সাধারণকরণ সাধারণভাবে ম্যাট্রিক্স সূত্রে কনজুগেট ট্রান্সপোজ দ্বারা ম্যাট্রিক্স ট্রান্সপোজ প্রতিস্থাপনের সমন্বয়ে গঠিত for একটি জটিল-মূল্যবান রিগ্রেশন যদিও জটিল জটিল বহুবিধ রেজিস্ট্রেশনের সাথে সামঞ্জস্য করে যার সমাধানটি স্ট্যান্ডার্ড (রিয়েল ভেরিয়েবল) পদ্ধতি ব্যবহার করে আরও বেশি কঠিন হতে পারে। সুতরাং, যখন জটিল-মূল্যবান মডেলটি অর্থবহ হয়, তখন সমাধান পাওয়ার জন্য জটিল গাণিতিক ব্যবহারের জন্য দৃ strongly়ভাবে সুপারিশ করা হয়। এই উত্তরের সাথে ডেটা প্রদর্শন এবং ফিটের ডায়াগনস্টিক প্লট উপস্থাপনের জন্য কিছু প্রস্তাবিত উপায়ও অন্তর্ভুক্ত রয়েছে।


সরলতার জন্য, আসুন সাধারণ (অবিবাহিত) রিগ্রেশন-এর ক্ষেত্রে আলোচনা করা যাক, যা লেখা যেতে পারে

zj=β0+β1wj+εj.

আমি স্বতন্ত্র পরিবর্তনশীল এবং নির্ভরশীল ভেরিয়েবল নামকরণের স্বাধীনতা নিয়েছি , যা প্রচলিত (উদাহরণস্বরূপ, লার্স অ্যালফারস, কমপ্লেক্স অ্যানালাইসিস ) দেখুন। নীচের সমস্তগুলি একাধিক রিগ্রেশন সেটিংসে প্রসারিত করার জন্য সোজা।জেডWZ

ব্যাখ্যা

এই মডেলটির সহজেই ভিজ্যুয়ালাইজড জ্যামিতিক ব্যাখ্যার রয়েছে: দ্বারা গুণিতক ডাব্লু_জে এর মডুলাস দ্বারা করবে এবং এটি যুক্তি দ্বারা উত্সের চারদিকে ঘুরবে । পরবর্তীকালে, যুক্ত করা এই ফলাফল দ্বারা অনুবাদ করে। প্রভাব "জিটার" এর কাছে অনুবাদটি কিছুটা। সুতরাং, regressing উপর এই পদ্ধতিতে 2D পয়েন্ট সংগ্রহ বুঝতে করার প্রয়াস থাকবে 2D পয়েন্ট সমষ্টির থেকে উদ্ভূত হিসাবেডব্লু জে β 1 β 1 β 0 ε জে জে জে ডাব্লু জে ( জেড জে ) ( ডব্লু জে )β1 wjβ1β1β0εjzjwj(zj)(wj)প্রক্রিয়া কিছু ত্রুটি জন্য অনুমতি, যেমন একটি রূপান্তর মাধ্যমে। এটি "রূপান্তর হিসাবে ফিট করুন" শিরোনামের চিত্রের সাথে নীচে চিত্রিত।

মনে রাখবেন যে উদ্ধার এবং ঘূর্ণন বিমানের কেবল কোনও রৈখিক রূপান্তর নয়: উদাহরণস্বরূপ, তারা স্কিউ রূপান্তরকে অস্বীকার করে। সুতরাং এই মডেলটি চারটি পরামিতি সহ দ্বিবিভক্ত একাধিক রিগ্রেশন হিসাবে একই নয়।

সাধারণ লিস্ট স্কোয়ার

জটিল কেসটিকে আসল কেসের সাথে সংযুক্ত করতে, লিখি

zj=xj+iyj নির্ভরশীল ভেরিয়েবলের মানগুলির জন্য

wj=uj+ivj স্বাধীন ভেরিয়েবলের মানগুলির জন্য।

তদ্ব্যতীত, পরামিতিগুলির জন্য লিখুন

β 1 = γ 1 + i δ 1β0=γ0+iδ0 এবং । β1=γ1+iδ1

প্রবর্তিত নতুন পদগুলির প্রত্যেকটি অবশ্যই, আসল এবং কাল্পনিক যখন ডেটা সূচক করে।জে = 1 , 2 , , এনi2=1j=1,2,,n

OLS ঔজ্জ্বল্যের প্রেক্ষাপটে খুঁজে বের করে এবং যে চ্যুতির বর্গের সমষ্টি কমান, β 1β^0β^1

j=1n||zj(β^0+β^1wj)||2=j=1n(z¯j(β^0¯+β^1¯w¯j))(zj(β^0+β^1wj)).

সাধারণত এটি সাধারণ ম্যাট্রিক্স গঠনের অনুরূপ: একে তুলনা করুন শুধু পার্থক্য আমরা যে নকশা ম্যাট্রিক্স TRANSPOSE হয় দ্বারা প্রতিস্থাপিত হয় অনুবন্ধী TRANSPOSE। ফলস্বরূপ ফর্মাল ম্যাট্রিক্স সমাধান হয়এক্স এক্স = ˉ এক্স(zXβ)(zXβ).X X=X¯

β^=(XX)1Xz.

একই সময়ে, একে খাঁটি বাস্তব-পরিবর্তনশীল সমস্যার মধ্যে ফেলে দিয়ে কী সম্পাদিত হতে পারে তা দেখার জন্য আমরা ওএলএসের উদ্দেশ্যটি বাস্তব উপাদানগুলির আকারে লিখতে পারি:

j=1n(xjγ0γ1uj+δ1vj)2+j=1n(yjδ0δ1ujγ1vj)2.

স্পষ্টরূপে এই দুই প্রতিনিধিত্ব করে লিঙ্ক বাস্তব রিগ্রেশন: তাদের মধ্যে একজন regresses উপর এবং , অন্যান্য regresses উপর এবং ; এবং আমরা প্রয়োজন যে জন্য সহগ নেতিবাচক হতে জন্য সহগ এবং জন্য সহগ সমান জন্য সহগ । অধিকন্তু, মোট কারণতোমার দর্শন লগ করা v Y তোমার দর্শন লগ করা বনাম বনাম এক্স তোমার দর্শন লগ করা Y তোমার দর্শন লগ করা x বনাম Y এক্স Yxuvyuvvxuyuxvyদুটি রিগ্রেশন থেকে অবশিষ্টাংশের বর্গক্ষেত্রকে হ্রাস করতে হবে, সাধারণত এটি হবে না যে কোনও সহগের সেটটি কেবল বা জন্য সেরা অনুমান দেয় । এটি নীচের উদাহরণে নিশ্চিত করা হয়েছে, যা দুটি বাস্তব সংবিচ্ছেদ পৃথকভাবে বহন করে এবং জটিল সমাধানের সাথে তাদের সমাধানগুলির তুলনা করে।xy

এই বিশ্লেষণটি এটিকে সুস্পষ্ট করে তোলে যে প্রকৃত অংশগুলির (1) পদগুলিতে জটিল রিগ্রেশন পুনরায় লেখার জন্য সূত্রগুলি জটিল করে তোলে, (২) সরল জ্যামিতিক ব্যাখ্যাকে অস্পষ্ট করে এবং (3) একটি সাধারণীকরণের বহুভুক্ত একাধিক রিগ্রেশন (ভেরিয়েবলগুলির মধ্যে ননতান্ত্রিক সংযোগ সহ) প্রয়োজন হবে ) সমাধান করা. আমরা আরও ভাল করতে পারি

উদাহরণ

উদাহরণস্বরূপ, আমি জটিল প্লেনে উত্সের নিকটে অবিচ্ছেদ্য পয়েন্টগুলিতে মানগুলির একটি গ্রিড গ্রহণ করি । রূপান্তরিত মানগুলিতে ডাব্লু- যুক্ত হয় তবে আইভির ত্রুটি বিভাজনে গাউসীয় বিতরণ থাকে: বিশেষত, ত্রুটিগুলির আসল এবং কল্পিত অংশগুলি স্বতন্ত্র নয়।W βwwβ

জটিল ভেরিয়েবলের জন্য এর সাধারণ কঠিন , কারণ এটি চার মাত্রায় পয়েন্ট নিয়ে গঠিত। পরিবর্তে আমরা তাদের আসল এবং কল্পিত অংশগুলির স্ক্যাটারপ্লট ম্যাট্রিক্স দেখতে পারি।(wj,zj)

স্ক্যাটারপ্ল্লট ম্যাট্রিক্স

আপাতত ফিট উপেক্ষা করুন এবং শীর্ষ চারটি সারি এবং চারটি বাম কলাম দেখুন: এগুলি ডেটা প্রদর্শন করে। এর বিজ্ঞপ্তি গ্রিড উপরের বাম দিকের স্পষ্ট; এটি পয়েন্ট আছে। এর উপাদানগুলির বিরুদ্ধে এর উপাদানগুলির স্ক্যাটারপ্লটগুলি সুস্পষ্ট পারস্পরিক সম্পর্ক দেখায়। এর মধ্যে তিনটির নেতিবাচক সম্পর্ক রয়েছে; শুধুমাত্র (এর কাল্পনিক অংশ ) এবং (আসল অংশ ) ইতিবাচকভাবে সম্পর্কিত করা হয়।81 w z y z u ww81wzyzuw

এই ডেটাগুলির জন্য, আসল মান হ'ল । এটি দ্বারা একটি বিস্তৃতি এবং 120 ডিগ্রির একটি ঘড়ির কাঁটার বিপরীতে ঘূর্ণন এবং তারপরে ইউনিট বামে এবং ইউনিট অনুবাদ করে translation আমি তিনটি ফিট গণনা করি: তুলনা করার জন্য জটিলতম সর্বনিম্ন স্কোয়ার দ্রবণ এবং এবং আলাদাভাবে দুটি ।( - 20 + + 5 আমি , - 3 / 4 + + 3 / 4 β3/2205(এক্স)(Y)(20+5i,3/4+3/43i)3/2205(xj)(yj)

Fit            Intercept          Slope(s)
True           -20    + 5 i       -0.75 + 1.30 i
Complex        -20.02 + 5.01 i    -0.83 + 1.38 i
Real only      -20.02             -0.75, -1.46
Imaginary only          5.01       1.30, -0.92

এটি সর্বদা ক্ষেত্রে হবে যে প্রকৃত-একমাত্র ইন্টারসেপ্ট জটিল ইন্টারসেপ্টের আসল অংশের সাথে একমত এবং কল্পিত-কেবল ইন্টারসেপ্ট জটিল বাধা দেওয়ার জন্য কাল্পনিক অংশের সাথে সম্মত হয়। এটি প্রকৃতপক্ষে এবং কল্পিত-কেবল opালু জটিল opeাল সহগের সাথেই একে অপরের সাথে একমত হয় নি ঠিক যেমন পূর্বাভাস দেওয়া হয়েছিল।

জটিল ফিটগুলির ফলাফলগুলি ঘনিষ্ঠভাবে দেখে নেওয়া যাক। প্রথমত, অবশিষ্টাংশের একটি প্লট তাদের দ্বিখণ্ডিত গাউসিয়ান বিতরণের একটি ইঙ্গিত দেয়। (অন্তর্নিহিত বিতরণটির প্রান্তিক মান বিচ্যুতি এবং একটি সম্পর্কিত ) লাগানো মানগুলির বিরুদ্ধে: এই প্লটটি আকার এবং রঙের এলোমেলো বিতরণের মতো দেখতে হবে যা এটি করে does0.820.8

অবশিষ্ট প্লট

শেষ পর্যন্ত, আমরা বেশ কয়েকটি উপায়ে ফিটকে চিত্রিত করতে পারি। ফিট স্ক্যাটারপ্ল্লট ম্যাট্রিক্স ( কিউভি ) এর সর্বশেষ সারি এবং কলামগুলিতে উপস্থিত হয়েছিল এবং এই পয়েন্টটি আরও ঘনিষ্ঠভাবে দেখার জন্য উপযুক্ত হতে পারে। বামদিকে নীচে খালি নীল চেনাশোনা এবং তীরগুলি (অবশিষ্টাংশের প্রতিনিধিত্বকারী) হিসাবে ডেটাগুলির সাথে সংযোগ স্থাপন করে শক্ত লাল বৃত্ত হিসাবে দেখানো হয়েছে fits ডানদিকে তাদের যুক্তিগুলির সাথে সামঞ্জস্যপূর্ণ রঙে পূর্ণ খোলা কালো বৃত্ত হিসাবে দেখানো হয়েছে; এগুলি এর সম্পর্কিত মানগুলির সাথে তীর দ্বারা সংযুক্ত । মনে রাখবেন যে প্রতিটি তীর উত্সের চারপাশে দ্বারা বিস্তৃতি , ডিগ্রি দ্বারা আবর্তন এবং দ্বারা অনুবাদ , এবং সেই দ্বিবিড়ীয় গ্যাসিয়ান ত্রুটি উপস্থাপন করে।( z- র ) 3 / 2 120 ( - 20 , 5 )(wj)(zj)3/2120(20,5)

রূপান্তর হিসাবে ফিট

এই ফলাফলগুলি, প্লটগুলি এবং ডায়াগনস্টিক প্লটগুলি বোঝায় যে জটিল রিগ্রেশন সূত্রটি সঠিকভাবে কাজ করে এবং ভেরিয়েবলের আসল এবং কল্পিত অংশগুলির পৃথক লিনিয়ার রেগ্রেশনগুলির চেয়ে আলাদা কিছু অর্জন করে।

কোড

Rকোড ডেটা, তড়কা তৈরি করতে, এবং প্লট নীচে প্রদর্শিত হবে। মনে রাখবেন যে আসল সমাধানটি কোডের একক লাইনে পাওয়া যায়। অতিরিক্ত কাজ - তবে এটির খুব বেশি নয় - সাধারণত সর্বনিম্ন স্কোয়ার আউটপুট পেতে প্রয়োজন হবে: ফিটের মান, ত্রুটি, পি-মান ইত্যাদির ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স etc.β^

#
# Synthesize data.
# (1) the independent variable `w`.
#
w.max <- 5 # Max extent of the independent values
w <- expand.grid(seq(-w.max,w.max), seq(-w.max,w.max))
w <- complex(real=w[[1]], imaginary=w[[2]])
w <- w[Mod(w) <= w.max]
n <- length(w)
#
# (2) the dependent variable `z`.
#
beta <- c(-20+5i, complex(argument=2*pi/3, modulus=3/2))
sigma <- 2; rho <- 0.8 # Parameters of the error distribution
library(MASS) #mvrnorm
set.seed(17)
e <- mvrnorm(n, c(0,0), matrix(c(1,rho,rho,1)*sigma^2, 2))
e <- complex(real=e[,1], imaginary=e[,2])
z <- as.vector((X <- cbind(rep(1,n), w)) %*% beta + e)
#
# Fit the models.
#
print(beta, digits=3)
print(beta.hat <- solve(Conj(t(X)) %*% X, Conj(t(X)) %*% z), digits=3)
print(beta.r <- coef(lm(Re(z) ~ Re(w) + Im(w))), digits=3)
print(beta.i <- coef(lm(Im(z) ~ Re(w) + Im(w))), digits=3)
#
# Show some diagnostics.
#
par(mfrow=c(1,2))
res <- as.vector(z - X %*% beta.hat)
fit <- z - res
s <- sqrt(Re(mean(Conj(res)*res)))
col <- hsv((Arg(res)/pi + 1)/2, .8, .9)
size <- Mod(res) / s
plot(res, pch=16, cex=size, col=col, main="Residuals")
plot(Re(fit), Im(fit), pch=16, cex = size, col=col,
     main="Residuals vs. Fitted")

plot(Re(c(z, fit)), Im(c(z, fit)), type="n",
     main="Residuals as Fit --> Data", xlab="Real", ylab="Imaginary")
points(Re(fit), Im(fit), col="Blue")
points(Re(z), Im(z), pch=16, col="Red")
arrows(Re(fit), Im(fit), Re(z), Im(z), col="Gray", length=0.1)

col.w <-  hsv((Arg(w)/pi + 1)/2, .8, .9)
plot(Re(c(w, z)), Im(c(w, z)), type="n",
     main="Fit as a Transformation", xlab="Real", ylab="Imaginary")
points(Re(w), Im(w), pch=16, col=col.w)
points(Re(w), Im(w))
points(Re(z), Im(z), pch=16, col=col.w)
arrows(Re(w), Im(w), Re(z), Im(z), col="#00000030", length=0.1)
#
# Display the data.
#
par(mfrow=c(1,1))
pairs(cbind(w.Re=Re(w), w.Im=Im(w), z.Re=Re(z), z.Im=Im(z),
            fit.Re=Re(fit), fit.Im=Im(fit)), cex=1/2)

অনুমানকারী এবং এর সম্প্রদায়ের সম্পর্কে আমার একটি ফলোআপ প্রশ্ন ছিল । আমি যখন জটিল সঙ্গে আমার সমস্যা সমাধানের , সহভেদাংক ম্যাট্রিক্স (আমি ব্যবহার করে অবস্থান নির্ণয় যা হইয়া অবশিষ্ট) আমার মূল্নির্ধারক আসল এবং কাল্পনিক অংশ রয়েছে। আমি নিশ্চিত না যে এটি কীভাবে কাজ করে। সম্প্রদায়ের কল্পিত অংশটি কি কেবল অনুমানের কল্পিত অংশ (আসল অংশের জন্য একই) সম্পর্কিত? আমি যদি সিআই-র প্লট করতে চাই তবে আমি কীভাবে এটি করব তা নিশ্চিত নই ... অনুমানকারকের কাল্পনিক এবং আসল অংশগুলির কি একই সিআই রয়েছে? আপনার ব্যাখ্যাতে কি এই সম্পর্কে কিছুটা তথ্য অন্তর্ভুক্ত করা সম্ভব হবে? ধন্যবাদ! Yβ^y
বিল_ই

যদি সমস্তগুলি সঠিকভাবে গণনা করা হয়, তবে সমবায়টি এখনও ইতিবাচক-সুনির্দিষ্ট হবে। বিশেষত, এর দ্বারা বোঝা যায় যে আপনি যখন আসল অংশ বা কোনও ভেরিয়েবলের কল্পিত অংশের স্বীয়তা গণনা করতে ব্যবহার করেন, আপনি একটি ধনাত্মক সংখ্যা পাবেন, সুতরাং সমস্ত সিআই এর সংজ্ঞা দেওয়া হবে।
হোবার

কোভ ম্যাট্রিক্সটি ইতিবাচক অর্ধ-সুনির্দিষ্ট, তবে আমি অনুমান করি যে আমি যে সম্পর্কে বিভ্রান্ত হয়েছি তা আপনি কোথায় বলেছিলেন: "আপনি যখন আসল অংশ বা কোনও ভেরিয়েবলের কাল্পনিক অংশের covariance গণনা করতে এটি ব্যবহার করেন"। আমি অনুমান যে যখন আমি একটি সি আই গনা করবে, এটি একটি বাস্তব এবং imag অংশ, যার মধ্যে একটি উপাদান এর বাস্তব এবং imag অংশ মিলা চাই হবে । যদিও এটি মনে হয় না। তুমি জানো কেন এটা? β^
বিল_ই

এছাড়াও, আমি যখন পরীক্ষার পরিসংখ্যানগুলির জন্য মানগুলি গণনা করি, তখন আমি 3 + .1 * i বলার মতো নম্বর পাই। এর জন্য আমি প্রত্যাশা করছিলাম নম্বরটির কোনও কাল্পনিক অংশ নেই। এটা কি স্বাভাবিক? বা একটি চিহ্ন আমি কিছু ভুল করছি?
বিল_ই

যখন আপনি জটিল সংখ্যার সাথে পরীক্ষার পরিসংখ্যান গণনা করেন, আপনার জটিল ফলাফল পাওয়ার আশা করা উচিত! যদি আপনার গাণিতিক কারণ থাকে তবে পরিসংখ্যানগুলি সত্য হওয়া উচিত, তবে অবশ্যই গণনাটি ভুল হতে হবে। যখন কল্পিত অংশটি সত্যিকারের অংশের তুলনায় সত্যিই ক্ষুদ্র হয়, তখন সম্ভবত এটি ভাসমান বিন্দু ত্রুটি জমে থাকে এবং এটি সাধারণত এটি বন্ধ করে দেওয়া ( zapsmallইন R) করা নিরাপদ । অন্যথায় এটি একটি লক্ষণ যা কিছু মৌলিকভাবে ভুল।
হোবার

5

একটি দীর্ঘ দীর্ঘ গুগল শেশের পরে, আমি বিকল্প পদ্ধতিতে সমস্যা বোঝার জন্য কিছু প্রাসঙ্গিক তথ্য পেয়েছি। দেখা যাচ্ছে যে পরিসংখ্যান সংকেত প্রক্রিয়াকরণে অনুরূপ সমস্যাগুলি কিছুটা সাধারণ। আসল উপাত্তের জন্য লিনিয়ার সর্বনিম্ন স্কোয়ারের সাথে সঙ্গতিপূর্ণ গাউসিয়ান সম্ভাবনাটি শুরু করার পরিবর্তে, একটি দিয়ে শুরু হয়:

http://en.wikipedia.org/wiki/Complex_normal_distribution

এই উইকিপিডিয়া পৃষ্ঠাটি এই বিষয়টিতে একটি সন্তোষজনক রুডাউন দেয় gives

বিশেষত, আপনি যদি ধরে নিতে পারেন যে আপনার অনুমানকারী of এর বিতরণটি মাল্টিভার গাউসিয়ান, তবে জটিল ডেটার ক্ষেত্রে জটিল জটিলটি ব্যবহার করতে হবে। এই অনুমানকারীর covariance এর গণনা কিছুটা পৃথক, এবং উইকি পৃষ্ঠায় দেওয়া হয়েছে। β^

আমি অন্য একটি উত্স পেয়েছি যা হুশিয়ার হিসাবে একই সিদ্ধান্তে পৌঁছেছে, তবে সর্বাধিক সম্ভাবনার মতো অন্যান্য অনুমানকারীগুলিও আবিষ্কার করে: ইয়ান এট আল থেকে "অনুচিত লিনিয়ার রেগ্রেশন মডেলগুলির অনুমান"।


1

@ হুবারের একটি সুন্দর চিত্রিত এবং ভালভাবে ব্যাখ্যা করা উত্তর থাকলেও আমি মনে করি এটি একটি সরলিকৃত মডেল যা জটিল জায়গার কিছুটা শক্তি মিস করে।

বাস্তবের ক্ষেত্রে লিনিয়ার সর্বনিম্ন-স্কোয়ারের রিগ্রেশন ইনপুট , পরামিতি এবং লক্ষ্য সহ নিম্নলিখিত মডেলের সমতুল্য :β এক্সwβx

z=β0+β1w+ϵ

যেখানে সাধারণত শূন্য গড় এবং কিছু (সাধারণত ধ্রুবক) বৈকল্পিক সহ বিতরণ করা হয়।ϵ

আমি পরামর্শ দিচ্ছি যে জটিল লিনিয়ার রিগ্রেশন নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা উচিত:

z=β0+β1w+β2w¯+ϵ

দুটি প্রধান পার্থক্য আছে।

প্রথমত, স্বাধীনতার একটি অতিরিক্ত ডিগ্রি রয়েছে যা পর্যায়ের সংবেদনশীলতার অনুমতি দেয়। আপনি এটি নাও চান, তবে আপনি সহজেই তা পেতে পারেন।β2

দ্বিতীয়ত, একটি শূন্য গড় এবং কিছু বৈকল্পিক এবং "সিউডো-ভেরিয়েন্স" সহ একটি সাধারণ স্বাভাবিক বিতরণ।ϵ

সত্যিকারের মডেলটিতে ফিরে যাওয়ার পরে, সর্বনিম্ন স্কোয়ার সমাধানটি ক্ষয়কে হ্রাস করে বেরিয়ে আসে, যা নেতিবাচক লগ-সম্ভাবনা। একটি সাধারণ বিতরণের জন্য, এটি প্যারাবোলা:

y=ax2+cx+d.

যেখানে , নির্দিষ্ট (সাধারণত), মডেল অনুসারে শূন্য, এবং ক্ষতির ফাংশনগুলি ধ্রুবক সংযোজনে অন্তর্ভুক্ত হওয়ায় বিষয়টি বিবেচনা করে না।সি ডিx=z(β0+β1w)acd

জটিল মডেলটিতে ফিরে, নেতিবাচক লগ-সম্ভাবনা হ'ল।

y=a|x|2+(bx2+cx)+d.

ডিc এবং পূর্বের মতো শূন্য। হ'ল বক্রতা এবং হ'ল 'সিউডো-বক্রতা'। এনিসোট্রপিক উপাদানগুলি ক্যাপচার করে। যদি ফাংশন আপনাকে বিরক্ত করে, তবে এটি রচনার সমতুল্য উপায় হ'ল জন্য আরও একটি পরামিতি । এখানে এর বৈকল্পিক এবং সিউডো-বৈকল্পিক। model আমাদের মডেল অনুসারে শূন্য।dabb

[xμxμ¯]H[suu¯s¯]1[xμxμ¯]+d
s,u,μ,dsuμ

জটিল জটিল বিতরণের ঘনত্বের চিত্র এখানে রয়েছে:

একটি জটিল অবিচ্ছিন্ন স্বাভাবিক বিতরণের ঘনত্ব

দেখুন এটি কীভাবে অসম্পূর্ণ। প্যারামিটার ছাড়া এটি অসম্পূর্ণ হতে পারে না।b

এটি নিরোধকে জটিল করে তোলে যদিও আমি নিশ্চিত যে সমাধানটি এখনও বিশ্লেষণযোগ্য। আমি একটি ইনপুট ক্ষেত্রে এটি সমাধান করেছি, এবং আমি আমার সমাধান এখানে প্রতিলিপি করতে পেরে খুশি, তবে আমার এমন অনুভূতি আছে যে whuber সাধারণ ক্ষেত্রে সমাধান করতে পারে।


এই অবদানের জন্য আপনাকে ধন্যবাদ। যদিও আমি এটি অনুসরণ করি না, কারণ আমি নিশ্চিত নই (ক) আপনি কেন চতুর্ভুজ বহুপদী পরিচয় করিয়েছেন, (খ) আপনি আসলে "অনুরূপ" বহুবচন দ্বারা কী বোঝাতে চেয়েছেন, বা (গ) আপনি কোন পরিসংখ্যানের মডেল ফিট করছেন। আপনি কি তাদের বিস্তারিত বলতে সক্ষম হবেন?
whuber

@ শুভ আমি এটি একটি পরিসংখ্যানের মডেল হিসাবে আবার লিখেছি। আপনার বোধগম্য হলে দয়া করে আমাকে জানান।
নিল জি

আপনাকে ধন্যবাদ: এটি এটি পরিষ্কার করে (+1) 1 আপনার মডেলটি আর ভেরিয়েবলগুলির বিশ্লেষণমূলক ফাংশন নয়। তবে এটি প্যারামিটারগুলির বিশ্লেষণমূলক ফাংশন হওয়ায় এটি দুটি জটিল ভেরিয়েবল এবং বিপরীতে একাধিক রিগ্রেশন হিসাবে ধারণা করা যেতে পারে । এছাড়াও, আপনি আরও নমনীয় বিতরণ করার অনুমতি দিন: এটি আমার সমাধানের মধ্যে নয়। আমি যতদূর বলতে পারি, আপনার সমাধানটি সবকিছুকে তার আসল এবং কাল্পনিক অংশে রূপান্তর করার এবং বহুবিধ একাধিক বাস্তব রিগ্রেশন পরিচালনা করার সমতুল্য । w ˉ w ϵzww¯ϵ
whuber

@ হুবহু ডান, আমি যে দুটি পরিবর্তনের প্রস্তাব দিয়েছিলাম, আমি মনে করি এটি যেমন ঠিক তেমন রিগ্রেশনকে মাল্টিভারিয়েট করেছেন বলে মনে করি। আপনার সমাধানটিতে বর্ণনার সাথে সাথে রূপান্তরকে সীমাবদ্ধ করতে কে সরানো যেতে পারে। তবে, সিউডো-বক্রতা শব্দের কিছু বাস্তবসম্মত ব্যবহারিক অ্যাপ্লিকেশন রয়েছে যেমন ননজারো স্থল রাষ্ট্রের সাথে এসি ভোল্টেজের পূর্বাভাস দেওয়ার জন্য রিগ্রেশন করার চেষ্টা করা হয়? \Beta2
নীল জি

এটি বিশ্লেষণমূলক ক্রিয়াকলাপ হিসাবে, আপনার তেমনি বিশ্লেষণাত্মক নয় কারণ আপনার ক্ষতির কারণ হ'ল প্যারাবোলয়েড , যা বিশ্লেষক নয়। স্যাডল বিশ্লেষণাত্মক, তবে নিজেই এটি হ্রাস করা যায় না যেহেতু এটি ডাইভারেজ করে। এক্স 2|x|2x2
নীল জি

1

এই সমস্যাটি আবার ম্যাথমেটিকা স্ট্যাকএক্সচেঞ্জে উঠে এসেছে এবং আমার উত্তর / বর্ধিত মন্তব্যটি রয়েছে যে @ ভুবার চমৎকার উত্তর অনুসরণ করা উচিত।

আমার উত্তরটি হ'ল ত্রুটি কাঠামোটিকে আরও স্পষ্ট করে @ শুক্রের জবাবকে কিছুটা প্রসারিত করার প্রয়াস। প্রস্তাবিত সর্বনিম্ন স্কোয়ারের অনুমানকারীটি হ'ল যদি বিভাজনে ত্রুটি বিতরণটির বাস্তব এবং কাল্পনিক উপাদানগুলির মধ্যে শূন্য সম্পর্ক থাকে তবে কেউ কী ব্যবহার করবে। (তবে উত্পন্ন ডেটার সাথে একটি ত্রুটির সম্পর্ক 0.8 রয়েছে))

যদি কারও কাছে একটি প্রতীকী বীজগণিত প্রোগ্রামে অ্যাক্সেস থাকে, তবে প্যারামিটারগুলির সর্বাধিক সম্ভাবনা অনুমান ("উভয়" স্থির "প্রভাবগুলি এবং covariance কাঠামো) তৈরির কিছু গণ্ডগোল দূর করা যেতে পারে। নীচে আমি @ হুবহরের উত্তরের মতো একই ডেটা ব্যবহার করি এবং ধরে এবং তারপরে ধরে ধরে সর্বাধিক সম্ভাবনার অনুমান তৈরি । আমি গাণিতিক ব্যবহার করেছি তবে আমি সন্দেহ করি যে অন্য কোনও প্রতীকী বীজগণিত প্রোগ্রামটি এরকম কিছু করতে পারে। (এবং আমি প্রথমে কোড এবং আউটপুটটির একটি ছবি পোস্ট করেছি যার পরে একটি পরিশিষ্টে আসল কোডটি পেয়েছি কারণ আমি গাণিতিক কোডটি কেবল টেক্সট ব্যবহারের সাথে দেখতে দেখতে পাচ্ছি না))ρ=0ρ0

ডেটা এবং সর্বনিম্ন স্কোয়ারের অনুমানকারী

এখন সর্বাধিক সম্ভাবনা অনুমানের জন্য ...ρ=0

সর্বাধিক সম্ভাবনা অনুমান করে ধরে নেওয়া যে rho শূন্য

আমরা দেখতে পাই যে সর্বাধিক সম্ভাবনা অনুমান করে যা অনুমান করে যে least মোট সর্বনিম্ন বর্গ অনুমানের সাথে পুরোপুরি মেলে।ρ=0

এখন ডেটাটি জন্য একটি অনুমান নির্ধারণ করুন :ρ

Rho সহ সর্বাধিক সম্ভাবনার অনুমান

আমরা দেখতে এবং মূলত অভিন্ন থাকুক বা না থাকুক আমরা প্রাক্কলন জন্য অনুমতি দেয় । তবে ডেটা উত্পন্ন মানের সাথে অনেক বেশি কাছাকাছি (যদিও 1 এর নমুনা আকারের কমপক্ষে বলা নিশ্চিত নয়) এবং সম্ভাবনার লগ অনেক বেশি।γ0δ0ργ1

এই সমস্ত ক্ষেত্রে আমার বক্তব্যটি হ'ল মডেলটিকে ফিট থাকা সম্পূর্ণরূপে সুস্পষ্টভাবে তৈরি করা দরকার এবং প্রতীকী বীজগণিত প্রোগ্রামগুলি গণ্ডগোল দূর করতে সহায়তা করতে পারে। (এবং অবশ্যই, সর্বাধিক সম্ভাবনা অনুমানকারী একটি বিভাজনযুক্ত সাধারণ বিতরণ গ্রহণ করে যা ন্যূনতম স্কোয়ারের অনুমানকারীরা ধরে নেয় না))

পরিশিষ্ট: সম্পূর্ণ গাণিতিক কোড

(* Predictor variable *)
w = {0 - 5 I, -3 - 4 I, -2 - 4 I, -1 - 4 I, 0 - 4 I, 1 - 4 I, 2 - 4 I,
    3 - 4 I, -4 - 3 I, -3 - 3 I, -2 - 3 I, -1 - 3 I, 0 - 3 I, 1 - 3 I,
    2 - 3 I, 3 - 3 I, 4 - 3 I, -4 - 2 I, -3 - 2 I, -2 - 2 I, -1 - 2 I,
    0 - 2 I, 1 - 2 I, 2 - 2 I, 3 - 2 I, 
   4 - 2 I, -4 - 1 I, -3 - 1 I, -2 - 1 I, -1 - 1 I, 0 - 1 I, 1 - 1 I, 
   2 - 1 I, 3 - 1 I, 
   4 - 1 I, -5 + 0 I, -4 + 0 I, -3 + 0 I, -2 + 0 I, -1 + 0 I, 0 + 0 I,
    1 + 0 I, 2 + 0 I, 3 + 0 I, 4 + 0 I, 
   5 + 0 I, -4 + 1 I, -3 + 1 I, -2 + 1 I, -1 + 1 I, 0 + 1 I, 1 + 1 I, 
   2 + 1 I, 3 + 1 I, 4 + 1 I, -4 + 2 I, -3 + 2 I, -2 + 2 I, -1 + 2 I, 
   0 + 2 I, 1 + 2 I, 2 + 2 I, 3 + 2 I, 
   4 + 2 I, -4 + 3 I, -3 + 3 I, -2 + 3 I, -1 + 3 I, 0 + 3 I, 1 + 3 I, 
   2 + 3 I, 3 + 3 I, 4 + 3 I, -3 + 4 I, -2 + 4 I, -1 + 4 I, 0 + 4 I, 
   1 + 4 I, 2 + 4 I, 3 + 4 I, 0 + 5 I};
(* Add in a "1" for the intercept *)
w1 = Transpose[{ConstantArray[1 + 0 I, Length[w]], w}];

z = {-15.83651 + 7.23001 I, -13.45474 + 4.70158 I, -13.63353 + 
    4.84748 I, -14.79109 + 4.33689 I, -13.63202 + 
    9.75805 I, -16.42506 + 9.54179 I, -14.54613 + 
    12.53215 I, -13.55975 + 14.91680 I, -12.64551 + 
    2.56503 I, -13.55825 + 4.44933 I, -11.28259 + 
    5.81240 I, -14.14497 + 7.18378 I, -13.45621 + 
    9.51873 I, -16.21694 + 8.62619 I, -14.95755 + 
    13.24094 I, -17.74017 + 10.32501 I, -17.23451 + 
    13.75955 I, -14.31768 + 1.82437 I, -13.68003 + 
    3.50632 I, -14.72750 + 5.13178 I, -15.00054 + 
    6.13389 I, -19.85013 + 6.36008 I, -19.79806 + 
    6.70061 I, -14.87031 + 11.41705 I, -21.51244 + 
    9.99690 I, -18.78360 + 14.47913 I, -15.19441 + 
    0.49289 I, -17.26867 + 3.65427 I, -16.34927 + 
    3.75119 I, -18.58678 + 2.38690 I, -20.11586 + 
    2.69634 I, -22.05726 + 6.01176 I, -22.94071 + 
    7.75243 I, -28.01594 + 3.21750 I, -24.60006 + 
    8.46907 I, -16.78006 - 2.66809 I, -18.23789 - 
    1.90286 I, -20.28243 + 0.47875 I, -18.37027 + 
    2.46888 I, -21.29372 + 3.40504 I, -19.80125 + 
    5.76661 I, -21.28269 + 5.57369 I, -22.05546 + 
    7.37060 I, -18.92492 + 10.18391 I, -18.13950 + 
    12.51550 I, -22.34471 + 10.37145 I, -15.05198 + 
    2.45401 I, -19.34279 - 0.23179 I, -17.37708 + 
    1.29222 I, -21.34378 - 0.00729 I, -20.84346 + 
    4.99178 I, -18.01642 + 10.78440 I, -23.08955 + 
    9.22452 I, -23.21163 + 7.69873 I, -26.54236 + 
    8.53687 I, -16.19653 - 0.36781 I, -23.49027 - 
    2.47554 I, -21.39397 - 0.05865 I, -20.02732 + 
    4.10250 I, -18.14814 + 7.36346 I, -23.70820 + 
    5.27508 I, -25.31022 + 4.32939 I, -24.04835 + 
    7.83235 I, -26.43708 + 6.19259 I, -21.58159 - 
    0.96734 I, -21.15339 - 1.06770 I, -21.88608 - 
    1.66252 I, -22.26280 + 4.00421 I, -22.37417 + 
    4.71425 I, -27.54631 + 4.83841 I, -24.39734 + 
    6.47424 I, -30.37850 + 4.07676 I, -30.30331 + 
    5.41201 I, -28.99194 - 8.45105 I, -24.05801 + 
    0.35091 I, -24.43580 - 0.69305 I, -29.71399 - 
    2.71735 I, -26.30489 + 4.93457 I, -27.16450 + 
    2.63608 I, -23.40265 + 8.76427 I, -29.56214 - 2.69087 I};

(* whuber 's least squares estimates *)
{a, b} = Inverse[ConjugateTranspose[w1].w1].ConjugateTranspose[w1].z
(* {-20.0172+5.00968 \[ImaginaryI],-0.830797+1.37827 \[ImaginaryI]} *)

(* Break up into the real and imaginary components *)
x = Re[z];
y = Im[z];
u = Re[w];
v = Im[w];
n = Length[z]; (* Sample size *)

(* Construct the real and imaginary components of the model *)
(* This is the messy part you probably don't want to do too often with paper and pencil *)
model = \[Gamma]0 + I \[Delta]0 + (\[Gamma]1 + I \[Delta]1) (u + I v);
modelR = Table[
   Re[ComplexExpand[model[[j]]]] /. Im[h_] -> 0 /. Re[h_] -> h, {j, n}];
(* \[Gamma]0+u \[Gamma]1-v \[Delta]1 *)
modelI = Table[
   Im[ComplexExpand[model[[j]]]] /. Im[h_] -> 0 /. Re[h_] -> h, {j, n}];
(* v \[Gamma]1+\[Delta]0+u \[Delta]1 *)

(* Construct the log of the likelihood as we are estimating the parameters associated with a bivariate normal distribution *)
logL = LogLikelihood[
   BinormalDistribution[{0, 0}, {\[Sigma]1, \[Sigma]2}, \[Rho]],
   Transpose[{x - modelR, y - modelI}]];

mle0 = FindMaximum[{logL /. {\[Rho] -> 
      0, \[Sigma]1 -> \[Sigma], \[Sigma]2 -> \[Sigma]}, \[Sigma] > 
    0}, {\[Gamma]0, \[Delta]0, \[Gamma]1, \[Delta]1, \[Sigma]}]
(* {-357.626,{\[Gamma]0\[Rule]-20.0172,\[Delta]0\[Rule]5.00968,\[Gamma]1\[Rule]-0.830797,\[Delta]1\[Rule]1.37827,\[Sigma]\[Rule]2.20038}} *)

(* Now suppose we don't want to restrict \[Rho]=0 *)
mle1 = FindMaximum[{logL /. {\[Sigma]1 -> \[Sigma], \[Sigma]2 -> \[Sigma]}, \[Sigma] > 0 && -1 < \[Rho] < 
     1}, {\[Gamma]0, \[Delta]0, \[Gamma]1, \[Delta]1, \[Sigma], \[Rho]}]
(* {-315.313,{\[Gamma]0\[Rule]-20.0172,\[Delta]0\[Rule]5.00968,\[Gamma]1\[Rule]-0.763237,\[Delta]1\[Rule]1.30859,\[Sigma]\[Rule]2.21424,\[Rho]\[Rule]0.810525}} *)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.