uv
maxcov(Xu,Yv).(1)
Yভার ( y ) x 2 ভার ( x 1 ) = ভার ( x 2 ) = 1 ভার ( এক্স u ) ≠ 1 ইউcov(Xu,y)≡Var(Xu)1/2×cor(Xu,y)×Var(y)1/2,st.∥u∥=1.
যেহেতু উপর নির্ভর করে না , আমরা পূর্ণবিস্তার আছে । আসুন বিবেচনা করা যাক , যেখানে ডেটা পৃথকভাবে মানক করা হয় (আমি প্রথমে পৃথকভাবে এবং পরিবর্তে আপনার লিনিয়ার সংমিশ্রণটি স্কেল করার জন্য ভুল করেছিলাম !), যাতে ; তবে এবং উপর নির্ভর করে । উপসংহারে,
সুপ্ত উপাদান এবং প্রতিক্রিয়া ভেরিয়েবলের মধ্যে সর্বাধিক সম্পর্ক কার্যকরভাবে একই ফলাফল দেয় নাVar(y)Var স্বাগতম ( এক্স তোমার দর্শন লগ করা ) 1 / 2 × করি ( এক্স তোমার দর্শন লগ করা , Y ) এক্স 1uVar(Xu)1/2×cor(Xu,y)X=[x_1;x_2]
x1x2Var(x1)=Var(x2)=1Var(Xu)≠1u।
আমার আর্থার টেনেনহাউসকে ধন্যবাদ জানাতে হবে যিনি আমাকে সঠিক দিকে নির্দেশ করেছেন।
ইউনিট ওজন ভেক্টর ব্যবহার নিয়ন্ত্রণমূলক নয় এবং কিছু প্যাকেজ ( pls. regression
মধ্যে plsgenomics , Wehrens এর আগে প্যাকেজ থেকে কোডের উপর ভিত্তি করে pls.pcr
) unstandardized ওজন ভেক্টর ফিরে আসবে (কিন্তু আদর্শ 1 এখনও সুপ্ত উপাদান সহ), যদি অনুরোধ করা হয়েছে। কিন্তু পিএলএস প্যাকেজ অধিকাংশ আদর্শায়িত ফিরে আসবে , এক আপনি ব্যবহার সহ উল্লেখযোগ্য হল SIMPLS বাস্তবায়ন ঐ বা NIPALS অ্যালগরিদম; ব্যারি এম ওয়াইজের উপস্থাপনা, আংশিক স্বল্প স্কোয়ার্সের সম্পত্তি (পিএলএস) রিগ্রেশন এবং অ্যালগরিদমের মধ্যে পার্থক্য উভয় পদ্ধতির একটি ভাল ওভারভিউ আমি পেয়েছি তবে কেমোমেট্রিক্সuভিগনেট একটি ভাল আলোচনার প্রস্তাব দেয় (পৃষ্ঠা 26-29)। বিশেষ গুরুত্বের পাশাপাশি এটি হ'ল বেশিরভাগ পিএলএস রুটিনগুলি (কমপক্ষে একটিটি আমি আর এর মধ্যে জানি ass )।
বাধ্যতা দেওয়া , ভেক্টর হতে পাওয়া যায়ইউ ইউ = এক্স ′ ওয়u′u=1u
u=X′y∥X′y∥.
সামান্য সিমুলেশন ব্যবহার করে, এটি নিম্নলিখিত হিসাবে প্রাপ্ত করা যেতে পারে:
set.seed(101)
X <- replicate(2, rnorm(100))
y <- 0.6*X[,1] + 0.7*X[,2] + rnorm(100)
X <- apply(X, 2, scale)
y <- scale(y)
# NIPALS (PLS1)
u <- crossprod(X, y)
u <- u/drop(sqrt(crossprod(u))) # X weights
t <- X%*%u
p <- crossprod(X, t)/drop(crossprod(t)) # X loadings
আপনি উপরের ফলাফলগুলি ( u=[0.5792043;0.8151824]
বিশেষত) আর প্যাকেজগুলি যা দেবে তার সাথে তুলনা করতে পারেন। যেমন, থেকে NIPALS ব্যবহার chemometrics প্যাকেজ (অন্য বাস্তবায়ন আমি জানি যে পাওয়া যায় mixOmics প্যাকেজ), আমরা প্রাপ্ত হবে:
library(chemometrics)
pls1_nipals(X, y, 1)$W # X weights [0.5792043;0.8151824]
pls1_nipals(X, y, 1)$P # X loadings
অনুরূপ ফলাফল plsr
এবং এটির ডিফল্ট কার্নেল পিএলএস অ্যালগরিদম প্রাপ্ত হবে :
> library(pls)
> as.numeric(loading.weights(plsr(y ~ X, ncomp=1)))
[1] 0.5792043 0.8151824
সমস্ত ক্ষেত্রে, আমরা পরীক্ষা করতে পারি যে দৈর্ঘ্য 1।u
আপনি যদি আপনার ফাংশনটি পড়েন তবে তার সাথে অনুকূলতার জন্য এটি পরিবর্তন করে
f <- function(u) cov(y, X%*%(u/sqrt(crossprod(u))))
এবং u
পরে ( u <- u/sqrt(crossprod(u))
) স্বাভাবিক করুন , আপনার উপরের সমাধানটির আরও কাছাকাছি হওয়া উচিত।
সিডিনোট : মাপদণ্ড (1) যেহেতু সমতুল্য
এর এসভিডি থেকে বাম একক ভেক্টর হিসাবে পাওয়া যাবে বৃহত্তম সাথে সম্পর্কিত:ইউ এক্স ′ ওয়াই
maxu′X′Yv,
uX′Y
svd(crossprod(X, y))$u
আরও সাধারণ ক্ষেত্রে (পিএলএস 2), উপরোক্ত সংক্ষিপ্ত করার একটি উপায় বলা যায় যে প্রথম পিএলএস ক্যানোনিকাল ভেক্টরগুলি উভয় দিকের এক্স এবং ওয়াইয়ের কোভেরিয়েন্স ম্যাট্রিক্সের সর্বাধিক সন্নিকট।
তথ্যসূত্র
- টেনেনহাউস, এম (1999)। এল'প্রোচ পিএলএস । রিভ্যু ডি স্ট্যাটিস্টিক অ্যাপ্লিকুই , 47 (2), 5-40।
- টের ব্রেক, সিজেএফ এবং ডি জং, এস (1993)। আংশিক সর্বনিম্ন স্কোয়ার রিগ্রেশনের উদ্দেশ্যগত কার্য । কেমোমেট্রিক্স জার্নাল , 12, 41-55।
- আব্বি, এইচ (২০১০) আংশিক সর্বনিম্ন স্কোয়ারের রিগ্রেশন এবং প্রচ্ছন্ন কাঠামো রিগ্রেশন (পিএলএস রিগ্রেশন) -এর অভিক্ষেপ । উইলে আন্তঃবিষয়ক পর্যালোচনা: গণনা পরিসংখ্যান , 2, 97-106।
- বুলেস্টেক্স, এএল এবং স্ট্রাইমার, কে (2007)। আংশিক সর্বনিম্ন স্কোয়ারগুলি: উচ্চ-মাত্রিক জিনোমিক ডেটা বিশ্লেষণের জন্য একটি বহুমুখী সরঞ্জাম । বায়োইনফরম্যাটিকসে ব্রিফিংস, 8 (1), 32-44।
pls
এই জেএসএস কাগজে প্যাকেজ এবং পিএলএস রিগ্রেশন সম্পর্কে একটি ভাল ওভারভিউ রয়েছে ।