লিনিয়ার রিগ্রেশন যখন আপনি কেবল


13

ধরুন Xβ=Y

আমরা জানি না Y ঠিক, প্রতিটি predictor সঙ্গে শুধুমাত্র তার পারস্পরিক সম্পর্ক XtY

সাধারণ লিস্ট স্কোয়ারগুলির (OLS ঔজ্জ্বল্যের প্রেক্ষাপটে) সমাধান β=(XtX)1XtY এবং একটি সমস্যা নয়।

তবে ধরুন XtX একবাক্য (মাল্টিকোলাইনারিটি) এর নিকটবর্তী এবং আপনার সর্বোত্তম রিজ প্যারামিটারটি অনুমান করতে হবে। সমস্ত পদ্ধতিতে সঠিক মান প্রয়োজন বলে মনে হচ্ছে Y

শুধুমাত্র XtY জানা গেলে কি বিকল্প বিকল্প আছে ?


আকর্ষণীয় প্রশ্ন। সম্ভবত কোনও প্রকার ইএম অ্যালগরিদম কাজ করবে ...
সম্ভাব্যতা

আমি বুঝতে পারি না, আপনি অনুকূল রিজ প্যারামিটার অনুমানের জন্য ক্রস-বৈধতা ব্যবহার করতে পারবেন না?
পার্ডিস

@ পার্ডিস: প্রশ্নের কোনও ক্ষতির ফাংশন দেওয়া হয়নি তাই সর্বোত্তম মানে কী তা আমরা জানি না । ক্ষতির ফাংশনটি যদি এমএসই হয় তবে আমরা কীভাবে যে সমস্যাটি চালাচ্ছি তা দেখতে পাচ্ছেন?
কার্ডিনাল

1
@ জনস্মিত: আপনি যে বিন্দুতে গাড়ি চালাচ্ছিলেন সে দিকে আপনি ইঙ্গিত দিচ্ছেন। "অনুকূলতা" কীভাবে পরিমাপ করা যায় তার কোনও ইঙ্গিত নেই। আপনি কার্যকরভাবে যা করছেন তা ভবিষ্যদ্বাণী বা ফিটের "মানের" পরিমাপ করতে একটি আলাদা মেট্রিক (দূরত্ব ফাংশন) প্রবর্তন করা হচ্ছে। আমার সন্দেহ হয় যে খুব দূরে যেতে আমাদের ওপি থেকে আরও বিশদ প্রয়োজন।
কার্ডিনাল

1
@ পার্ডিস: অনুগ্রহ করে অনুসন্ধান করা সমস্যা নয়, যেমনটি আপনি লক্ষ্য করেছেন। :) তবে, আপনি যদি ক্রসওয়েডিয়েশন করার সিদ্ধান্ত নেন, আপনি কীভাবে প্রতিটি পুনরাবৃত্তির জন্য বাম-আউট ভাঁজে থাকা নমুনা এমএসইর অনুমান করতে যাচ্ছেন? :)
কার্ডিনাল

উত্তর:


8

এটা একটি মজার প্রশ্ন। আশ্চর্যের বিষয় হল, কিছু নির্দিষ্ট অনুমানের আওতায় কিছু করা সম্ভব, তবে অবশিষ্টাংশগুলি সম্পর্কে তথ্যের সম্ভাব্য ক্ষতি রয়েছে। এটি উপর নির্ভর করে যে কতটা হারিয়েছে।X

আসুন একবচন মান পচানি নিম্নলিখিত বিবেচনা এর সঙ্গে একটি orthonormal কলাম সহ ম্যাট্রিক্স, একটি তির্যক ইতিবাচক একবচন মান ম্যাট্রিক্স মধ্যে তির্যক এবং একটি অর্থোগোনাল ম্যাট্রিক্স। তারপরে কলামগুলি এবং এর কলাম স্থানের জন্য orthonormal ভিত্তি করে এর অভিক্ষেপের জন্য সহগের ভেক্টরX=UDVtইউ এন × পি ডি 12পি > 0 ভী পি × পি ইউ এক্স টু Z = ইউ টি ওয়াই = ডি - 1 ভী টি ভি ডি ইউ টি ওয়াই = ডি - 1 ভী টি এক্স টি ওয়াই ওয়াই ইউ জেড এক্স এক্স টি ওয়াইXUn×pDd1d2...dp>0Vp×pUX

Z=UtY=D1VtVDUtY=D1VtXtY
Yএই কলাম স্থানটিতে যখন কলাম স্তরে প্রসারিত হবে। সূত্র থেকে আমরা দেখতে পাচ্ছি যে কেবলমাত্র এবং জ্ঞান থেকে গণনাযোগ্য ।UZXXtY

যেহেতু প্রদত্ত জন্য রিজ রিগ্রেশন পূর্বাভাসকারীকে হিসাবে গণনা করা যায় আমরা দেখতে পাই যে কলাম স্তরে রিজ রিগ্রেশন প্রেডিক্টরের জন্য সহগগুলি ients Now এখন আমরা অনুমান করি যে এর ডাইমেনশনাল গড় mean এবং কোভেরিয়েন্স ম্যাট্রিক্স । তারপরে এর ডাইমেনশনাল মানে এবং কোভারিয়েন্স ম্যাট্রিক্স । আমরা যদি স্বতন্ত্র কল্পনা করি1 ডি জেড Y এনλ ইউ জেড =ডি(ডি2+λআই)-

Y^=X(XtX+λI)1XtY=UD(D2+λI)1DUtY=UD(D2+λI)1DZ
U
Z^=D(D2+λI)1DZ.
Ynσ 2 আমি এন জেড পি ইউ টি ξ σ 2 আমি পি ওয়াই নিউ ওয়াই এক্স টু Z নিউ = ইউ টি ওয়াই নিউ টু Z | | ওয়াই নিউ - ওয়াই | | 2ξσ2InZpUtξσ2IpYNew হিসাবে একই ডিস্ট্রিবিউশনের সাথে (চালু শর্তসাপেক্ষে সবকিছু hereon থেকে) সংশ্লিষ্ট একই হয়েছে হিসাবে বিতরণ এবং স্বতন্ত্র এবং এখানে তৃতীয় সমতা এবং এবং চতুর্থ যে সত্য দ্বারাYXZNew=UtYNewZওয়াইনিউ-ইউজেডনিউইউজেডনিউ-ইউ জেড ইউভুল0λ
E||YNewY^||2=E||YNewUZNew+UZNewUZ^||2=E||YNewUZNew||2+E||UZNewUZ^||2=Err0+E||ZNewZ^||2.
YNewUZNewUZNewUZ^U অরথনরমাল কলাম রয়েছে। পরিমাণ একটি ত্রুটি যে আমরা সম্পর্কে কোনো তথ্য পাওয়া যেতে পারে, কিন্তু এটি উপর নির্ভর করে না পারেন। বাম হাতের ভবিষ্যদ্বাণী ত্রুটিটি হ্রাস করতে আমাদের ডান হাতের দ্বিতীয় শব্দটি ছোট করতে হবে।Err0λ

একটি স্ট্যান্ডার্ড গণনা দ্বারা এখানে প্যারামিটার সহ রিজ রিগ্রেশনের জন্য স্বাধীনতার কার্যকর ডিগ্রি হিসাবে পরিচিত । একটি পক্ষপাতিত্বহীন মূল্নির্ধারক হয় df(λ

E||ZNewZ^||2=E||ZZ^||2+2i=1pcov(Zi,Z^i)=E||ZZ^||2+2σ2i=1pdi2di2+λdf(λ).
λ E | | জেড - জেড | | 2 ত্রুটি ( λ ) = | | জেড - জেড | | 2 = পি i = 1 ( 1 - ডি 2 আই)df(λ)λE||ZZ^||2
err(λ)=||ZZ^||2=i=1p(1di2di2+λ)2Zi2.

আমরা এটিকে (নিরপেক্ষ) অনুমানকারী এর সাথে একত্রিত করি প্রদত্ত যে আমরা know জানি , যা আমাদের তখন কমিয়ে আনা দরকার। একথাও ঠিক যে, এই শুধুমাত্র কাজ করা যেতে পারে যদি আমরা জানি বা একটি যুক্তিসঙ্গত অনুমান বা মূল্নির্ধারক আছে ।

err(λ)+2σ2df(λ)
E||ZNewZ^||2σ2σ2σ2

অনুমান করা আরও সমস্যাযুক্ত হতে পারে। এটি দেখানো সম্ভব যে সুতরাং যদি এত ছোট নির্বাচন করা সম্ভব হয় যে স্কোয়ার পক্ষপাতটি উপেক্ষা করা যায় তবে আমরা কে হিসাবে অনুমান করার চেষ্টা করতে পারি এটি যদি কাজ করে তবে উপর অনেক নির্ভর করে ।σ2

E||ZZ^||2=σ2(pi=1pdi2di2+λ(2di2di2+λ)d(λ))+bias(λ)2.
λσ2
σ^2=1pd(λ)||ZZ^||2.
X

জন্য কিছু কিছু বিবরণ অনুচ্ছেদ 3.4.1 এবং অধ্যায় 7 দেখতে ইএসএল অথবা সম্ভবত আরও ভাল মধ্যে অধ্যায় 2 GAM


0

নির্ধারণ প্রশ্ন ও হিসেবে বিভিন্ন পরামিতি জন্য এবং সেট নমুনা লেবেল। তারপরে অজানা থেকে ড্রপ বেরিয়ে যাওয়ার পরে গণনযোগ্য নিয়ম।β ( λ , কে ) = [ββ(λ,K)=[(XTX)KK+λI]1(XTY)KλKe(λ,K):=Xβ(λ,K)Y2XβY2Y2

এটি নিম্নলিখিত অ্যালগরিদম বাড়ে:

  • গণনা ট্রেনিং সেট কিছু পছন্দ জন্য ।কেe(λ,K)K
  • Mb একটি ফাংশন হিসাবে ফলাফল প্লট করুন ।λ
  • প্লটটি সর্বাধিক সজ্জিত একটি মান গ্রহণ করুন ।λ
  • ব্যবহারের চূড়ান্ত হিসাব হিসাবে।β=[XTX+λI]1XTY

1
আমি অনুমান করছি "প্লটটি সর্বাপেক্ষা জনপ্রিয় যেখানে" প্রায় 0 :) এর মতো খুব ছোট হবেλ
jboman

@ জাবোম্যান: সমস্যাটি ঠিকঠাক থাকলে এবং নিয়মিতকরণের প্রয়োজন না হলে এটি কেবল তখনই ঘটতে পারে, তবে অবশ্যই পর্যাপ্ত। অসুস্থ নিয়ন্ত্রিত ক্ষেত্রে, বাহিরে আইটেম ভবিষ্যদ্বাণী কারণ overfitting দরিদ্র হবে, এবং অতএব বড় হতে হবে। কে ( λ , কে )λ=0Ke(λ,K)
আর্নল্ড নিউমায়ার

3
@ আর্নল্ডনিউমায়ার: কে নয়। আমরা কেবল প্রতিটি ভবিষ্যদ্বাণীকের সাথে পারস্পরিক সম্পর্ক জানি। "ভবিষ্যদ্বাণীকারী ডোমেনে" থাকে, "ওয়াই ডোমেন" তে থাকে না (এন যদি নমুনার আকার হয় এবং ভবিষ্যদ্বাণীকারীদের সংখ্যা পি হয় তবে আমাদের কেবলমাত্র পি মান রয়েছে, প্রতিটি ভবিষ্যদ্বাণীকের জন্য একটি)। ( এক্স টি ওয়াই )(XTY)K(XTY)
জাগ

@Jag অতঃপর সেখানে নির্বাচনের জন্য পর্যাপ্ত তথ্য নেই । তবে অবশ্যই কোনওভাবে সংগ্রহ করা উচিত। যদি সংগ্রহের সময় আপনি নমুনা ব্যাচগুলিতে বিভক্ত করেন এবং প্রতিটি ব্যাচের জন্য আলাদাভাবে একত্রিত করেন তবে ক্রস বৈধতার জন্য প্রতিটি একটি ব্যাচ সংরক্ষণ করতে পারে re এক্স টি ওয়াই কে এক্স টি ওয়াইλXTYkXTY
আর্নল্ড নিউমায়ার

@ আর্নল্ডনিউমার: বাহ্যিকভাবে দেওয়া হয়, সংগ্রহ করা হয় না। XTY
জাগ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.