রিজ রিগ্রেশন এবং পিসিএ রিগ্রেশন মধ্যে সম্পর্ক


19

আমি (সঙ্গে শৈলশিরা রিগ্রেশন মধ্যে একটি সংযোগ ওয়েবে পঠিত কোথাও থাকার স্মরণ এবং পিসিএ রিগ্রেশন নিয়মিতকরণ): ব্যবহার করার সময় 2 hyperparameter সঙ্গে -regularized রিগ্রেশন λ , যদি22λ , তারপর রিগ্রেশন সঙ্গে পিসি পরিবর্তনশীল সরানোর সমতূল্য সবচেয়ে ছোট এগেনুয়ালু।λ0

  • এটা সত্য কেন?
  • অপ্টিমাইজেশন প্রক্রিয়াটির সাথে এর কোনও যোগসূত্র আছে কি? উদাসীনভাবে, আমি এটি ওএলএসের সমতুল্য হয়ে উঠবে বলে আশা করতাম।
  • কারও কি এর রেফারেন্স আছে?

1
আপনার বিবৃতিতে পিসিএ এবং রিগ্রেশন কীভাবে সংযুক্ত রয়েছে তা আপনি আরও স্পষ্টভাবে ব্যাখ্যা করতে পারেন? রিগ্রেশন স্বতন্ত্র ভেরিয়েবল থেকে নির্ভরশীল পৃথক করে, যেখানে পিসিএতে বাছাইয়ের কিছুই হয় না। সুতরাং আপনি কোন পরিবর্তনশীল পিসিএ প্রয়োগ করছেন? এটি কেবল স্বতন্ত্র ভেরিয়েবল হতে পারে না, কারণ এতে রিগ্রেশনটির সাথে খুব একটা সম্পর্ক নেই। তবে এটি যদি সমস্ত ভেরিয়েবলের ক্ষেত্রে প্রয়োগ করা হয়, তবে ইগেনভেেক্টরগুলি সেগুলির সকলের লিনিয়ার সংমিশ্রণ। এটি নির্ভরশীল ভেরিয়েবলের সাথে জড়িত থাকার কারণে এটি ডেটাসেট থেকে এই জাতীয় কোনও উপাদান অপসারণ করার কী অর্থ হতে পারে ?
হোবার

1
সংযোগটি (যেমন আমি বুঝতে পেরেছি), এটি হ'ল আপনি যদি খুব খুব ছোট নিয়মিতকরণ জরিমানা ব্যবহার করেন তবে একটি এল 2-নিয়মিত রিগ্রেশনটি সেই ভেরিয়েবলটিকে সরিয়ে ফেলবে যা সবচেয়ে ছোট এগেনুয়ালুয় রয়েছে। অতএব, ডিজাইনের ম্যাট্রিক্সে এসভিডি করা এবং ক্ষুদ্রতম এগেনুয়ালুয়ের সাথে পরিবর্তনশীল অপসারণ করা "নরম" নিয়মিতকরণ জরিমানা সহ একটি রিগ্রেশনের সমতুল্য ... এটি আমার নিকটতম ব্যাখ্যা যা আমি খুঁজে পেয়েছি: সাইট.stat.psu। ইডু / ~ জিয়ালি / কোর্স / স্টেট597 ই / নোটস 2 / লরেগ.পিডিএফ
জোসে জি

3
আপনার উল্লেখ আপনি আপনার মন্তব্য কি বলছে বিপরীত প্রকট হচ্ছে: ছোট জন্য , সেখানে ফলাফলে খুব সামান্য পরিবর্তন। কিছুই কিছু সরানো হয় না। আসলে, বেশ কয়েকটি স্লাইড লক্ষ্য করে মনে হচ্ছে এল 2 জরিমানাভিত্তিক রিগ্রেশন (যার মধ্যে অনুমানগুলি 0 এর দিকে সঙ্কুচিত হয় ) এবং "পিসিএ রিগ্রেশন" (যাতে ক্ষুদ্রতম উপাদানগুলি পুরোপুরি সরিয়ে ফেলা হয় - যা খুব খারাপ জিনিস হতে পারে কিছু পরিস্থিতিতে)। λL20
শুকনো

2
মিমি .. অন্য রেফারেন্সটি পেয়েছে: স্টেটওব.স্তানফোর্ড.ইডু / আওউইন / সার্কেসস / 305 / Rudyregulariization.pdf স্লাইডে, " এবং মূল উপাদানগুলি", এতে বলা হয়েছে যে এই উপাদানগুলির সাথে রিজ রিগ্রেশন প্রকল্পগুলি y বড় ডিজে * দীর্ঘশ্বাস *YRআমি
হোসে জি

3
আপনি কি পি লক্ষ করেছেন? সেই সর্বশেষতম রেফারেন্সের 14 টি আপনার প্রশ্নের স্পষ্ট উত্তর দেয়?
হোয়বার

উত্তর:


23

যাক কেন্দ্রিক হতে এন × পি predictor ম্যাট্রিক্স এবং তার একবচন মান পচানি বিবেচনা এক্স = ইউ এস ভি সঙ্গে এস তির্যক উপাদানের সঙ্গে একটি তির্যক ম্যাট্রিক্স হচ্ছে গুলি আমিএক্সএন×পিএক্স=ইউএসভীএসগুলিআমি

সাধারণ লিস্ট স্কোয়ার এর লাগানো মান (OLS ঔজ্জ্বল্যের প্রেক্ষাপটে) রিগ্রেশন দ্বারা দেওয়া হয় Y হে এল এস = এক্স β হে এল এস = এক্স ( এক্সএক্স ) - 1 এক্সY = ইউ ইউYশৈলশিরা রিগ্রেশন এর লাগানো মান দ্বারা দেওয়া হয় Y r আমি = এক্স β r আমি = এক্স ( এক্সএক্স

y^OLS=XβOLS=X(XX)1Xy=UUy.
পিসিএ রিগ্রেশন (পিসিআর) সঙ্গে এর লাগানো মানউপাদান দ্বারা দেওয়া হয় Y পিসিআর=এক্সপিসিএকটিβপিসিআর=ইউ
y^ridge=Xβridge=X(XX+λI)1Xy=Udiag{si2si2+λ}Uy.
k সেখানে জিরোদের পরে কে রয়েছে।
Y^পিসিআর=এক্সপিসিএকজনβপিসিআর=ইউআমিএকটি{1,...,1,0,...0}ইউY,

এখান থেকে আমরা দেখতে পাচ্ছি:

  1. তাহলে তারপর Y R আমি = Y হে এল এসλ=0Y^Rআমি=Y^হেএলএস

  2. λ>0গুলিআমিগুলিআমি2λ

  3. λ=0λ=

  4. এর অর্থ হ'ল রিজ রিগ্রেশনকে পিসিআর এর "স্মুথ সংস্করণ" হিসাবে দেখা যেতে পারে।

    গুলিআমিএক্স

  5. রিজ রিগ্রেশন অনুশীলনে আরও ভাল পারফর্ম করে (যেমন উচ্চতর ক্রস-বৈধতাযুক্ত পারফরম্যান্স থাকতে পারে)।

  6. λ0Y^RআমিY^হেএলএসগুলিআমি

একটি ভাল রেফারেন্স হল পরিসংখ্যানগত শিক্ষার উপাদানসমূহ , বিভাগ 3.4.1 "রিজ রিগ্রেশন"।


এই থ্রেডটিও দেখুন: থ্রেডটিও রিগ্রেশনে রিজ নিয়মিতকরণের ব্যাখ্যা এবং বিশেষত @ ব্রায়ানবার্সারদের উত্তর।


siβLeastsquares

k
Udiag(11,12,...,1k,0,...,0)UTy

এটা সুন্দর.
xxx222

6

পরিসংখ্যানগত শিক্ষার উপাদানগুলির এই সংযোগটিতে দুর্দান্ত আলোচনা হয়েছে।

আমি এই সংযোগ এবং যুক্তিটি যেভাবে ব্যাখ্যা করেছি তা নিম্নরূপ:

  • পিসিএ ফিচার ভেরিয়েবলগুলির একটি লিনিয়ার সংমিশ্রণ, নতুন স্থান দ্বারা ব্যাখ্যা করা তথ্যের বৈচিত্রটি সর্বাধিক করার চেষ্টা করে ize
  • মাল্টিকলাইনারিটিতে আক্রান্ত এমন ডেটা (বা ডাটাগুলির সারিগুলির চেয়ে আরও বেশি ভবিষ্যদ্বাণীকারী) একটি কোভারিয়েন্স ম্যাট্রিক্সের দিকে পরিচালিত করে যার পুরো র‌্যাঙ্ক নেই।
  • এই কোভারিয়েন্স ম্যাট্রিক্সের সাহায্যে আমরা ন্যূনতম স্কোয়ার সমাধান নির্ধারণ করতে উল্টাতে পারি না; এর ফলে ন্যূনতম স্কোয়ার্স সহগের সংখ্যাগুলির সংখ্যায়ন প্রায় অসীমের দিকে উড়ে যায়।
  • রিজ রিগ্রেশন ম্যাট্রিক্স বিপরীতকরণ এবং এলএস কোফিসিয়েন্টের রূপান্তরকরণের অনুমতি দেওয়ার জন্য কোভরিয়েন্স ম্যাট্রিক্সের উপর পেনাল্টি লাম্বদা প্রবর্তন করে।

পিসিএ সংযোগটি হ'ল রিজ রিগ্রেশন বৈশিষ্ট্যগুলির লিনিয়ার সংমিশ্রণগুলি গণনা করছে যেখানে মাল্টিকোলাইনারিটি ঘটছে তা নির্ধারণ করতে। ক্ষুদ্রতম বৈকল্পিকের সাথে বৈশিষ্ট্যগুলির লিনিয়ার সংমিশ্রণগুলি (প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস) (এবং এর ফলে ছোট একক মান এবং পিসিএতে ছোট ইগেনভ্যালুগুলি) সবচেয়ে কঠিন দণ্ডিত।

এই ভাবে চিন্তা করুন; ক্ষুদ্রতম বৈকল্পিকের সাথে বৈশিষ্ট্যগুলির লিনিয়ার সংমিশ্রণের জন্য, আমরা বৈশিষ্ট্যগুলি সর্বাধিক একরকম খুঁজে পেয়েছি যার ফলে বহুবিধ লাইন তৈরি হয়। যেহেতু রিজ বৈশিষ্ট্য সেটটিকে হ্রাস করে না, এই লিনিয়ার সংমিশ্রণটি যেদিকেই বর্ণনা করছে, সেই দিকের সাথে সম্পর্কিত মূল বৈশিষ্ট্যটি সর্বাধিক দণ্ডিত হয়েছে।


2

লিনিয়ার সমীকরণ বিবেচনা করুন

এক্সβ=Y,
এবং এর এসভিডি এক্স,
এক্স=ইউএসভীটি,
কোথায় এস=diag এর(গুলিআমি) একক মানগুলির তির্যক ম্যাট্রিক্স।

সাধারণ সর্বনিম্ন স্কোয়ারগুলি প্যারামিটার ভেক্টর নির্ধারণ করে β যেমন

βহেএলএস=ভীএস-1ইউটি
যাইহোক, এই পদ্ধতির ব্যর্থতার সাথে সাথে একটি একক মান রয়েছে যা শূন্য (ততক্ষণ বিপরীতটি বিদ্যমান নেই)। তাছাড়া, না থাকলেও noগুলিআমি বাহ্যভাবে শূন্য, সংখ্যাগতভাবে ছোট একক মানগুলি ম্যাট্রিক্সকে অসুস্থ-শর্তযুক্ত করতে পারে এবং এমন একটি সমাধানের দিকে নিয়ে যায় যা ত্রুটিগুলির পক্ষে অত্যন্ত সংবেদনশীল।

এই সমস্যাগুলি এড়াতে রিজ রিগ্রেশন এবং পিসিএ দুটি পদ্ধতি উপস্থাপন করে। রিজ রিগ্রেশন প্রতিস্থাপন করেএস-1 উপরের সমীকরণের জন্য β দ্বারা

এসশৈলশিরা-1=diag এর(গুলিআমিগুলিআমি2+ +α),βশৈলশিরা= ভীএসশৈলশিরা-1ইউটি

পিসিএ প্রতিস্থাপন এস-1 দ্বারা

এসপিসিএ-1=diag এর(1গুলিআমিθ(গুলিআমি-γ)),βপিসিএ= ভীএসপিসিএ-1ইউটি
wehre θ পদক্ষেপ ফাংশন, এবং γ থ্রেশোল্ড প্যারামিটার।

উভয় পদ্ধতিই ছোট মানগুলির সাথে সম্পর্কিত উপ-স্থানগুলির প্রভাবকে দুর্বল করে। পিসিএ কঠোর উপায়ে এটি করে, যখন রিজটি একটি মসৃণ পদ্ধতির।

আরও বিমূর্তভাবে, আপনার নিজের নিয়মিতকরণ প্রকল্পটি নির্দ্বিধায় আসে

এসmyReg-1=diag এর(আর(গুলিআমি)),
কোথায় আর(এক্স) এটি এমন একটি ফাংশন যা এর জন্য শূন্যের কাছে যেতে হবে এক্স0 এবং আর(এক্স)এক্স-1 জন্য এক্সবড়। তবে মনে রাখবেন, নিখরচায় দুপুরের খাবার নেই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.