1. হ্রাস-র্যাঙ্কের রিগ্রেশন (আরআরআর) কী?
মাল্টিভারিয়েট একাধিক লিনিয়ার রিগ্রেশন বিবেচনা করুন, অর্থাত্ স্বতন্ত্র ভেরিয়েবল এবং কিউ নির্ভরশীল ভেরিয়েবলগুলির সাথে রিগ্রেশন । যাক এক্স এবং ওয়াই (predictor কেন্দ্রীভূত করা এন × পি ) এবং প্রতিক্রিয়া ( এন × কুই ) ডেটাসেট। তারপরে নিম্নোক্ত ব্যয়টির কার্যকারিতা হ্রাস করার জন্য সাধারণ সাধারণ সর্বনিম্ন স্কোয়ারগুলি (ওএলএস) তৈরি করা যেতে পারে:pqXYn×pn×q
L=∥Y−XB∥2,
যেখানে হল রিগ্রেশন ওজনের একটি পি × কিউ ম্যাট্রিক্স। তার সমাধান দেওয়া হয় বি হে এল এস = ( এক্স ⊤ এক্স ) - 1 এক্স ⊤ ওয়াই , এবং এটি দেখতে এরকম সমতূল্য সহজ কুই পৃথক OLS ঔজ্জ্বল্যের প্রেক্ষাপটে রিগ্রেশন, প্রতিটি নির্ভরশীল পরিবর্তনশীল জন্য।Bp × q
বি^OLS=(X⊤X)−1X⊤Y,
q
কমিয়ে-সারির রিগ্রেশন প্রবর্তন উপর একটি র্যাঙ্ক বাধ্যতা , যথা এল সঙ্গে কমিয়ে আনা উচিত র্যাঙ্ক ( বি ) ≤ দ , যেখানে R সর্বোচ্চ র্যাঙ্ক দিয়েছো বি ।BLrank(B)≤rrB
2. কীভাবে আরআরআর সলিউশন পাবেন?
দেখা যাচ্ছে যে আরআরআরকে ইগেনভেেক্টর সমস্যা হিসাবে ফেলে দেওয়া যেতে পারে। বস্তুত, এটা সত্য যে OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মূলত কলাম স্থান লম্ব অভিক্ষেপ ব্যবহার , আমরা পুনর্লিখন করতে এল যেমন এল = ‖ ওয়াই - এক্স বি হে এল এস ‖ 2 + + ‖ এক্স বি হে এল এস - এক্স বি ‖ 2 । প্রথম মেয়াদে উপর নির্ভর করে না বি এবং দ্বিতীয় মেয়াদে লাগানো মূল্যবোধের SVD / পিসিএ দ্বারা কমিয়ে আনা যেতে পারে ওয়াই = এক্স বিXL
L=∥Y−XB^OLS∥2+∥XB^OLS−XB∥2.
B ।
Y^=XB^OLS
বিশেষ করে, যদি প্রথম দ প্রধান অক্ষ ওয়াই , তারপর বি আর আর আর = বি হে এল এস ইউ R ইউ ⊤ দ ।UrrY^
B^RRR=B^OLSUrU⊤r.
৩. আরআরআর কিসের জন্য ভাল?
আরআরআর ব্যবহারের দুটি কারণ থাকতে পারে।
প্রথমত, কেউ এটি নিয়মিতকরণের উদ্দেশ্যে ব্যবহার করতে পারেন। একইভাবে রিজ রিগ্রেশন (আরআর), লাসো ইত্যাদিতে, আরআরআর তে কিছু "সঙ্কুচিত" জরিমানা প্রবর্তন করে । সর্বোত্তম র্যাঙ্ক আর ক্রস-বৈধকরণের মাধ্যমে পাওয়া যাবে। আমার অভিজ্ঞতায়, আরআরআর সহজেই ওএলএসকে ছাড়িয়ে যায় তবে আরআর এর কাছে হেরে যায়। তবে, আরআরআর + আরআর একা আরআর থেকে ভাল (সামান্য) পারফর্ম করতে পারে।Br
দ্বিতীয়ত, এটি একটি মাত্রিকতা হ্রাস / ডেটা এক্সপ্লোরেশন পদ্ধতি হিসাবে ব্যবহার করতে পারে। আমাদের কাছে যদি ভবিষ্যদ্বাণী ভেরিয়েবলগুলির একটি গুচ্ছ এবং নির্ভরশীল ভেরিয়েবলগুলির একটি গুচ্ছ থাকে, তবে আরআরআর ভবিষ্যদ্বাণীকারী স্পেসে "সুপ্ত কারণগুলি" তৈরি করবে যা ডিভিএসের বৈকল্পিকতা ব্যাখ্যা করার সেরা কাজ করে do এরপরে কেউ এই সুপ্ত কারণগুলি ব্যাখ্যা করার চেষ্টা করতে পারেন, সেগুলি প্লট করা ইত্যাদি I যতদূর আমি জানি, এটি নিয়মিতভাবে বাস্তুশাস্ত্রে করা হয় যেখানে আরআরআর রিডানডেন্সি বিশ্লেষণ হিসাবে পরিচিত এবং এটি অর্ডিনেশন পদ্ধতিগুলি যা বলে তার একটি উদাহরণ ( এখানে @ গ্যাভিনসিম্পসনের উত্তর দেখুন see )।
৪. অন্যান্য মাত্রা হ্রাস পদ্ধতির সাথে সম্পর্ক
আরআরআর সিসিএ এবং পিএলএসের মতো অন্যান্য মাত্রিক হ্রাস পদ্ধতির সাথে নিবিড়ভাবে সংযুক্ত। আংশিক সর্বনিম্ন বর্গক্ষেত্র, হ্রাস র্যাঙ্ক রিগ্রেশন এবং মূল উপাদানগুলির রিগ্রেশনগুলির মধ্যে কী সংযোগ আছে তার উত্তরে আমি এটিকে কিছুটা coveredেকে দিয়েছি ?
যদি এবং ওয়াই কেন্দ্রিক ভবিষ্যদ্বাণী ( n × p ) এবং প্রতিক্রিয়া ( n × q ) ডেটাসেট হয় এবং আমরা যদি প্রথম জোড় অক্ষের সন্ধান করি, তবে এক্স এর জন্য w ∈ R p এবং y এর জন্য v ∈ R q , তবে এই পদ্ধতিগুলি সর্বাধিক করে তোলে নিম্নলিখিত পরিমাণ:XYn×pn×qw∈RpXv∈RqY
PCA:RRR:PLS:CCA:Var(Xw)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)=Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
আরও কিছু বিশদ জানতে এখানে দেখুন।
টোর, ২০০৯ দেখুন , বেশিরভাগ সাধারণ রৈখিক মাল্টিভারিয়েট পদ্ধতিগুলির (যেমন পিসিএ, সিসিএ, এলডিএ, তবে পিএলএস নয়!) কীভাবে আরআরআর হিসাবে দেখা যায় তার বিশদ চিকিত্সার জন্য কম্পোনেন্ট বিশ্লেষণের জন্য একটি স্বল্প-স্কোয়ার ফ্রেমওয়ার্ক ।
5. কেন এই বিভাগটি হাস্টি এট আল-এ রয়েছে। এত বিভ্রান্তিকর?
L=∥Y−XB∥2,
L = ∥ ( Y - X B ) ( Y )⊤Y )- 1 / 2∥2,
হিসাবে তাদের সূত্র দেখা যাবে 3.68। এটি একটি পরিচয় করিয়ে দেয়
ওয়াইলোকসান ফাংশনটিতে সাদা রঙের ফ্যাক্টর, নির্ভরশীল ভেরিয়েবলগুলি মূলত সাদা করা। আপনি যদি উপরের সিসিএ এবং আরআরআরের মধ্যে তুলনাটি দেখেন তবে আপনি খেয়াল করবেন যে যদি তা হয়
ওয়াইসাদা হয় তবে পার্থক্য অদৃশ্য হয়ে যায়। সুতরাং কি Hastie এট আল। কল আরআরআর আসলে ছদ্মবেশে সিসিএ (এবং প্রকৃতপক্ষে, তাদের 3.69 দেখুন)।
এর কোনটিই এই বিভাগে সঠিকভাবে ব্যাখ্যা করা হয়নি, সুতরাং বিভ্রান্তি।
বন্ধুত্বপূর্ণ টিউটোরিয়ালে আমার উত্তর বা আরও পড়ার জন্য হ্রাস-র্যাঙ্ক রিগ্রেশনটির ভূমিকা দেখুন ।