এই উত্তরের কৃতিত্ব @ttnphns এর কাছে যায় যারা উপরের মন্তব্যে সমস্ত কিছু ব্যাখ্যা করেছেন। তবুও, আমি একটি বর্ধিত উত্তর দিতে চাই।
আপনার প্রশ্নের কাছে: মানক এবং অ-মানক বৈশিষ্ট্যগুলিতে এলডিএ ফলাফলগুলি কি ঠিক একই রকম হতে চলেছে? --- উত্তর হ্যাঁ । আমি প্রথমে একটি অনানুষ্ঠানিক যুক্তি দেব এবং তারপরে কিছু গণিত নিয়ে এগিয়ে যাব।
একটি বেলুনের একপাশে স্ক্র্যাটার প্লট হিসাবে দেখানো একটি 2 ডি ডেটাसेट কল্পনা করুন ( এখান থেকে তোলা আসল বেলুনের চিত্র ):
এখানে লাল বিন্দুগুলি একটি শ্রেণি, সবুজ বিন্দু অন্য শ্রেণি, এবং কালো রেখাটি এলডিএ শ্রেণির সীমানা। এখন বা অক্ষের উদ্ধার আনুভূমিক বা উল্লম্বভাবে বেলুনটিকে প্রসারিত করার সাথে মিলে যায়। এটি স্বজ্ঞাতভাবে পরিষ্কার যে যদিও কালো প্রান্তের slালু এ জাতীয় প্রসারিত হওয়ার পরে পরিবর্তিত হবে, ক্লাসগুলি আগের মতো ঠিক পৃথক হবে, এবং কালো রেখার আপেক্ষিক অবস্থান পরিবর্তন হবে না। প্রতিটি পরীক্ষার পর্যবেক্ষণ স্ট্রেচিংয়ের আগে একই ক্লাসে বরাদ্দ করা হবে। সুতরাং যে কেউ বলতে পারেন যে প্রসারিত করা এলডিএর ফলাফলগুলিকে প্রভাবিত করে না।xy
এখন, গাণিতিকভাবে, এলডিএ th of , যেখানে এবং এর মধ্যে-এবং শ্রেণির মধ্যে রয়েছে তার গণনা করে বৈষম্যমূলক অক্ষের একটি সেট খুঁজে পেয়েছে স্ক্যাটার ম্যাট্রিক্স। সমতুল্যভাবে, এই সাধারণ eigenvalue সমস্যার eigenvectors সাধারণ করছে ।W−1BWBBv=λWv
একটি কেন্দ্রিক তথ্য ম্যাট্রিক্স বিবেচনা করুন কলাম এবং সারি ডাটা পয়েন্ট ভেরিয়েবল সঙ্গে, যাতে মোট ছিটান ম্যাট্রিক্স দেওয়া হয় । Standard of এর প্রতিটি কলামকে একটি নির্দিষ্ট সংখ্যার মাধ্যমে স্কেল করার সমান ডেটা অর্থ, it যেখানে স্কেলিং সহগের (প্রতিটি কলামের স্ট্যান্ডার্ড বিচ্যুতিগুলির বিপরীতমুখী) সহ তির্যক ম্যাট্রিক্স। এই জাতীয় পুনরুদ্ধারের পরে স্ক্যাটার ম্যাট্রিক্স নীচে পরিবর্তিত হবে: এবং একই রূপান্তর ঘটবেXT=X⊤XXXnew=XΛΛTnew=ΛTΛWnew এবং ।Bnew
আসুন problem the আসল সমস্যার আইজেনভেেক্টর হয়ে যাক ,যদি আমরা এই সমীকরণটি বাম দিকে দিয়ে গুন করি এবং before এর আগে উভয় পক্ষের সন্নিবেশ করি, আমরা ie যার অর্থv
Bv=λWv.
ΛΛΛ−1vΛBΛΛ−1v=λΛWΛΛ−1v,
BnewΛ−1v=λWnewΛ−1v,
Λ−1vআগের মতো ঠিক একই ইগন্যালভ ল্যাম্বদা দিয়ে উদ্ধার করার পরে একটি আইজেনভেেক্টর ।
λ
সুতরাং বৈষম্যমূলক অক্ষগুলি (আইজেনভেেক্টর দ্বারা প্রদত্ত) পরিবর্তিত হবে, তবে এর ইগেনুয়ালুও, এটি দেখায় যে ক্লাসগুলি কতটা পৃথক করা হয়েছে, ঠিক একই থাকবে। তদুপরি, এই অক্ষটি সম্পর্কে প্রক্ষেপণ, যা মূলত by দিয়েছিল, এখন given দ্বারা দেওয়া হবে) , ঠিক একই থাকবে (সম্ভবত কোনও স্কেলিং ফ্যাক্টর পর্যন্ত)।XvXΛ(Λ−1v)=Xv
in general a "Z-score normalization" (or standardization) of features won't be necessary, even if they are measured on completely different scales
না, এই বিবৃতিটি ভুল। এলডিএর সাথে মানককরণের বিষয়টি যে কোনও মাল্টিভারিয়েট পদ্ধতিতে একই। উদাহরণস্বরূপ, পিসিএ। সেই বিষয়টির সাথে মহালানোবিসের দূরত্বের কোনও যোগসূত্র নেই।