নিম্নলিখিত ডেটাসেট বিবেচনা করুন:
পিসি 1 অক্ষটি প্রক্ষেপণের বৈচিত্রটি সর্বাধিক করছে। সুতরাং এক্ষেত্রে এটি অবশ্যই নিম্ন-বাম থেকে উপরের-ডান কোণে তির্যকভাবে চলে যাবে:
মূল ডেটাসেটের সবচেয়ে বড় জোড় দূরত্ব এই দুটি বাহ্যিক পয়েন্টের মধ্যে; লক্ষ্য করুন যে এটি প্রায় ঠিক পিসি 1 এ সংরক্ষিত আছে। ক্ষুদ্রতর তবে এখনও যথেষ্ট পরিমাণে দূরত্বে দূরত্বগুলি প্রতিটি বাহ্যিক পয়েন্ট এবং অন্যান্য সমস্ত পয়েন্টের মধ্যে রয়েছে; এগুলি যুক্তিসঙ্গতভাবে খুব ভাল সংরক্ষণ করা হয়। তবে যদি আপনি কেন্দ্রীয় ক্লাস্টারের পয়েন্টগুলির মধ্যে আরও ছোট জোড়ের দূরত্বগুলি দেখেন, তবে আপনি দেখতে পাবেন যে এর কয়েকটি দৃ strongly়ভাবে বিকৃত।
আমি মনে করি এটি সঠিক अंतर्ज्ञान দেয়: পিসিএ সর্বাধিক বৈকল্পিকতার সাথে স্বল্প-মাত্রিক উপ-স্থান খুঁজে পায়। সর্বাধিক বৈচিত্রের অর্থ এই যে উপসর্গটি কেন্দ্র থেকে অনেক দূরে অবস্থিত পয়েন্টগুলির কাছাকাছি যাওয়ার মতো প্রান্তিককরণের প্রবণতা হবে; অতএব বৃহত্তম জোড়ের দিক থেকে দূরত্বগুলি ভালভাবে সংরক্ষণ করা হবে এবং ছোটগুলিও তাই কম থাকবে।
তবে নোট করুন যে এটি একটি আনুষ্ঠানিক যুক্তিতে রূপান্তরিত করা যায় না কারণ বাস্তবে এটি অগত্যা সত্য নয়। আমার উত্তরটি একবার দেখুন, মূল উপাদান বিশ্লেষণ এবং বহুমাত্রিক স্কেলিংয়ের মধ্যে পার্থক্য কী? যদি আপনি উপরের পরিসংখ্যানগুলি থেকে পয়েন্টগুলি গ্রহণ করেন, ম্যাট্রিক্স জোড়াবিশিষ্ট দূরত্বগুলি তৈরি করুন এবং 1D প্রক্ষেপণটি কী যা দূরত্বগুলি যতটা সম্ভব সংরক্ষণ করা যায় তা জিজ্ঞাসা করুন, তবে উত্তরটি এমডিএস সমাধান দ্বারা দেওয়া হয়েছে এবং প্রদত্ত নয় পিসি 1 । যাইহোক, যদি আপনি একটি বিবেচনা pairwise ম্যাট্রিক্স স্কালে পণ্য কেন্দ্রিক, তাহলে এটি হল10 × 10 10 × 101010 × 1010 × 10আসলে পিসি 1 দ্বারা সুনির্দিষ্টভাবে সংরক্ষণ করা হয়েছে (প্রমাণের জন্য আমার উত্তরটি এখানে দেখুন)। এবং যে কেউ যুক্তি দিতে পারে যে বড় জোড়ের দিক থেকে দূরত্বগুলি সাধারণত বড় আকারের স্ক্যালার পণ্যগুলিও বোঝায়; প্রকৃতপক্ষে, একটি এমডিএস অ্যালগরিদম (শাস্ত্রীয় / টোজারসন এমডিএস) স্পষ্টভাবে এই অনুমানটি তৈরি করতে রাজি।
সুতরাং সংক্ষেপে:
- পিসিএ'র লক্ষ্য, জুটিওয়ালা স্কেলার পণ্যগুলির ম্যাট্রিক্স সংরক্ষণ করা, এই অর্থে যে আসল এবং পুনর্গঠিত স্কেলারের পণ্যগুলির মধ্যে স্কোয়ারের পার্থক্যের যোগফলটি ন্যূনতম হওয়া উচিত।
- এর অর্থ হ'ল এটি স্কেলার পণ্যগুলিকে সর্বাধিক পরম মান সহ সংরক্ষণ করবে এবং ছোট পরিপূর্ণ মানযুক্তদের সম্পর্কে কম যত্ন নেবে, কারণ তারা স্কোয়ার ত্রুটির যোগফলের দিকে কম যোগ করবে।
- সুতরাং, পিসিএ আরও বড় আকারের স্কেলারের পণ্যগুলি ছোটগুলির চেয়ে ভাল সংরক্ষণ করে।
- পেয়ারওয়াইস দূরত্বগুলি কেবল স্কেলারের পণ্যগুলির মতোই সংরক্ষণ করা হবে যা প্রায়শই তবে সর্বদা হয় না। যদি এটি হয় তবে বড় জোড়ের দূরত্বগুলিও ছোটগুলির চেয়ে ভাল সংরক্ষণ করা হবে।