প্রধান উপাদান উপাদান বিশ্লেষণ (পিসিএ) সাবজেক্ট (দ্বৈত) স্পেসে কীভাবে কাজ করে সে সম্পর্কে আমি একটি স্বজ্ঞাত বোঝার চেষ্টা করছি ।
দুটি ভেরিয়েবল সঙ্গে 2D ডেটা সেটটি বিবেচনা করুন, এবং , এবং ডাটা পয়েন্টের (ডাটা ম্যাট্রিক্স হয় এবং কেন্দ্রিক অবস্থায় গণ্য করা হয়)। পিসিএর সাধারণ উপস্থাপনাটি হ'ল আমরা আর 2 তে পয়েন্টগুলি বিবেচনা করি , 2 × 2 কোভেরিয়েন্স ম্যাট্রিক্সটি লিখি এবং এর আইজেনভেেক্টরগুলি & এগেনভ্যালুগুলি পাই; প্রথম পিসি সর্বাধিক বৈকল্পিকের দিকের সাথে সম্পর্কিত, ইত্যাদি এখানে কোভারিয়েন্স ম্যাট্রিক্স সি = ( 4 2 2 2 ) সহ একটি উদাহরণ রয়েছে। লাল রেখাগুলি সংশ্লিষ্ট ইগনালভ্যালুগুলির বর্গাকার শিকড় দ্বারা স্কেল করা আইজেনভেেক্টরগুলি দেখায়।
এখন সাবজেক্ট স্পেসে কী ঘটে যায় তা বিবেচনা করুন (আমি এই শব্দটি @ttnphns থেকে শিখেছি), দ্বৈত স্থান (যান্ত্রিক শিক্ষায় ব্যবহৃত শব্দটি ) নামেও পরিচিত । এটি একটি মাত্রিক স্থান যেখানে আমাদের দুটি ভেরিয়েবলের নমুনা ( এক্স এর দুটি কলাম ) দুটি ভেক্টর x 1 এবং x 2 গঠন করে । প্রতিটি ভেরিয়েবল ভেক্টরের বর্গক্ষেত্র দৈর্ঘ্য তারতম্যের সমান, দুটি ভেক্টরের মধ্যবর্তী কোণটির কোসাইন তাদের মধ্যকার পারস্পরিক সম্পর্কের সমান। এই উপস্থাপনা, যাইহোক, একাধিক রিগ্রেশন চিকিত্সার ক্ষেত্রে খুব স্ট্যান্ডার্ড। আমার উদাহরণে বিষয়বস্তুর স্থানটি দেখতে দেখতে (আমি কেবল দুটি ভেরিয়েবল ভেক্টর দ্বারা বিভক্ত 2 ডি প্লেনটি দেখাই):
মূল উপাদানগুলি, দুটি ভেরিয়েবলের লিনিয়ার সংমিশ্রণ হওয়ায় একই সমতলে দুটি ভেক্টর এবং পি 2 গঠন করবে । আমার প্রশ্ন হ'ল: এই জাতীয় একটি প্লটের মূল ভেরিয়েবল ভেক্টর ব্যবহার করে মূল উপাদান ভেরিয়েবল ভেক্টরগুলি কীভাবে গঠন করা যায় তার জ্যামিতিক বোঝার / অন্তর্দৃষ্টি কী? প্রদত্ত এক্স 1 এবং এক্স 2 , কি জ্যামিতিক পদ্ধতি উত্পাদ হবে পি 1 ?
নীচে এটি সম্পর্কে আমার বর্তমান আংশিক বোঝার রয়েছে।
প্রথমত, আমি আদর্শ পদ্ধতির মাধ্যমে প্রধান উপাদান / অক্ষগুলি গণনা করতে এবং একই চিত্রটিতে প্লট করতে পারি:
তদুপরি, আমরা লক্ষ করতে পারি যে এমনভাবে বেছে নেওয়া হয়েছে যে এক্স আই (নীল ভেক্টর) এবং p 1 তে তাদের অনুমানগুলির মধ্যে স্কোয়ারড দূরত্বের যোগফল কম হয়; এই দূরত্বগুলি পুনর্নির্মাণের ত্রুটি এবং সেগুলি কালো ড্যাশযুক্ত লাইনে দেখানো হয়েছে। সমানভাবে, পি 1 উভয় অনুমানের স্কোয়ার দৈর্ঘ্যের যোগফলকে সর্বাধিক করে তোলে। এটি পি 1 সম্পূর্ণরূপে নির্দিষ্ট করে এবং অবশ্যই প্রাথমিক স্থানের অনুরূপ বর্ণনার সাথে সম্পূর্ণভাবে সাদৃশ্যপূর্ণ ( মূল উপাদানগুলির বিশ্লেষণ, ইগেনভেেক্টর এবং ইগেনালয়েজগুলি বোঝার জন্য আমার উত্তরটিতে অ্যানিমেশনটি দেখুন )। @ Ttnphns'es উত্তরের প্রথম অংশটিও এখানে দেখুন ।
তবে এটি যথেষ্ট জ্যামিতিক নয়! এটি আমাকে এই জাতীয় কীভাবে সন্ধান করতে হবে তা বলে না এবং এর দৈর্ঘ্য নির্দিষ্ট করে না।
আমার অনুমান যে , x এর 2 , পি 1 এবং পি 2 এক উপবৃত্তাকার সব মিথ্যা কেন্দ্রীভূত 0 সঙ্গে পি 1 এবং পি 2 হচ্ছে তার প্রধান অক্ষ। এটি আমার উদাহরণে দেখতে কেমন দেখাচ্ছে:
প্রশ্ন 1: কীভাবে প্রমাণ করবেন? প্রত্যক্ষ বীজগণিত প্রদর্শন খুব ক্লান্তিকর বলে মনে হচ্ছে; কিভাবে এটি দেখতে হবে যে এই ক্ষেত্রে হতে হবে?
তবে কেন্দ্র করে এবং x 1 এবং x 2 দিয়ে যাচ্ছেন এমন অনেকগুলি উপবৃত্ত রয়েছে :
প্রশ্ন 2: "সঠিক" উপবৃত্তটি কী নির্দিষ্ট করে? আমার প্রথম অনুমান যে এটি দীর্ঘতম সম্ভব মূল অক্ষ সহকারে উপবৃত্ত; তবে এটি ভুল বলে মনে হচ্ছে (কোনও দৈর্ঘ্যের মূল অক্ষ সহ উপবৃত্ত রয়েছে)।
যদি Q1 এবং Q2 এর উত্তর থাকে তবে আমি আরও জানতে চাই যে তারা দুটির বেশি ভেরিয়েবলের ক্ষেত্রে জেনারেলাইজ করে কিনা।
variable space (I borrowed this term from ttnphns)
- @ অ্যামিবা, আপনার অবশ্যই ভুল হতে হবে। (মূলত) এন-ডাইমেনশনাল স্পেসে ভেক্টর হিসাবে ভেরিয়েবলগুলি সাবজেক্ট স্পেস বলে (এন সাবজেক্ট হিসাবে অক্ষ হিসাবে "স্পেস হিসাবে" পি স্পেস "স্প্যান" বলে)। পরিবর্তিত স্থানটি বিপরীতে, বিপরীত - অর্থাৎ স্বাভাবিক স্ক্রেটারপ্লট। এইভাবে বহুবিধ পরিসংখ্যানগুলিতে পরিভাষাটি প্রতিষ্ঠিত হয়। (যদি মেশিন লার্নিংয়ে এটি আলাদা হয় - আমি এটি জানি না - তবে এটি
My guess is that x1, x2, p1, p2 all lie on one ellipse
এখানে উপবৃত্ত থেকে হিউরিস্টিক সহায়তা কী হতে পারে? আমি এটাকে সন্দেহ করি.