পিসিএ কি বহুবিধ লাইনের অধীনে অস্থির?


25

আমি জানি যে একটি রিগ্রেশন পরিস্থিতিতে, যদি আপনার অত্যন্ত সংযোগযুক্ত ভেরিয়েবলগুলির একটি সেট থাকে তবে এটি সাধারণত "খারাপ" কারণ অনুমান সহগের অস্থিরতার কারণে (নির্ধারক শূন্যের দিকে চলে যাওয়ার কারণে বৈকল্পিকতা অনন্তের দিকে যায়)।

আমার প্রশ্ন হ'ল এই "খারাপ" পিসিএ পরিস্থিতিতে স্থায়ী কিনা। কোভারিয়েন্স ম্যাট্রিক্স একক হয়ে যাওয়ার সাথে সাথে কোনও নির্দিষ্ট পিসির জন্য সহগ / লোডিং / ওজন / আইজেনভেেক্টরগুলি কি অস্থির / স্বেচ্ছাসেবক / অ-অনন্য হয়ে ওঠে? আমি সেই ক্ষেত্রে বিশেষভাবে আগ্রহী যেখানে কেবলমাত্র প্রথম প্রধান উপাদানটি ধরে রাখা হয় এবং অন্য সকলকে "শব্দ" বা "অন্য কিছু" বা "গুরুত্বহীন" হিসাবে বরখাস্ত করা হয়।

আমি মনে করি না এটি এটি করে, কারণ আপনাকে কেবল কয়েকটি মূল উপাদান যা শূন্য, বা শূন্য প্রকরণের কাছাকাছি রেখে যাবে।

এটি দেখতে সহজ 2 ভেরিয়েবলগুলির সাথে সহজ চরম ক্ষেত্রে এটি নয় - মনে করুন তারা নিখুঁতভাবে সম্পর্কযুক্ত। তারপরে প্রথম পিসিটি হুবহু রৈখিক সম্পর্ক হবে এবং দ্বিতীয় পিসিটি প্রথম পিসির জন্য লম্ব হবে, সমস্ত পর্যবেক্ষণের জন্য শূন্যের সমান সমস্ত পিসি মান (অর্থাত শূন্য প্রকরণ)। ভাবছি যদি এটি আরও সাধারণ হয়।


8
আপনার যুক্তি ভাল। প্রকৃতপক্ষে, কেউ যখন আশা করতে পারে যে দু'একটি বেশি ইগন্যাল্যুয়ুগুলি প্রায় কাকতালীয় তখন অস্থিরতা ঘটবে, কারণ এরপরে যদিও এগেনভ্যালুগুলি নির্ধারিত হয়, ইগেনভেেক্টরগুলি হয় না এবং তাই লোডগুলিও হয় না। সংখ্যাগত কারণে, ইগেনভ্যালুতে (এবং ইগেনভেেক্টর) অস্থিরতাও রয়েছে যা সর্বাধিক ইগন্যালুয়ের তুলনায় আকারে খুব ছোট।
whuber

@ শুভ মন্তব্য আপনার প্রশ্নের উত্তর দেয়, তবে আমি লক্ষ করতে চাই যে 2 টি সম্পূর্ণরূপে সম্পর্কযুক্ত ভেরিয়েবলের ক্ষেত্রে, পিসিএর কোনও সমস্যা হওয়া উচিত নয়। কোভরিয়েন্স ম্যাট্রিক্স 1 ম র‌্যাঙ্কের হবে, সুতরাং সেখানে কেবল 1 অ-শূন্য ইগ্যালভ্যালু থাকবে, সুতরাং কেবল 1 পিসি। আসল ভেরিয়েবলগুলি এই পিসির গুণক হবে। একমাত্র ইস্যুটি সংখ্যাগত স্থায়িত্ব হতে পারে।
এমপিটকাস

প্রকৃতপক্ষে, আমি মনে করি আপনি যদি খুব উচ্চতর সহকর্মী ভেরিয়েবলগুলি পেয়েছিলেন তার চেয়ে আপনার যদি পরিমিতরূপে পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবল থাকে তবে আপনি আরও খারাপ হয়ে যাবেন। সংখ্যা অনুসারেও, যদি আপনি নিপালসের মতো একটি অ্যালগোরিদম ব্যবহার করেন যা পিসির ক্রম সরিয়ে দেয়
জেএমএস

একটি জিনিস - "অত্যন্ত সংযুক্ত" এবং "কোলাইনার" এক নয়। যদি 2 টিরও বেশি ভেরিয়েবল জড়িত থাকে তবে কোলিনারিটি পারস্পরিক সম্পর্ক বোঝায় না।
পিটার ফ্লুম - মনিকা পুনরায়

উত্তর:


11

উত্তরটি আরও সহজ শর্তে দেওয়া যেতে পারে: লিনিয়ার বীজগণিতের ক্ষেত্রে দেখা গেলে পিসিএর তুলনায় একাধিক রিগ্রেশনটির একধাপ বেশি রয়েছে এবং দ্বিতীয় ধাপ থেকে অস্থিতিশীলতা অস্তিত্বের মধ্যে আসে:

RLLt

L
L


এটি আমি যা খুঁজছিলাম মোটামুটি। প্রকৃতপক্ষে, আপনার উত্তরটি পড়ে আমাকে আরও একটি ব্যাখ্যা সম্পর্কে ভাবতে বাধ্য করে: আবর্তনগুলি সংখ্যায়িকভাবে স্থিতিশীল হয়, নির্বিশেষে কোভারিয়েন্স / পারস্পরিক সম্পর্ক মেট্রিক্স নির্বিশেষে। এবং যেহেতু পিসিএ সমন্বিত অক্ষের সেরা ঘূর্ণন সন্ধান হিসাবে ফ্রেম করা যেতে পারে, এটি সংখ্যাগতভাবে স্থিতিশীলও হবে।
সম্ভাব্যতাবিরোধী

হ্যাঁ, উদাহরণস্বরূপ স্টান মুলাইকের "ফ্যাক্টরানালাইসিসের ভিত্তি" -এর মধ্যে পিসি-রোটেশন (জ্যাকোবি-পদ্ধতি) এর স্থায়িত্বের স্পষ্টভাবে উল্লেখ করা হয়েছিল, যদি আমি উত্সটি সঠিকভাবে স্মরণ করি। আমার নিজের ফ্যাক্টর বিশ্লেষণের বাস্তবায়নে আমি কোলেস্কির পরে আবর্তনগুলি দিয়ে সবকিছু করি: পিসিএ, ভারিম্যাক্স, এমনকি "প্রধান অক্ষ ফ্যাক্টরিং" (এসপিএসে পিএএফ) আবর্তনের ভিত্তিতে পুনর্নির্মাণ করা যেতে পারে ild যদি মাল্ট রিগ্রেশনটি কোলেস্কি ফ্যাক্টর এল এর উপর ভিত্তি করে থাকে এবং এল এর যে অংশে স্বতন্ত্র ভেরিয়েবল থাকে এটি পিসি-পজিশনে থাকে, তবে মাল্টিকোলাইনারিটি আরও ভালভাবে নিয়ন্ত্রণ করা যায়।
গটফ্রিড হেলমস

3

পিসিএ প্রায়শই শেষের উপায়; হয় একাধিক রিগ্রেশন বা ক্লাস্টার বিশ্লেষণে ব্যবহারের জন্য ইনপুটগুলিতে নেতৃত্ব দেয়। আমি মনে করি আপনার ক্ষেত্রে, আপনি পিসিএর ফলাফলগুলি রিগ্রেশন করার জন্য ব্যবহার করার কথা বলছেন।

সেক্ষেত্রে, আপনার পিসিএ করার উদ্দেশ্য হ'ল মাল্টিকোল্লাইনারিটি থেকে মুক্তি পাওয়া এবং একাধিক রিগ্রেশনগুলিতে অরথোগোনাল ইনপুটগুলি পাওয়া, অবাক হওয়ার মতো বিষয় নয় যে এটিকে প্রিন্সিপাল কম্পোনেন্টস রিগ্রেশন বলা হয়। এখানে, যদি আপনার সমস্ত আসল ইনপুটগুলি অর্থ্থোনাল হয় তবে পিসিএ করা আপনাকে অর্থোথোনাল ইনপুটগুলির একটি সেট দেয়। অতএব; আপনি যদি পিসিএ করছেন, তবে কেউ ধারণা করবে যে আপনার ইনপুটগুলির বহুবিধ লাইন রয়েছে।

λi^ithλi^p

তথ্যসূত্র

জনসন এবং উইচারন (2001)। ফলিত মাল্টিভারিয়েট পরিসংখ্যান বিশ্লেষণ (6th ষ্ঠ সংস্করণ)। প্রেন্টিস হল.


6
আমি নিশ্চিত না যে ওপি পিসিআরের পরে আছে। মাল্টিভিয়ারেট ডেটাসেটের সংক্ষিপ্তকরণের জন্য পিসিএও একটি ভাল উপায় (কোনও মডেলিং কাঠামোয় পরবর্তী ব্যবহারের জন্য ডেটা হ্রাস সম্পাদন করার প্রয়োজনে নয়), বেশিরভাগ তথ্য ধরে রাখার সময় ভিসি ম্যাট্রিক্সটি নিম্ন-অর্ডারের সাথে আনুমানিক। প্রশ্নটি মনে হচ্ছে: কিছু সংখ্যালঘু প্রভাব থাকলেও আমি কি প্রথম কয়েকটি ইগেন্যুয়ালিউস এবং পিসি (মূল ভেরিয়েবলের লিনিয়ার সংমিশ্রণ হিসাবে) ব্যাখ্যা করার সময় ঠিক আছি? আপনার প্রতিক্রিয়াটি সরাসরি ওপি'র প্রশ্নের সমাধান করে বলে মনে হচ্ছে না।
chl

2
সাধারণভাবে পিসিএ সম্পর্কে ভাল উত্তর, তবে পিসিএ যখন চূড়ান্ত পণ্য হয় তখন কী হবে? যে, লক্ষ্য একক পিসি আউটপুট করা হয়। @ সিএইচএল তার প্রশ্নের অর্থের অর্থের সাথে ঠিকই আছেন
সম্ভাব্যতা ব্লগ

@ সিএইচএল এই প্রশ্নের আপনার প্রতিক্রিয়া কী: "প্রথম কয়েকটি ইগেন্যুয়ালিউস এবং পিসি ব্যাখ্যা করার পরেও কি আমি ঠিক আছি? সেখানে কিছু ধারাবাহিক প্রভাব থাকলেও?" আমি জিজ্ঞাসা করি কারণ আমি যখন ডাইমেনিটিয়ালিটি হ্রাস সম্পাদন করছি তখন অত্যন্ত সংযুক্তিযুক্ত ভেরিয়েবলগুলি রাখা কখনই ভাল ধারণা হওয়ার চেষ্টা করছি। কখনও কখনও যখন আমরা তত্ত্ব থেকে জানি যে দুটি ভেরিয়েবল একই সুপ্ত ভেরিয়েবল দ্বারা চালিত হয়, তখন আপনাকে সুপ্ত ভেরিয়েবলের প্রভাব দুটিবার গণনা না করার জন্য আপনার একটি ভেরিয়েবল অপসারণ করা উচিত। আমি ঠিক করার চেষ্টা করছি যখন এটির সাথে সম্পর্কযুক্ত ভেরিয়েবলগুলি রাখা যায়।
অমাত্য
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.