ফ্যাক্টর বিশ্লেষণ থেকে প্রথম উপাদানগুলি কী সর্বাধিক করে?


12

প্রধান উপাদানগুলির বিশ্লেষণে, প্রথম প্রধান উপাদানগুলি হ'ল সর্বাধিক বৈকল্পিক সহ অরথোগোনাল দিক। অন্য কথায়, প্রথম প্রধান উপাদানটি সর্বাধিক বৈকল্পিকের দিকনির্দেশনা হিসাবে বেছে নেওয়া হয়, দ্বিতীয় প্রধান উপাদানটিকে সর্বোচ্চ বৈকল্পিকের সাথে প্রথম দিকের অর্থেগোনাল হিসাবে বেছে নেওয়া হয় এবং এই জাতীয়ভাবে।কেkk

ফ্যাক্টর বিশ্লেষণের জন্য কি একই রকম ব্যাখ্যা রয়েছে? উদাহরণস্বরূপ, আমি ভাবছি যে প্রথম ফ্যাক্টরগুলি সেই উপাদানগুলি যা মূল পারস্পরিক সম্পর্ক ম্যাট্রিক্সের অফ-ডায়াগোনাল উপাদানগুলিকে সর্বোত্তমভাবে ব্যাখ্যা করে (অর্থে, বলতে গেলে, মূল পারস্পরিক সম্পর্ক ম্যাট্রিক্স এবং সংযুক্তি ম্যাট্রিক্সের মধ্যে সংজ্ঞাযুক্ত ম্যাট্রিক্সের মধ্যে স্কোয়ার ত্রুটি কারণের)। এটি কি সত্য (বা আমরা কি বলতে পারি তেমন কিছু আছে)?k


আমি যখন এনআরএইচ তাদের উত্তরে (+1) লিখেছি প্রায় সবকিছুর সাথে একমত, আপনার শেষ প্রশ্নের সংক্ষিপ্ত উত্তর হ্যাঁ, এটি ঠিক সত্য । নোট করুন যে এফএ ফ্যাক্টরগুলিতেও পিসিএর মতো অर्थোগোনাল হতে বেছে নেওয়া যেতে পারে। পার্থক্যটি কেবলমাত্র তার অফ-ডায়াগোনাল অংশ (এফএ) এর পুনরুত্পাদন সম্পূর্ণ পারস্পরিক সম্পর্ক মেট্রিক্স (পিসিএ) পুনরুত্পাদন করার ক্ষেত্রে। আর আলোচনার জন্য আমার উত্তরগুলি দেখতে পিসিএ এবং ফ্যাক্টর অ্যানালিসিস আদল জন্য শর্তাবলী এবং সেখানে পিসিএ পরিবর্তে ইএফএ ব্যবহার করতে কোন ভাল কারণ আছে?
অ্যামিবা বলেছেন মনিকা

আমি নিশ্চিত নই যে সত্যই এফএ "স্কোয়ারড আংশিক কোভেরিয়েন্সগুলি কমিয়ে দেয়" কিনা, কারণ "মিনরাস" নামে একটি আবর্তন / নিষ্কাশন-মাপদণ্ড রয়েছে যার যুক্তিটি হুবহু এটি। তাহলে কেন এটি একটি স্বতন্ত্র নাম দিন? সম্ভবত এফএ-সমাধানের সন্ধানের জন্য স্ট্যান্ডার্ড-রুটিনগুলি গাণিতিকভাবে অভিন্ন ফলাফল পেতে পারে যদি কে উপাদানগুলির সংখ্যার সাথে পুরোপুরিভাবে সমাহারগুলি পুনরুত্পাদন করা হয় - তবে যেহেতু কে অনুমান হয়, তবে এটি এমন হতে পারে যে অপূর্ণতা / অবমূল্যায়নের ক্ষেত্রে এফএ-সমাধানটি না হয় MinRes- সমাধানের অনুরূপ। ঠিক আছে, আমি বলছি: হতে পারে - আমি একটি বিস্মৃত বিবৃতি দেখতে চাই।
গটফ্রাইড হেলস্

উত্তর:


7

পিসিএ মূলত একটি ডাটা হ্রাস কৌশল যেখানে উদ্দেশ্যটি হ'ল নিম্ন মাত্রিক স্থানে ডেটা প্রজেকশন অর্জন করা। দুটি সমতুল্য উদ্দেশ্য হ'ল হয় পুনরাবৃত্তভাবে বৈচিত্র্যকে সর্বাধিক করা বা পুনর্গঠন ত্রুটি হ্রাস করা। এটি পূর্ববর্তী প্রশ্নের উত্তরের কিছু বিবরণে আসলে কাজ করা হয় ।

এর বিপরীতে, ফ্যাক্টর বিশ্লেষণ প্রাথমিকভাবে একটি সৃজক মডেল -dimensional তথ্য ভেক্টর বলে যে যেখানে হয় সুপ্ত কারণের মাত্রিক ভেক্টর, হল সঙ্গে এবং অসামঞ্জস্যিত ত্রুটির একটি ভেক্টর। ম্যাট্রিক্স ম্যাট্রিক্স হয় ফ্যাক্টর loadings । এটি ov হিসাবে কোভারিয়েন্স ম্যাট্রিক্সের একটি বিশেষ প্যারামিট্রাইজেশন দেয় this যদি দ্বারা প্রতিস্থাপন করা হয় তবে একই মডেলটি পাওয়া যায়এক্স এক্স = একটি এস + + ε এস কুই একটি পি × < পি ε একটি Σ = একটি একটি টি + + ডি একজন একজন আর × আর একটা ΣpX

X=AS+ϵ
SqAp×kk<pϵA
Σ=AAT+D
AAR কোনও অরথোগোনাল ম্যাট্রিক্স জন্য , যার অর্থ হল যে কারণগুলি নিজেরাই অনন্য নয়। বিভিন্ন পরামর্শ এই সমস্যা সমাধানের জন্য বিদ্যমান, কিন্তু আছে না একটি একক সমাধান যে আপনার ব্যাখ্যার ধরনের আপনি জন্য অনুরোধ সঙ্গে প্রভাব ফেলে দেয়। একটি জনপ্রিয় পছন্দ ভেরিম্যাক্স ঘূর্ণন। তবে ব্যবহৃত মানদণ্ডটি কেবল আবর্তন নির্ধারণ করে। কলাম স্থান দ্বারা দৃশ্যও পরিবর্তন হবে না এবং যেহেতু এই parametrization অংশ, এটা যাই হোক না কেন পদ্ধতি অনুমান করার জন্য ব্যবহার করা হয় দ্বারা নির্ধারিত হয় - একটি গসিয়ান মডেল সর্বোচ্চ সম্ভাবনা দ্বারা, বলে।k×kRAΣ

সুতরাং, প্রশ্নের উত্তর দেওয়ার জন্য, নির্বাচিত কারণগুলি একটি ফ্যাক্টর বিশ্লেষণ মডেল ব্যবহার থেকে স্বয়ংক্রিয়ভাবে দেওয়া হয় না, সুতরাং প্রথম কারণগুলির কোনও একক ব্যাখ্যা নেই । আপনি অনুমান করতে ব্যবহৃত পদ্ধতিটি (কলামের স্থানের ) এবং ঘূর্ণনটি বেছে নিতে ব্যবহৃত পদ্ধতি নির্দিষ্ট করতে হবে। যদি (সমস্ত ত্রুটির একই বৈকল্পিকতা থাকে) তবে এর কলাম স্পেসের এমএলই দ্রবণটি শীর্ষস্থানীয় অধ্যক্ষ উপাদান ভেক্টর দ্বারা বিস্তৃত স্থান , যা একক মান পচন দ্বারা পাওয়া যেতে পারে। অবশ্যই এই প্রধান উপাদান ভেক্টরকে কারণ হিসাবে ঘোরানো এবং প্রতিবেদন না করা বেছে নেওয়া সম্ভব choose A D = σ 2 I A qkAD=σ2IAq

সম্পাদনা: করতে জোর দেওয়া কিভাবে আমি এটা দেখতে, ফ্যাক্টর বিশ্লেষণ মডেল একটি র্যাঙ্ক যেমন সহভেদাংক ম্যাট্রিক্স একটি মডেল ম্যাট্রিক্স প্লাস একটি তির্যক ম্যাট্রিক্স। সুতরাং মডেলটির সাথে উদ্দেশ্যটি হল কোভেরিয়েন্স ম্যাট্রিক্সের সাথে এই জাতীয় কাঠামোর সাথে কোভেরিয়েন্সকে সর্বোত্তমভাবে ব্যাখ্যা করা । ব্যাখ্যাটি হ'ল কোভারিয়েন্স ম্যাট্রিক্সের উপর এই জাতীয় কাঠামো কোনও অনাবৃত ডাইমেনশনাল ফ্যাক্টরের সাথে সামঞ্জস্যপূর্ণ । দুর্ভাগ্যক্রমে, উপাদানগুলি স্বতন্ত্রভাবে পুনরুদ্ধার করা যায় না এবং সম্ভাব্য কারণগুলির সেটগুলির মধ্যে সেগুলি কীভাবে বেছে নেওয়া যেতে পারে তা কোনওভাবেই ডেটার ব্যাখ্যার সাথে সম্পর্কিত নয়। যেমনটি পিসিএর ক্ষেত্রে, কেউ তথ্য উপাত্তকে মানক করতে পারে এবং এমন একটি মডেল ফিট করতে পারে যা পারস্পরিক সম্পর্ক ম্যাট্রিক্সকে র‌্যাঙ্ক প্লাস একটি তির্যক ম্যাট্রিক্স হিসাবে ব্যাখ্যা করার চেষ্টা করে । kkk


1
হ্যাঁ, আমি বুঝতে পারি যে কে ফ্যাক্টরের একটি অনন্য পছন্দ নেই (যেহেতু আমরা সেগুলি ঘোরানো এবং একই মডেলটি পেতে পারি)। কিন্তু ফ্যাক্টর বিশ্লেষণ দ্বারা নির্বাচিত কে উপাদানগুলির কোনও পছন্দ কি কোনও ধরণের "সম্পর্কের সর্বোচ্চ ব্যাখ্যা" করে?
রেগটিন

1
@ ইর্যাগটিন, আমি আমার দৃষ্টিভঙ্গি ব্যাখ্যা করার জন্য উত্তরটি সম্পাদনা করেছি, এটি কোভারিয়েন্স ম্যাট্রিক্সের একটি মডেল। ঘূর্ণন দ্বারা প্রাপ্ত উপাদানগুলির যে কোনও পছন্দ হ'ল, আমি এটি দেখতে পাচ্ছি, তথ্যের সমবায়কে ব্যাখ্যা করার ক্ষেত্রে সমানভাবে ভাল বা খারাপ কারণ তারা একই সমবায় ম্যাট্রিক্স উত্পাদন করে।
এনআরএইচ

1
আপডেটের জন্য ধন্যবাদ, এটি এফএ এর দুর্দান্ত ব্যাখ্যা! সুতরাং যখন আপনি বলেন "মডেলের সাথে উদ্দেশ্যটি হল সর্বগ্রহীতার ব্যাখ্যা করা", আপনি কি বোঝাতে চেয়েছেন যে সত্যিকারের ব্যাখ্যা করা covariance এর পরিমাণকে কে কারণগুলি সত্যই বাড়িয়ে তোলে?
রেগটিন

1
@ আরেগটিন, হ্যাঁ, আমি মডেলটিকে কোভারিয়েন্স ম্যাট্রিক্সের একটি মডেল হিসাবে দেখি এবং আপনি যখন মডেলটি অনুমান করেন, তখন আপনি এটা বোঝাবেন যে আপনি বোঝানো কোভেরিয়েন্সের পরিমাণ সর্বাধিকতর করছেন।
এনআরএইচ

@ ইর্যাগটিন এবং এনআরএইচ (+1 বিটিডাব্লু): কেবল স্পষ্ট করার জন্য। উপরোক্ত দুটি মন্তব্য সঠিক হয় যদি "কোভারিয়েন্স" দ্বারা আমরা "কোভারিয়েন্স ম্যাট্রিক্সের অফ-ডায়াগোনাল অংশ" বুঝতে পারি।
অ্যামিবা বলেছেন মনিকা

3

@ গ্রেগটিন, আমি বিশ্বাস করি যে আপনি সঠিক বলে মনে করেন। নিষ্কাশন এবং পূর্বে ঘোরার পরে, প্রতিটি ধারাবাহিক উপাদান কম-বেশি সমান্তরালকরণ / পারস্পরিক সম্পর্কের জন্য অ্যাকাউন্ট করে, ঠিক তেমনি প্রতিটি ধারাবাহিক উপাদান কম-বেশি তারতম্যের জন্য অ্যাকাউন্ট করে: উভয় ক্ষেত্রেই, একটি লোডিং ম্যাট্রিক্স ক এর কলামগুলি পতনের ক্রম হিসাবে চলেছে তাদের মধ্যে স্কোয়ার উপাদান (লোডিং) এর যোগফল। লোড হচ্ছে পারস্পরিক সম্পর্ক বিডব্লিউ ফ্যাক্টর এবং পরিবর্তনশীল; সুতরাং যে কেউ বলতে পারেন যে 1 ম ফ্যাক্টর আর ম্যাট্রিক্সের "সামগ্রিক" স্কোয়ার আর এর সর্বাধিক অংশটি ব্যাখ্যা করে , ২ য় ফ্যাক্টর এখানে দ্বিতীয়, ইত্যাদি। এফএ এবং পিসিএ মধ্যে পার্থক্য, যদিও, লোডিং দ্বারা সম্পর্কের পূর্বাভাস দেওয়ার ক্ষেত্রে: এফএ আর কে পুনরুদ্ধার করতে "ক্যালিব্রেটেড" হয়পুরোপুরি এম মিট্র্যাক্ট ফ্যাক্টর (এম ফ্যাক্টর <পি ভেরিয়েবলস) দিয়ে বেশ সূক্ষ্মভাবে, যখন পিসিএ এটি এম উপাদান দ্বারা পুনরুদ্ধারে অভদ্র, - এটি ত্রুটি ছাড়াই আর পুনরুদ্ধার করতে সমস্ত পি উপাদানগুলির প্রয়োজন ।

পিএস যোগ করতে। এফএ-তে, লোডিং মানটি পরিষ্কার সাম্প্রদায়িকতার "সমন্বিত" (পারস্পরিক সম্পর্ক স্থাপনের জন্য দায়ী বৈচিত্রের একটি অংশ) থাকে যখন পিসিএতে একটি লোডিংটি ভেরিয়েবলের সাম্প্রদায়িকতা এবং অদ্বিতীয়তার মিশ্রণ এবং তাই পরিবর্তনশীলতা গ্রহন করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.