উভয় মডেল - অধ্যক্ষ-উপাদান এবং সাধারণ-ফ্যাক্টর - একই রকম সোজাসুজি লিনিয়ার রিগ্রেশনাল মডেলগুলি সুপ্ত ভেরিয়েবল দ্বারা পর্যবেক্ষিত ভেরিয়েবলের পূর্বাভাস দেয়। আসুন আমাদের ভেরিয়েবল ভি 1 ভি 2 ... ভিপি কেন্দ্রিক থাকতে হবে এবং আমরা 2 উপাদান / উপাদানগুলি এফআই এবং এফআইআই বের করতে বেছে নিয়েছি । তারপরে মডেল হ'ল সমীকরণের ব্যবস্থা:
ভী1= ক1 আইএফআমি+ ক1 আইআমিএফআমিআমি+ ই1
ভী2= ক2 আমিএফআমি+ ক2 আমিআমিএফআমিআমি+ +ই2
। । ।
ভীপি= …
যেখানে গুণাগুণটি একটি লোডিং, এফ একটি উপাদান বা উপাদান এবং পরিবর্তনশীল ই হ'ল রিগ্রেশন অবশিষ্টাংশ। এখানে, এফএ মডেলটি পিসিএ মডেলের থেকে একেবারে পৃথক হয়ে যায় যে এফএ প্রয়োজনীয়তা চাপিয়ে দেয়: ভেরিয়েবল E1 E2 ... এপি ( এফ এর সাথে সম্পর্কিত নয় এমন ত্রুটি শর্তাবলী ) অবশ্যই একে অপরের সাথে সম্পর্কিত হতে হবে না ( ছবি দেখুন )। এই ত্রুটি ভেরিয়েবল এফএ "অনন্য কারণ" কল করে; তাদের রূপগুলি জানা যায় ("স্বতন্ত্রতা") তবে তাদের কেসওয়াইজ মানগুলি হয় না। অতএব, ফ্যাক্টর স্কোর এফ শুধুমাত্র তারা সঠিক নয় ভাল অনুমান হিসেবে নির্ণিত হয়।
(একটি এই সাধারণ ফ্যাক্টর বিশ্লেষণ মডেল পাদটীকা বিষয় সম্পর্কেও বীজগণিত উপস্থাপনা ম্যাট্রিক্স 1 ।)1
যেখানে পিসিএ-তে বিভিন্ন ভেরিয়েবলের পূর্বাভাস দেওয়া ত্রুটি ভেরিয়েবলগুলি অবাধে সম্পর্কিত হতে পারে: তাদের উপর কিছুই চাপানো হয়নি। তারা সেই "ড্রস" উপস্থাপন করে যা আমরা বাম-আউট পি -2 মাত্রা নিয়েছি । আমরা E এর মান জানি এবং তাই আমরা উপাদানগুলির স্কোর F এর সঠিক মান হিসাবে গণনা করতে পারি ।
এটি ছিল পিসিএ মডেল এবং এফএ মডেলের মধ্যে পার্থক্য।
এটি উপরের বাহ্যরেখানো পার্থক্যের কারণে, এফএ জোড়াজোড়া সম্পর্কের (সমবায়) ব্যাখ্যা করতে সক্ষম। পিসিএ সাধারণত এটি করতে পারে না (যতক্ষণ না উত্তোলিত উপাদানগুলির সংখ্যা = পি ); এটি কেবল বহুভেদী বৈকল্পিক 2 ব্যাখ্যা করতে পারে । তাই, যতদিন "ফ্যাক্টর বিশ্লেষণ" শব্দটি লক্ষ্য মাধ্যমে সংজ্ঞায়িত করা হয় সম্পর্কযুক্তরূপে ব্যাখ্যা করতে পিসিএ নয় ফ্যাক্টর বিশ্লেষণ। যদি "ফ্যাক্টর বিশ্লেষণ" ব্যাখ্যা করা যায় এমন সুপ্ত "বৈশিষ্ট্যগুলি" সরবরাহ বা প্রস্তাব করার পদ্ধতি হিসাবে আরও বিস্তৃতভাবে সংজ্ঞায়িত করা হয়, তবে পিসিএ দেখা যেতে পারে ফ্যাক্টর বিশ্লেষণের একটি বিশেষ এবং সহজতম রূপ ।2
কখনও কখনও - কিছু শর্তাবলীতে কিছু ডেটাসেটে - পিসিএ E পদগুলি ছেড়ে দেয় যা প্রায় আন্তঃসংশ্লিষ্ট হয় না। তারপরে পিসিএ পারস্পরিক সম্পর্ককে ব্যাখ্যা করতে এবং এফএর মতো হয়ে উঠতে পারে। অনেক ভেরিয়েবল সহ ডেটাসেটগুলি এটি খুব সাধারণ বিষয় নয়। এটি কিছু পর্যবেক্ষককে দাবি করার জন্য তৈরি করেছিল যে ডেটা বাড়ার সাথে সাথে পিসিএ ফলাফল এফএ ফলাফলের নিকটে পরিণত হয়। আমি মনে করি না এটি একটি নিয়ম, তবে প্রবণতা প্রকৃতপক্ষে হতে পারে। যাইহোক, তাদের তাত্ত্বিক পার্থক্য দেওয়া, সচেতনভাবে পদ্ধতি নির্বাচন করা সর্বদা ভাল। আপনি যদি ভেরিয়েবলগুলি ভেরিয়েবলের পিছনে দাঁড়িয়ে প্রকৃত সুপ্ত বৈশিষ্ট্য হিসাবে বিবেচনা করতে এবং সেগুলি সম্পর্কযুক্ত করে তুলতে চান তবে এফএ একটি আরও বাস্তবসম্মত মডেল।
তবে আপনার যদি অন্য লক্ষ্য থাকে - ডেটা মেঘের পয়েন্টগুলির মধ্যে দূরত্ব যতটা সম্ভব রাখা যায় তত মাত্রা হ্রাস করুন - এফএর চেয়ে পিসিএ ভাল। (তবে পুনরাবৃত্ত বহুমাত্রিক স্কেলিং (MDS) পদ্ধতি আরও ভাল তারপর। পিসিএ হতে হবে পরিমাণ noniterative মেট্রিক MDS।) আপনি আরও অনেক দূরত্বের সঙ্গে বিরক্ত না করেন এবং শুধুমাত্র তথ্য সামগ্রিক ভ্যারিয়েন্সের যতটা সংরক্ষণের আগ্রহী যতটা সম্ভব, কয়েকটি মাত্রা অনুসারে - পিসিএ একটি অনুকূল পছন্দ।
ফ্যাক্টর বিশ্লেষণ ডেটা মডেল: ভী = এফ একজন ' + + ই ঘ আমি একটি গ্রাম ( U ) , যেখানে ভী হয়বিশ্লেষণ তথ্য (কলাম কেন্দ্রিক বা মান), এফ হয়সাধারণ ফ্যাক্টর মান (অজানা সত্য বেশী, না ফ্যাক্টর স্কোর) ইউনিট সঙ্গে ভ্যারিয়েন্স, একটি হলসাধারণ ফ্যাক্টর loadings (প্যাটার্ন ম্যাট্রিক্স), ম্যাট্রিক্স ই হয়অনন্য ফ্যাক্টর মান (অজানা), U হয়অনন্য ফ্যাক্টর loadings uniquenesses (এর বর্গ। রুট সমান ভেক্টর তোমার দর্শন লগ করা 2 )। অংশ1ভি = এফ একজন'+ ই ডিআমি একটি জি( ইউ )ভীn cases x p variables
এফn x m
একজনp x m
ইn x p
তোমার দর্শন লগ করাp
তোমার দর্শন লগ করা2 সরলতার জন্যকেবল "E"হিসাবে লেবেল করা যেতে পারে, কারণ এটি উত্তরটি খোলার সূত্রে রয়েছে।E ঘআমি একটি জি( ইউ )
মডেলের মূল অনুমান:
- এবং ই ভেরিয়েবলগুলি (যথাক্রমে সাধারণ এবং অনন্য উপাদান) শূন্যের মাধ্যম এবং ইউনিটের ভেরিয়েন্সগুলি রয়েছে;
ই সাধারণত বহুচলকীয় স্বাভাবিক কিন্তু অধিকৃত হয় এফ সাধারণ ক্ষেত্রে না প্রয়োজন বহুচলকীয় স্বাভাবিক হতে (উভয় বহুচলকীয় স্বাভাবিক তারপর অধিকৃত হয় যদি ভী তাই হয়, খুব);FEEFV
- ভেরিয়েবলগুলি একে অপরের সাথে সম্পর্কযুক্ত নয় এবং এফ ভেরিয়েবলগুলির সাথে সংযুক্ত নয়।EF
2 AA(m)Σ
Σ^=AA′Σ≈Σ^+diag(u2)
Σ^u2≈p(p-1)/2
সাধারণ কারণগুলির সাথে সম্পর্কিত নয় এমন উপাদানগুলি) উচ্চারণ করা হয়; (৩) সাম্প্রদায়িকতা ভালভাবে একত্রিত হয়নি, তাদের প্রাথমিক মূল্যবোধগুলি ছিল দুর্বল; (4) সম্পর্ক লিনিয়ার নয়, লিনিয়ার মডেল ব্যবহার করা প্রশ্নবিদ্ধ; (5) নিষ্কাশন পদ্ধতি দ্বারা উত্পাদিত মডেল "সাব টাইপ" ডেটার জন্য অনুকূল নয় (বিভিন্ন নিষ্কাশন পদ্ধতি সম্পর্কে দেখুন )। অন্য কথায়, কিছু এফএ ডেটা অনুমান সম্পূর্ণরূপে পূরণ হয় না।
সাধারণ পিসিএ হিসাবে , এটি লোডিংয়ের মাধ্যমে সমবায়িকাগুলি পুনরুত্পাদন করে ঠিক যখন এম = পি (সমস্ত উপাদান ব্যবহৃত হয়) এবং এটি সাধারণত এম ব্যর্থ হয় যদি এম < পি (কেবলমাত্র প্রথম কয়েকটি উপাদান ধরে রাখা হয়)। পিসিএর জন্য ফ্যাক্টর উপপাদ্যটি হ'ল:
Σ=AA′(p)=AA′(m)+AA′(p−m)
A(m)A(p−m)AA′(p−m)A(m)
A(m)
trace(A′A(m))
ΣAA′trace(AA′)trace(A′A)A′A
ট্রেস সর্বাধিকীকরণের জন্য ধন্যবাদ - মি উপাদানগুলির দ্বারা ব্যাখ্যা করা বৈকল্পিক - পিসিএ সমবায়িকদের জন্য অ্যাকাউন্টিং করছে, যেহেতু কোভারিয়েন্স ভাগ করে নেওয়া বৈকল্পিক। এই অর্থে পিসিএ হ'ল ভেরিয়েবলের পুরো কোভারিয়েন্স ম্যাট্রিক্সের "নিম্ন-স্তরের আনুমানিকতা" । এবং পর্যবেক্ষণের দৃষ্টিকোণ থেকে যখন দেখা যায় এই সমাপ্তি হ'ল পর্যবেক্ষণগুলির ইউক্লিডিয়ান-দূরত্বের ম্যাট্রিক্সের সমীকরণ (যার কারণেই পিসিএকে "অধ্যক্ষ সমন্বয় বিশ্লেষণ" বলে মেট্রিক এমডিএস বলা হয় This এই সত্যটি আমাদের সেই বাস্তবতা থেকে পর্দা করা উচিত নয় যে পিসিএ মডেল নয় does কোভরিয়েন্স ম্যাট্রিক্স (প্রতিটি সমবায়) আমাদের কিছু পরিবর্তনশীল সুপ্ত বৈশিষ্ট্য দ্বারা উত্পাদিত যা আমাদের ভেরিয়েবলগুলির প্রতি অবিস্মরণীয় হিসাবে কল্পনাযোগ্য; পিসিএ সান্নিধ্য অদৃশ্য থাকে, যদিও এটি ভাল হয়: এটি ডেটা সরলকরণ।
আপনি যদি পিসিএ এবং এফএ-তে ধাপে ধাপে গণনা দেখতে চান, মন্তব্য করেছেন এবং তুলনা করেছেন, দয়া করে এখানে দেখুন ।