ইএফএ এর পরিবর্তে পিসিএ ব্যবহার করার কোনও ভাল কারণ আছে কি? এছাড়াও, পিসিএ কি ফ্যাক্টর বিশ্লেষণের বিকল্প হতে পারে?


73

কিছু শাখায়, পিসিএ (মূল উপাদান বিশ্লেষণ) বিন্যাস ছাড়াই পদ্ধতিগতভাবে ব্যবহৃত হয়, এবং পিসিএ এবং ইএফএ (অনুসন্ধানী ফ্যাক্টর বিশ্লেষণ) প্রতিশব্দ হিসাবে বিবেচিত হয়।

অতএব আমি সম্প্রতি স্কেল বৈধকরণ অধ্যয়নের ফলাফল বিশ্লেষণ করতে পিসিএ ব্যবহার করেছি (7-পয়েন্টের লিকার্ট স্কেলে ২১ টি আইটেম, প্রতিটি items টি আইটেমের 3 টি উপাদান রচনা করে ধরে নেওয়া হয়েছে) এবং একজন পর্যালোচক আমাকে জিজ্ঞাসা করলেন কেন আমি ইএফএর পরিবর্তে পিসিএ বেছে নিই। আমি উভয় কৌশলগুলির মধ্যে পার্থক্য সম্পর্কে পড়েছি এবং মনে হয় যে এখানে আপনার উত্তরগুলির বেশিরভাগ অংশে পিসিএর বিপরীতে ইফা পছন্দসই হয়েছে।

পিসিএ কেন একটি ভাল পছন্দ হবে তার জন্য আপনার কোনও ভাল কারণ আছে? এটি কী উপকার সরবরাহ করতে পারে এবং কেন এটি আমার ক্ষেত্রে বুদ্ধিমান পছন্দ হতে পারে?


1
দুর্দান্ত প্রশ্ন। আমি ttnphns এর উত্তরের সাথে একমত নই, এবং আজকের পরে একটি বিকল্প দৃষ্টিভঙ্গি দেওয়ার চেষ্টা করব।
অ্যামিবা

5
@ আমেবা আমি আপনাকে আগে থেকেই শিকড় দিচ্ছি। পিসিএ হ'ল একটি রূপান্তর কৌশল যা (কখনও কখনও, খুব) সহায়ক হতে পারে। এটিকে অসুর বা অনর্থক অভিপ্রায় যুক্ত করার দরকার নেই। আপনি পাশাপাশি লগারিদমকে ছাড়তে পারেন।
নিক কক্স

4
এটি মনে হয় না যে ttnphns এর উত্তর পিসিএটিকে অসুর করে দিয়েছে। আমার কাছে তিনি কেবল পিসিএকে তর্ক করছেন বলে মনে হচ্ছে আপনার ডেটা উৎপন্ন সুপ্ত পরিবর্তনশীলগুলির অনুমানের ভিত্তিতে নয়, তাই যদি আপনি যা করার চেষ্টা করছেন তবে এফএ আরও ভাল পছন্দ choice
গাং

1
এফডব্লিউআইডাব্লু, আমি টিটিফএনএসের জবাব নিয়ে বিশেষভাবে মন্তব্য করছিলাম না, তবে মন্তব্য এবং সমালোচনা নিয়ে আমি প্রায়শই মুখোমুখি হই যে পিসিএ এমন কিছু করেনি যার জন্য এটি কখনই উদ্দেশ্যযুক্ত ছিল না বা উপযুক্ত নয়।
নিক কক্স

3
@NeilG: পিসিএ হয় না এমন একটি [সম্ভাব্য] সৃজক মডেল, কারণ এটি একটি শব্দ শব্দ অন্তর্ভুক্ত নয় এবং তাই সেখানে এর সাথে জড়িত কোন সম্ভাবনা নেই। যদিও (পিপিসিএ) একটি সম্ভাব্য সাধারণীকরণ রয়েছে, এবং এটি পিসিএর সাথে খুব ঘনিষ্ঠভাবে সম্পর্কিত, আমার উত্তরটি এখানে দেখুন।
অ্যামিবা

উত্তর:


95

দাবি অস্বীকার: @ পিটিএ এবং এফএ উভয় সম্পর্কেই এনটিএনফএনস খুব জ্ঞানবান এবং আমি তার মতামতকে শ্রদ্ধা করি এবং বিষয়টিতে তার অনেক দুর্দান্ত উত্তরের কাছ থেকে অনেক কিছু শিখেছি। তবে আমি এখানে তার জবাবের সাথে একমত নই, পাশাপাশি সিভিতে এই বিষয়ে অন্যান্য (অসংখ্য) পোস্টের সাথে, কেবল তারই নয়; বা বরং, আমি মনে করি তাদের সীমিত প্রয়োগযোগ্যতা রয়েছে।


আমি মনে করি যে পিসিএ এবং এফএ এর মধ্যে পার্থক্য ওভাররেটেড হয়েছে।

এটি এর মতো দেখুন: উভয় পদ্ধতিই একটি প্রদত্ত কোভেরিয়েন্স (বা পারস্পরিক সম্পর্ক) ম্যাট্রিক্সের নিম্ন-স্তরের আনুমানিক সরবরাহ করার চেষ্টা করে। "নিম্ন-র‌্যাঙ্ক" এর অর্থ হ'ল কেবলমাত্র সীমিত (নিম্ন) সংখ্যক সুপ্ত উপাদান বা প্রধান উপাদান ব্যবহৃত হয়। যদি ডেটির কোভেরিয়েন্স ম্যাট্রিক্সটি , তবে মডেলগুলি হ'ল :n×nC

PCA:CWWPPCA:CWW+σ2IFA:CWW+Ψ

এখানে কলামগুলির সাথে একটি ম্যাট্রিক্স (যেখানে সাধারণত একটি ছোট সংখ্যা হিসাবে বেছে নেওয়া হয়, ), মূল উপাদান বা কারণগুলি উপস্থাপন করে, একটি পরিচয় ম্যাট্রিক্স এবং একটি তির্যক ম্যাট্রিক্স। প্রতিটি পদ্ধতি finding (এবং বাকি) বাম-হাত এবং ডান হাতের পার্থক্যের মধ্যে পার্থক্যকে [আদর্শের আদর্শ] কমানোর জন্য তৈরি করা যেতে পারে । কে কে কে < এন কে আই Ψ ডাব্লুWkkk<nkIΨW

পিপিসিএ হ'ল প্রোব্যাবিলিস্টিক পিসিএ , এবং আপনি যদি তা জানেন না তবে এটি এখনকার পক্ষে এতটা গুরুত্বপূর্ণ নয়। আমি এটি উল্লেখ করতে চেয়েছিলাম, কারণ এটি মধ্যবর্তী মডেলের জটিলতায় পিসিএ এবং এফএর মধ্যে খুব সুন্দরভাবে ফিট করে। এটি পিসিএ এবং এফএর মধ্যে কথিত বৃহত্তর পার্থক্যটিকে দৃষ্টিভঙ্গিতে ফেলেছে: যদিও এটি একটি সম্ভাব্য মডেল (ঠিক এফএর মতো), এটি আসলে পিসিএর প্রায় সমতুল্য হিসাবে প্রমাণিত হয় ( একই উপস্থানে বিস্তৃত)।W

সর্বাধিক গুরুত্বপূর্ণ, নোট করুন যে মডেলগুলি কেবল কীভাবে এর তির্যকটি আচরণ করে তার মধ্যে পৃথক । মাত্রা বাড়ার সাথে সাথে তির্যকটি একরকমভাবে কম এবং গুরুত্বপূর্ণ হয়ে ওঠে (কারণ এখানে ত্রিভুজটিতে কেবল উপাদান রয়েছে এবং ত্রিভুজ থেকে বের হওয়া উপাদান)। ফলস্বরূপ, বৃহত্তর জন্য সাধারণত পিসিএ এবং এফএ-এর মধ্যে কোনও পার্থক্য থাকে না, এমন একটি পর্যবেক্ষণ যা খুব কমই প্রশংসা করা হয়। ছোট তারা সত্যিই অনেক পার্থক্য করতে পারে। এন এন এন ( এন - 1 ) / 2 = ( এন 2 ) এন এনCnnn(n1)/2=O(n2)nn

এখন আপনার মূল প্রশ্নের উত্তর দেওয়ার জন্য কেন কিছু শাখার লোকেরা পিসিএ পছন্দ করে বলে মনে হয়। আমি অনুমান করি যে এটি এফএর চেয়ে গাণিতিকভাবে অনেক সহজ (এটি উপরের সূত্রগুলি থেকে স্পষ্ট নয়), তবে আপনাকে এখানে বিশ্বাস করতেই হবে:

  1. পিসিএ - পাশাপাশি পিপিসিএ, যা কিছুটা আলাদা, - এর একটি বিশ্লেষণাত্মক সমাধান রয়েছে, যেখানে এফএ নেই। সুতরাং এফএর সংখ্যাগতভাবে ফিট হওয়া দরকার, এটি করার বিভিন্ন অ্যালগরিদম রয়েছে, সম্ভবত বিভিন্ন উত্তর দেওয়া এবং বিভিন্ন অনুমানের অধীনে পরিচালনা করা ইত্যাদি। কিছু ক্ষেত্রে কিছু অ্যালগরিদম আটকে যেতে পারে (উদাহরণস্বরূপ "হেভিউড কেসগুলি")। পিসিএর জন্য আপনি একটি ইগেন-পচা সঞ্চালন করেন এবং আপনার কাজ শেষ হয়; এফএ অনেক বেশি অগোছালো।

    প্রযুক্তিগতভাবে, পিসিএ কেবল ভেরিয়েবলগুলি ঘুরিয়ে দেয় এবং সে কারণেই কেউ এটিকে নিছক রূপান্তর হিসাবে উল্লেখ করতে পারেন, যেমন @ নিককক্স তার উপরের মন্তব্যে করেছিলেন।

  2. পিসিএ দ্রষ্টব্য উপর নির্ভর করে না : আপনি প্রথম তিনটি পিসি ( ) খুঁজে পেতে পারেন এবং এর মধ্যে প্রথম দুটি আপনি প্রাথমিকভাবে সেট করলে আপনি দেখতে পাবেন এমনগুলির সাথে অভিন্ন হতে চলেছে । এটি এফএর ক্ষেত্রে সত্য নয়: জন্য সমাধানটি এর সমাধানের মধ্যে অগত্যা অন্তর্ভুক্ত নয় । এটি পাল্টা স্বজ্ঞাত এবং বিভ্রান্তিকর।কে = 3 কে = 2 কে = 2 কে = 3kk=3k=2k=2k=3

অবশ্যই এফএ পিসিএর তুলনায় আরও নমনীয় মডেল (সর্বোপরি, এটির আরও বেশি পরামিতি রয়েছে) এবং প্রায়শই এটি আরও কার্যকর হতে পারে। আমি এর বিরুদ্ধে তর্ক করছি না। আমি কি করছি বিরুদ্ধে তর্ক দাবী করেছে যে তারা ধারণার দিক থেকে পিসিএ সম্পর্কে "তথ্য বর্ণনা" এবং এফএ "সুপ্ত ভেরিয়েবল খোঁজার" সম্পর্কে হচ্ছে হচ্ছে ভিন্ন হয়। আমি দেখতে পাচ্ছি না যে এটি মোটেও সত্য (প্রায়] সত্য।

উপরে উল্লিখিত কিছু নির্দিষ্ট পয়েন্ট এবং লিঙ্কিত উত্তরে মন্তব্য করতে:

  • "পিসিএতে নিষ্কাশন / ধরে রাখার মাত্রাগুলির সংখ্যাটি মূলত বিষয়গত, যখন ইএফএ-তে সংখ্যাটি নির্দিষ্ট করা থাকে, এবং আপনাকে সাধারণত বেশ কয়েকটি সমাধান পরীক্ষা করে দেখতে হয়" - ভাল, সমাধানের পছন্দটি এখনও বিষয়ভিত্তিক, তাই আমি করি না এখানে কোন ধারণাগত পার্থক্য দেখুন। উভয় ক্ষেত্রে, মডেল ফিট এবং মডেল জটিলতার মধ্যে বাণিজ্য-বন্ধকে অনুকূল করতে বেছে নেওয়া হয়েছে (বিষয়গতভাবে বা উদ্দেশ্যমূলকভাবে)।k

  • "এফএ এ দুটি যুগের পারস্পরিক সম্পর্ক (কোভেরিয়েনেসিস) ব্যাখ্যা করতে সক্ষম হয়। পিসিএ সাধারণত এটি করতে পারে না" - সত্যই নয়, দু'জনই পারস্পরিক সম্পর্ককে আরও ভাল এবং আরও ভালভাবে ব্যাখ্যা করেন যে বাড়ছে।k

  • কখনও কখনও পিসিএ এবং এফএ ব্যবহার করে বিভিন্ন শাখায় বিভিন্ন অনুশীলনের কারণে অতিরিক্ত বিভ্রান্তি দেখা দেয় (তবে @ টিটিএনফোনের উত্তরগুলিতে নয়!) উদাহরণস্বরূপ, ব্যাখ্যাযোগ্যতার উন্নতি করতে এফএতে উপাদানগুলি ঘোরানো একটি সাধারণ অনুশীলন। এটি পিসিএর পরে খুব কমই করা হয়, তবে নীতিগতভাবে কিছুই এটি প্রতিরোধ করছে না। সুতরাং লোকেরা প্রায়শই ভাবতে থাকে যে এফএ আপনাকে কিছু "ব্যাখ্যাযোগ্য" দেয় এবং পিসিএ দেয় না, তবে এটি প্রায়শই একটি বিভ্রম।

অবশেষে, আমাকে আবার জোর যে জন্য খুব ছোট দিন পিসিএ এফএ মধ্যে পার্থক্য প্রকৃতপক্ষে বড় হতে পারে, এবং হয়ত এফএ পক্ষে দাবির কিছু ছোট শেষ হয়ে গেলে মনে। চরম উদাহরণ হিসাবে, একটি একক ফ্যাক্টর সর্বদা পারস্পরিক সম্পর্ককে পুরোপুরি ব্যাখ্যা করতে পারে তবে একটি পিসি এটি বেশ খারাপভাবে করতে ব্যর্থ হতে পারে।n n = 2nnn=2


আপডেট 1: ডেটা জেনারেটরি মডেল

আমি যে মন্তব্য করছি তা বিতর্কিত হওয়ার জন্য নেওয়া হয়েছে এমন মন্তব্যের সংখ্যা থেকে আপনি দেখতে পাবেন। মন্তব্য বিভাগকে আরও বন্যার ঝুঁকিতে, এখানে "মডেল" সম্পর্কিত কিছু মন্তব্য রয়েছে (@ টিএনএফএনএস এবং @ গুং-এর মন্তব্য দেখুন)। @ttnphns পছন্দ করে না যে আমি উপরের অনুমানগুলি বোঝাতে "মডেল" শব্দটি [covariance ম্যাট্রিক্সের] ব্যবহার করেছি; এটি পরিভাষার একটি বিষয়, তবে তিনি যাকে "মডেল" বলেছেন সেটি হ'ল ডেটাগুলির সম্ভাব্য / জেনারেটাল মডেল :

PPCA:x=Wz+μ+ϵ,ϵN(0,σ2I)FA:x=Wz+μ+ϵ,ϵN(0,Ψ)

দ্রষ্টব্য যে পিসিএ কোনও সম্ভাব্য মডেল নয় এবং এটি এইভাবে তৈরি করা যায় না।

পিপিসিএ এবং এফএর মধ্যে পার্থক্যটি শব্দ শব্দটির মধ্যে রয়েছে: পিপিসিএ প্রতিটি ভেরিয়েবলের জন্য একই শব্দের ভিন্নতা ass ধরে থাকে, যেখানে এফএ বিভিন্ন ধরণের ধারণ করে ("স্বতন্ত্রতা")। এই সামান্য পার্থক্যের গুরুত্বপূর্ণ পরিণতি রয়েছে। উভয় মডেলই একটি সাধারণ প্রত্যাশা-সর্বাধিককরণ অ্যালগরিদমের সাথে মানানসই হতে পারে। এফএর জন্য কোনও বিশ্লেষণাত্মক সমাধান জানা যায় না, তবে পিপিসিএর জন্য ইমাম যে সমাধানটি ইএম রূপান্তর করতে পারবেন তা বিশ্লেষণাত্মকভাবে অর্জন করতে পারে (উভয় এবং th ম্যাথবিএফ )। দেখা যাচ্ছে, একই কলামে রয়েছে তবে মানক PCA লোডিংয়ের চেয়ে ছোট দৈর্ঘ্যের সাথে (আমি সঠিক সূত্রগুলি বাদ দিই)। যে কারণে আমি পিপিসিএকে "প্রায়" পিসিএ হিসাবে মনে করি:Ψ আমি আমি σ 2 ওয়াট ডব্লিউ পি পি সি একটি ওয়াট পি সি একটি ওয়াটσ2Ψiiσ2WWPPCAWPCAWboth উভয় ক্ষেত্রেই একই "অধ্যক্ষ সাবস্পেস" স্প্যান করে।

প্রমাণ ( টিপিং এবং বিশপ 1999 ) কিছুটা প্রযুক্তিগত; কেন সজাতি গোলমাল ভ্যারিয়েন্স অনেক সহজ কোনো সলিউশন খোঁজেন বাড়ে জন্য স্বজ্ঞাত কারণ হলো হিসাবে একই eigenvectors হয়েছে কোন মানের জন্য , কিন্তু এই জন্য সত্য নয় ।C σ 2 C - ΨCσ2ICσ2CΨ

সুতরাং হ্যাঁ, @ গং এবং @ টিএনএফএনএস ঠিক আছে যে এফএ একটি জেনারেটরি মডেলের উপর ভিত্তি করে এবং পিসিএ নয়, তবে আমি মনে করি এটি যুক্ত করা জরুরী যে পিপিসিএ একটি জেনারেটাল মডেলের উপরও ভিত্তি করে, তবে এটি পিসিএর সাথে "প্রায়" সমতুল্য । তারপরে এটি এমন গুরুত্বপূর্ণ পার্থক্য মনে হয় না।


আপডেট 2: পিসিএ কীভাবে কোভারিয়েন্স ম্যাট্রিক্সের সর্বোত্তম সান্নিধ্য সরবরাহ করে, যখন এটি সর্বাধিক বৈকল্পিকের সন্ধানের জন্য সুপরিচিত?

পিসিএর দুটি সমতুল্য ফর্মুলেশন রয়েছে: যেমন প্রথম পিসি হ'ল (ক) প্রক্ষেপণের বৈচিত্রকে সর্বাধিক করে তোলা এবং (খ) ন্যূনতম পুনর্গঠনের ত্রুটি সরবরাহকারী providing আরও বিমূর্তভাবে, একার্ট-ইয়ং উপপাদ্যটি ব্যবহার করে বৈচিত্রকে সর্বাধিকীকরণ এবং পুনর্গঠন ত্রুটি হ্রাস করার মধ্যে সমতা দেখা যায় ।

যদি হ'ল ডেটা ম্যাট্রিক্স (সারি হিসাবে পর্যবেক্ষণ সহ, কলাম হিসাবে পরিবর্তনশীল এবং কলামগুলি কেন্দ্রিক বলে ধরে নেওয়া হয়) এবং এর এসভিডি পচন osition , তবে এটি সুপরিচিত যে এর কলামগুলি স্ক্যাটার ম্যাট্রিক্সের (বা কোভারিয়েন্স ম্যাট্রিক্স, পর্যবেক্ষণের সংখ্যায় বিভাজিত হলে) এবং তাই এগুলি বৈচিত্রটি (যেমন মূল অক্ষগুলি) সর্বাধিকীকরণ করা অক্ষ are কিন্তু Eckart-ইয়াং উপপাদ্য দ্বারা, প্রথম পিসিতে সেরা rank- প্রদান পড়তা করতে :এক্স = ইউ এস ভিভি সি = এক্সএক্স = ভি এস 2 ভি কে কে এক্স এক্স কে = ইউ কে এস কে ভি কে কে এক্স - এক্স কে 2XX=USVVC=XX=VS2VkkXXk=UkSkVk(এই স্বরলিপি শুধুমাত্র গ্রহণ মানে বৃহত্তম একবচন মান / ভেক্টর) ছোট ।kXXk2

প্রথম পিসিতে না শুধুমাত্র শ্রেষ্ঠ rank- প্রদান পড়তা করতে , কিন্তু সহভেদাংক ম্যাট্রিক্স থেকে । প্রকৃতপক্ষে, , এবং শেষ সমীকরণটি এর SVD পচন সরবরাহ করে (কারণ orthogonal) এবং টি তির্যক)। সুতরাং একার্ট-ইয়াং উপপাদ্য আমাদের বলে যে শ্রেষ্ঠ rank- করার পড়তা দেওয়া হয় । এটি লক্ষ্য করে এটি রূপান্তরিত হতে পারেকে এক্স সি সি = এক্সএক্স = ভি এস 2 ভিসি ভি এস 2 কে সি সি কে = ভি কে এস 2 কে ভি কে ডাব্লু = ভি এস সি কে = ভি কে এস 2 কে ভি কে = ( এস ) কে ( ভি এস ) কে = ডাব্লুkkXCC=XX=VS2VCVS2kCCk=VkSk2VkW=VS PCA লোডিং, এবং তাই

Ck=VkSk2Vk=(VS)k(VS)k=WkWk.

নীচের লাইনটি হ'ল যেমনটি শুরুতে বলা হয়েছিল।

minimizing{CWW2CWWσ2I2CWWΨ2}leadsto{PCAPPCAFA}loadings,

আপডেট 3: সংখ্যাসূচক দেখায় যে পিসিএ এফএ যখনএন n

আমাকে @ttnphns দ্বারা আমার দাবির সংখ্যাসূচক বিক্ষোভ সরবরাহ করার জন্য উত্সাহিত করা হয়েছিল যে মাত্রা বাড়ানোর সাথে সাথে পিসিএ সমাধান এফএ সমাধানে পৌঁছায়। এখানে এটা যায়.

আমি কিছু শক্তিশালী অফ-ডায়াগোনাল পারস্পরিক সম্পর্ক সহ এলোমেলো সংযোগ ম্যাট্রিক্স তৈরি করেছি । আমি তখন মাত্রিকতার প্রভাব তদন্ত করতে ভেরিয়েবল সহ এই ম্যাট্রিক্সের উপরের বামে বর্গাকার ব্লক নিয়েছি । প্রতিটি , আমি পিসিএ এবং এফএ সম্পাদনা করেছি সংখ্যার উপাদান / উপাদানগুলির সংখ্যা , এবং প্রতিটি আমি অফ-তির্যক পুনর্গঠন ত্রুটিটি গণনা করেছি (নোট যে তির্যক উপর এফএ reconstructs , পুরোপুরি কারণেn × n সি এন = 25 , 50 , 200 এন কে = 1 5 কে আই [ সি - ডাব্লু ডাব্লু] 2 আই জে সি Ψ n কে 1200×200 n×nCn=25,50,200nk=15k

ij[CWW]ij2
CΨমেয়াদ, যেখানে পিসিএ হয় না; তবে তির্যকটি এখানে উপেক্ষা করা হবে)। তারপরে প্রতিটি এবং , আমি পিসিএ অফ-ডায়াগোনাল ত্রুটির এফএ অফ-ডায়াগোনাল ত্রুটির সাথে অনুপাতটি গণনা করেছি। এই অনুপাতটি উপরে হতে হবে , কারণ এফএ সর্বোত্তম সম্ভাব্য পুনর্গঠন সরবরাহ করে।nk1

পিসিএ বনাম এফএ অফ ডায়াগোনাল পুনর্গঠন ত্রুটি

ডানদিকে, বিভিন্ন লাইনগুলি বিভিন্ন মানের সাথে সামঞ্জস্য করে এবং অনুভূমিক অক্ষে প্রদর্শিত হয়। নোট করুন যেহেতু বৃদ্ধি পাবে, অনুপাত (সমস্ত ) টির কাছে আসে , যার অর্থ পিসিএ এবং এফএ প্রায় একই লোডিং দেয়, পিসিএ এফএ। অপেক্ষাকৃত ছোট সঙ্গে , যেমন যখন , পিসিএ সঞ্চালিত [expectedly] খারাপ, কিন্তু পার্থক্য হচ্ছে ছোট শক্তিশালী নয় , এবং এমনকি জন্য অনুপাত নিচে ।এন এন কে 1 এন এন = 25 কে কে = 5 1.2knnk1nn=25kk=51.2

অনুপাত বড় হয়ে যখন কারণের সংখ্যা ভেরিয়েবল নম্বর দিয়ে তুলনীয় হয়ে । উদাহরণস্বরূপ আমি উপরে এবং , এফএ পুনর্গঠন ত্রুটি অর্জন করে , যেখানে পিসিএ হয় না, অর্থাৎ অনুপাতটি অসীম হবে। তবে আসল প্রশ্নে ফিরে আসা, যখন এবং , পিসিএ কেবলমাত্র এর অফ-ডায়াগোনাল অংশ ব্যাখ্যা করে এফএর কাছে হ্রাস পাবে ।knn=2k=10n=21k=3C

পিসিএ এবং এফএ এর সচিত্র উদাহরণের জন্য বাস্তব ডেটাসেটে প্রয়োগ করা হয়েছে ( দিয়ে ওয়াইন ডেটাসেট ), আমার উত্তরগুলি এখানে দেখুন:n=13


2
আমি কৌশলগুলির মধ্যে গাণিতিক পার্থক্য সম্পর্কে একটি প্রশ্ন জিজ্ঞাসা করতে চলেছিলাম, যেহেতু এখানে বিষয়ের বেশিরভাগ (অন্যথায় দুর্দান্ত) উত্তরগুলি সুস্পষ্ট গাণিতিক তুলনা করে না। এই উত্তরটি ঠিক আমি যা খুঁজছিলাম is
ছায়াতলকার

2
এটি অত্যন্ত মূল্যবান, তাজা দৃষ্টিকোণ সহ খোলার অ্যাকাউন্ট। আন্তঃ-মধ্যবর্তী কৌশল হিসাবে পিপিসিএ লাগানো অত্যন্ত গুরুত্বপূর্ণ - এটিই আপনার মতামত বাড়ায়। আমি কি আপনাকে পিপিসিএ সম্পর্কে আরও লাইন ছেড়ে যেতে বলব? - কী , এটি কীভাবে অনুমান করা হয় (সংক্ষিপ্তভাবে) এবং এটি থেকে কী আলাদা করে তোলে যাতে পিপিসিগুলি (কারণগুলির চেয়ে পৃথক) ভেরিয়েবলের উপসীমা পূরণ করে এবং পিপিসি তে নির্ভর করে না । σ2Ψk
ttnphns

3
আমি এখানে ডাব্লু / টিটিএনএফএনএসের সাথে সম্মত হতে থাকি, এবং পার্থক্যটি যে এফএ সুপ্ত পরিবর্তনশীলগুলির উপর ভিত্তি করে যেখানে পিসিএ কেবলমাত্র তথ্যের রূপান্তর। তবে এটি খুব ভাল যুক্তিযুক্ত এবং একটি দরকারী বিপরীত অবস্থান। এটি এই থ্রেডের গুণমানকে অবদান রাখে। +1
গাং

5
@ অ্যামিবা আপনার উত্তরটি দুর্দান্ত। এটি এত স্পষ্ট এবং সন্তুষ্ট। আপনার দৃষ্টি ভাগ করে নেওয়ার জন্য ধন্যবাদ।
সুভাষ সি। দাবার

2
@ user795305 দুঃখিত, আমি জবাব দিতে ভুলে গেছি। আপডেট 1 এ লিখিত এফএ মডেলটি সঠিক। সুপ্ত প্রকৃতপক্ষে এবং স্বতন্ত্র বলে ধারণা করা হচ্ছে । এবং জন্য এমএল আসলে আদর্শকে কমিয়ে দিচ্ছে না যেমন আমি আপডেট 2 তে লিখেছি; এটি ছিল ম্লান এবং ভুল। ধন্যবাদ, আমার এটি ঠিক করা উচিত। তবে আমি মনে করি যে এমএল সমাধানটি এমন is ; এটি কেবলমাত্র এখানে লোকসানের কার্যকারিতাটি পার্থক্যের আদর্শ নয় বরং আরও জটিল অভিব্যক্তি (ডাব্লুডাব্লু দেওয়া সম্ভাবনা )। N ( 0 , I ) ϵ W Ψ C - W W - Ψ C W W + Ψ C W W + ΨzN(0,I)ϵWΨCWWΨCWW+ΨCWW+Ψ
অ্যামিবা

27

যেমনটি আপনি বলেছেন, আপনি প্রাসঙ্গিক উত্তরগুলির সাথে পরিচিত ; দেখতে এছাড়াও : So, as long as "Factor analysis..."+ + গত অনুচ্ছেদ দুয়েক; এবং নীচের তালিকা এখানে । সংক্ষেপে, পিসিএ বেশিরভাগই ডেটা হ্রাস করার কৌশল যেখানে এফএ একটি প্রচ্ছন্ন-বৈশিষ্ট্যযুক্ত প্রযুক্তি। কখনও কখনও তারা অনুরূপ ফলাফল দিতে ঘটে; তবে আপনার ক্ষেত্রে - কারণ আপনি সম্ভবত সুপ্ত বৈশিষ্ট্যগুলি নির্মাণ / বৈধকরণের মতো মনে করছেন আসল সত্তা - এফএ ব্যবহার করা আরও সৎ হবে এবং তাদের ফলাফল রূপান্তরিত হওয়ার আশায় আপনার পিসিএ পছন্দ করা উচিত নয়। অন্যদিকে, যখনই আপনি ডেটা সংক্ষিপ্ত / সহজ করার লক্ষ্য রাখেন - পরবর্তী বিশ্লেষণের জন্য, উদাহরণস্বরূপ - আপনি পিসিএ পছন্দ করবেন, কারণ এটি কোনও শক্ত মডেল (যা অপ্রাসঙ্গিক হতে পারে) চাপায় না।

অন্য উপায়ে পুনরাবৃত্তি করার জন্য, পিসিএ আপনাকে এমন কিছু মাত্রা দেয় যা কিছু ইচ্ছুক অর্থবোধক নির্মাণের সাথে সামঞ্জস্য করতে পারে , আপনি যদি চান তবে ইএফএ ভঙ্গ করেছেন যে সেগুলি এমনকি গোপন বৈশিষ্ট্য যা আসলে আপনার ডেটা উত্পন্ন করে এবং এটি লক্ষ্য করে যে এই বৈশিষ্ট্যগুলি সন্ধান করা। এফএ-তে, মাত্রাগুলির ব্যাখ্যা (কারণগুলি) মুলতুবি রয়েছে - আপনি যদি কোনও সুপ্ত পরিবর্তনশীলটির সাথে কোনও অর্থ সংযুক্ত করতে পারেন বা না করেন তবে এটি "বিদ্যমান" (এফএ অপরিহার্য) এটি অন্যথায় আপনার মডেল থেকে বাদ দেওয়া উচিত বা সমর্থন করার জন্য আরও ডেটা পাওয়া উচিত এটা। পিসিএতে একটি মাত্রার অর্থ optionচ্ছিক।

এবং তবুও আবার অন্য কথায়: আপনি যখন m উপাদানগুলি (ত্রুটিগুলি থেকে পৃথক ফ্যাক্টর) বের করেন, এই কয়েকটি কারণগুলি ভেরিয়েবলগুলির মধ্যে সমস্ত পারস্পরিক সম্পর্ককে ব্যাখ্যা করে, যাতে ভেরিয়েবলগুলি কোনওভাবেই ত্রুটির মধ্য দিয়ে সম্পর্ক স্থাপনের জন্য বামে না থাকে। সুতরাং, যতক্ষণ পর্যন্ত "উপাদানগুলি" সুস্পষ্ট বৈশিষ্ট্য হিসাবে সংজ্ঞায়িত করা হয় যা সম্পর্কিত সম্পর্কযুক্ত ডেটা উত্পন্ন / বাঁধাই করে, আপনার কাছে এটি ব্যাখ্যা করার পুরো সূত্র রয়েছে - পারস্পরিক সম্পর্কের জন্য কী দায়ী। পিসিএতে ( উপাদানগুলি "ফ্যাক্টর" হিসাবে আহরণ করুন ) এ ত্রুটিগুলি (মে) এখনও ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক স্থাপন করতে পারে; সুতরাং আপনি দাবি করতে পারবেন না যে আপনি সেভাবে ব্যাখ্যা করার জন্য যথেষ্ট পরিচ্ছন্ন এবং বিস্মৃতকর কিছু বের করেছেন ।

আপনি বর্তমান আলোচনায় আমার অন্যান্য, দীর্ঘ উত্তর পড়তে চাইতে পারেন , পিসিএ এফএর একটি কার্যকর বিকল্প কিনা তা সম্পর্কে কিছু তাত্ত্বিক এবং সিমুলেশন পরীক্ষার বিশদের জন্য। এই থ্রেডে দেওয়া @amoeba দ্বারা বকেয়া উত্তরগুলিতেও দয়া করে মনোযোগ দিন।


আপডেট : এই প্রশ্নের উত্তরে @ অ্যামিবা, যারা সেখানে বিরোধিতা করেছিলেন, তারা একটি (সুপরিচিত নয়) পিপিসিএকে পিসিএ এবং এফএ-এর মধ্যবর্তী স্থানে দাঁড় করিয়েছিল। এটি স্বাভাবিকভাবেই যুক্তিটি চালু করেছিল যে পিসিএ এবং এফএ বিপরীতে পরিবর্তে এক লাইনের সাথে রয়েছে। সেই মূল্যবান দৃষ্টিভঙ্গি কারও তাত্ত্বিক দিগন্তকে প্রসারিত করে। তবে এটি এফএ কয়েকটি যুগল সমযোজী কয়েকটি বিষয় নিয়ে পুনর্গঠন (ব্যাখ্যা) সম্পর্কে গুরুত্বপূর্ণ ব্যবহারিক পার্থক্যটি মুখোশ করতে পারে, যখন পিসিএ এটি সফলভাবে করতে পারে না (এবং যখন এটি মাঝে মাঝে এটি করে - কারণ এটি মাইম এফএর ঘটেছে)।


আপনার উত্তরের জন্য ধন্যবাদ! এফএ এর ফলাফলগুলি বেশিরভাগ ক্ষেত্রে পিসিএর মাধ্যমে প্রাপ্তগুলির সাথে একত্রিত হয়। কেবলমাত্র এটি: প্রাথমিক গবেষণার লেখকরা (খনিটি একটি অনুবাদ + বৈধকরণ) একটি পিসিএ বিশ্লেষণ ব্যবহার করেছিলেন। আমার কাগজে পিসিএ বিশ্লেষণ রাখা এবং এফএ ফলাফল রূপান্তরিত করে এমন একটি বাক্য যুক্ত করার জন্য এটি কি যথেষ্ট, না আমার পিসিএ এফএ দ্বারা প্রতিস্থাপন করা উচিত? দ্রষ্টব্য যে পর্যালোচক প্রকৃতপক্ষে আমাদের এটি করার জন্য স্পষ্টভাবে জিজ্ঞাসা করে না, তিনি কেবলমাত্র এফএ এর পরিবর্তে আমরা কেন পিসিএ বেছে নিয়েছি তা ন্যায়সঙ্গত করতে বলছে।
ক্যারিন

আমি মনে করি: লেখকরা যদি পিসিএ ব্যবহার করেন তবে আরও কঠোর / সৎ দৃষ্টিভঙ্গি যদি এফএ-কে তাদের ক্ষেত্রে কল করে তবে ফলাফলের তুলনা করার জন্য আপনার উচিত সমালোচনার একটি লাইন ফেলে দেওয়া এবং পিসিএ বা উভয় পিসিএ এবং ইএফএ সম্পাদন করা।
ttnphns

2
পার্থক্যটিও লক্ষ করুন যে পিসিএতে নিষ্কাশন / ধরে রাখার মাত্রাগুলির সংখ্যাটি মৌলিকভাবে বিষয়গত, যখন ইএফএ-তে সংখ্যাটি নির্দিষ্ট করা থাকে, এবং আপনাকে সাধারণত বেশ কয়েকটি সমাধান পরীক্ষা করতে হয়, উদাহরণস্বরূপ 3 যদিও 5 কারণ, তারা কীভাবে ডিগ্রির জন্য পারস্পরিক সম্পর্ক মেট্রিক্স পুনরুত্পাদন করুন এবং তারা কতটা ব্যাখ্যাযোগ্য। এফএ আরও ক্লান্তিকর, এ কারণেই লোকেরা প্রায়শই সেই ক্ষেত্রে পিসিএ করা পছন্দ করে যেখানে একটি বিবেকবান পন্থা বেশ কয়েকটি ইএফএ পাস করার চেষ্টা করে।
ttnphns

: এছাড়াও উইকিপিডিয়া এন্ট্রি এছাড়াও দেখুন en.wikipedia.org/wiki/...
RobertF

15

এই আমার উত্তর (ক দ্বিতীয় ও অতিরিক্ত সালে অন্যান্য এখানে খনি) আমি যে ছবিগুলি দেখানোর জন্য চেষ্টা করবে পিসিএ (- maximizes - ভ্যারিয়েন্স সন্তোষজনক ভাবে যেহেতু এটি পুনরুদ্ধার) কোন ভাল একটি সহভেদাংক পুনঃস্থাপন করে না।

পিসিএ বা ফ্যাক্টর বিশ্লেষণে আমার উত্তরগুলির মতো আমি বিষয়বস্তুতে ভেরিয়েবলের ভেক্টর উপস্থাপনার দিকে ঝুঁকছি । এই উদাহরণে এটি কেবল একটি লোডিং প্লট যা ভেরিয়েবল এবং তাদের উপাদান লোডগুলি দেখায়। সুতরাং আমরা পেয়েছিলাম এবং ভেরিয়েবল (আমরা শুধুমাত্র ডেটাসেটে দুই ছিল), , তাদের 1 ম প্রধান উপাদান loadings সঙ্গে এবং । ভেরিয়েবলের মধ্যে কোণটিও চিহ্নিত করা হয়। ভেরিয়েবলগুলি প্রাথমিকভাবে কেন্দ্রিক ছিল, সুতরাং তাদের স্কোয়ার দৈর্ঘ্য, এবং their তাদের নিজ নিজ প্রকরণের।এক্স 2 এফ একটি 1 একটি 2 2 12 2X1X2Fa1a2h12h22

এখানে চিত্র বর্ণনা লিখুন

এবং মধ্যে হ'ল - এটি তাদের স্কেলার পণ্য - (এই পারস্পরিক সম্পর্ক মান is পিসিএ এর Loadings, অবশ্যই, সামগ্রিক ভ্যারিয়েন্স সর্বোচ্চ সম্ভব ক্যাপচার দ্বারা , কম্পোনেন্ট এর ভ্যারিয়েন্স।X1X2h1h2cosϕh12+h22a12+a22F

এখন, কোভেরিয়েন্স , যেখানে হল ভেরিয়েবল উপর ভ্যারিয়েবল এর প্রজেকশন (প্রজেকশনটি যা দ্বিতীয় দ্বারা প্রথমটির রিগ্রেশন )) এবং সুতরাং কোভেরিয়েন্সের তীব্রতা নীচের আয়তক্ষেত্রের অঞ্চল দ্বারা উপস্থাপিত হতে পারে (দিকগুলি এবং )।h1h2cosϕ=g1h2g1X1X2g1h2

এখানে চিত্র বর্ণনা লিখুন

তথাকথিত "ফ্যাক্টর উপপাদ্য" অনুসারে (আপনি যদি ফ্যাক্টর বিশ্লেষণের উপর কিছু পড়েন তবে জানা থাকতে পারে), ভেরিয়েবলের মধ্যে সমবায় (গুলি) সঠিকভাবে বের করা উচিত (নিবিড়ভাবে, ঠিক না হলে) এক্সট্রাক্ট অব सुप्त ভেরিয়েবল (গুলি) এর লোডিংয়ের গুণ দ্বারা পুনরুত্পাদন করা উচিত ( পড়ুন )। এটি হল, , আমাদের নির্দিষ্ট ক্ষেত্রে (যদি আমাদের সুপ্ত পরিবর্তনশীল হিসাবে মূল উপাদানটি স্বীকৃতি দেয়)। পুনরুত্পাদন করা কোভারিয়েন্সের সেই মানটি এবং সাথে একটি আয়তক্ষেত্রের অঞ্চল দ্বারা রেন্ডার করা যেতে পারে । তুলনা করার জন্য পূর্ববর্তী আয়তক্ষেত্রের দ্বারা সাজানো আয়তক্ষেত্রটি আঁকুন। এই আয়তক্ষেত্রটি নীচে ছিটিয়ে দেখানো হয়েছে এবং এর ক্ষেত্রটির ডাকনাম কোভ * (পুনরুত্পাদন কোভ )।a1a2a1a2

এখানে চিত্র বর্ণনা লিখুন

এটা সুস্পষ্ট যে দুটি ক্ষেত্রই বেশ ভিন্ন, যেমন কোভ * আমাদের উদাহরণে যথেষ্ট বড়। কোভারিয়েন্স , প্রথম অধ্যক্ষ উপাদান লোডিং দ্বারা অত্যধিক গুরুত্ব পেয়েছে । এটি এমন কারও বিপরীতে যারা আশা করতে পারে যে পিসিএ, সম্ভাব্য দু'জনের প্রথম একক উপাদান দ্বারা সমবায়িকতার পর্যবেক্ষিত মান পুনরুদ্ধার করবে।F

প্রজননকে প্রশস্ত করার জন্য আমাদের প্লটটি দিয়ে আমরা কী করতে পারি? আমরা উদাহরণস্বরূপ, বিমটিকে ঘড়ির কাঁটার দিকে কিছুটা ঘোরান , এমনকি এটি দিয়ে সুপারপোজ না করা পর্যন্ত । যখন তাদের রেখাগুলি মিলে যায়, এর অর্থ হ'ল আমরা কে আমাদের সুপ্ত পরিবর্তনশীল হতে বাধ্য করে । তারপরে লোড করা ( এটিতে অভিক্ষেপ ) হবে এবং ( এটিতে অভিক্ষেপ ) লোড করা হবে । তারপরে দুটি আয়তক্ষেত্র এক হ'ল - কোভ লেবেলযুক্ত একটি , এবং সুতরাং সমাহারটি পুরোপুরি পুনরুত্পাদন করা হয়। তবে, , নতুন "সুপ্ত ভেরিয়েবল" দ্বারা ব্যাখ্যা করা বৈকল্পিকটি এর চেয়ে ছোটFX2X2a2X2h2a1X1g1g12+h22a12+a22 , পুরানো সুপ্ত পরিবর্তনশীল দ্বারা ব্যাখ্যা করা বৈকল্পিক, প্রথম মুল উপাদান (তুলনামূলকভাবে চিত্রের দুটি আয়তক্ষেত্রের প্রতিটি অংশকে বর্গাকার এবং স্ট্যাক করুন)। দেখা যাচ্ছে যে আমরা সমবায় প্রজনন পরিচালনা করতে পেরেছি, তবে তারতম্যের পরিমাণ ব্যাখ্যা করার ব্যয়ে। অর্থাৎ প্রথম প্রধান উপাদানটির পরিবর্তে অন্য একটি সুপ্ত অক্ষ নির্বাচন করে।

আমাদের কল্পনা বা অনুমান প্রস্তাব দিতে পারে (আমি গণিত দ্বারা এটি প্রমাণ করতে পারব না এবং আমি গণিতবিদ নই) আমরা যদি এবং দ্বারা নির্ধারিত স্থান থেকে সুপ্ত অক্ষটি ছেড়ে দিই , তবে বিমানটি এটিকে সুইং করার অনুমতি দেয় আমাদের দিকে কিছুটা হলেও আমরা এর সর্বোত্তম অবস্থানটি খুঁজে পেতে পারি - এটিকে কল করুন, বলুন, - যার মাধ্যমে লোডিং ( ) দ্বারা সমবায়িকতা আবার পুরোপুরি পুনরুত্পাদন করা হয়েছে যখন বৈকল্পিক ব্যাখ্যা হয়েছে ( ) চেয়ে বড় হবে , যদিও মূল উপাদান এর মতো বড় নয় ।X1X2Fa1a2a12+a22g12+h22a12+a22F

আমি বিশ্বাস করি যে এই অবস্থা হয় সাধনযোগ্য যখন সুপ্ত অক্ষ বিশেষ করে যে ক্ষেত্রে এমনভাবে সমতল থেকে বের ব্যাপ্ত হিসাবে দুই উদ্ভূত লম্ব প্লেন এর "ফণা", এক অক্ষ এবং ধারণকারী টান টানা পরার এবং অক্ষ এবং অন্যটি । তারপরে এই সুপ্ত অক্ষটিকে আমরা সাধারণ ফ্যাক্টর বলব এবং আমাদের পুরো "মৌলিকতায় প্রচেষ্টা" নামকরণ করা হবে ফ্যাক্টর বিশ্লেষণFX1X2


পিসিএ সম্পর্কিত @ অ্যামিবার "আপডেট 2" তে একটি উত্তর to

এসোডি বা ইগেন-পচনের উপর ভিত্তি করে একোয়ার-ইয়ং উপপাদ্য যা পিসিএ এবং এর কনজেনেরিক কৌশল (পিসিওএ, বিপ্লট, চিঠিপত্র বিশ্লেষণ) এর জন্য মৌলিক, এটি অ্যামিবা সঠিক এবং প্রাসঙ্গিক। এটা মতে, প্রথম অধ্যক্ষ অক্ষ সন্তোষজনক ভাবে কমান - একটি পরিমাণ সমান , - সেইসাথে । এখানে তথ্য হিসাবে দ্বারা পুনরুত্পাদন ঘোরা প্রধান অক্ষ। সমান হিসাবে পরিচিত , এর ভেরিয়েবল লোডিং হিসাবেkX||XXk||2tr(XX)tr(XkXk)||XXXkXk||2XkkXkXkWkWkWkk উপাদান।

তার মানে যে কম সত্য থাকা যদি আমরা শুধুমাত্র বিবেচনা অফ-তির্যক উভয় প্রতিসম ম্যাট্রিক্সের অংশ? আসুন পরীক্ষা করে এটি পরিদর্শন করি insp||XXXkXk||2

500 এলোমেলো 10x6ম্যাট্রিক্স তৈরি করা হয়েছিল (অভিন্ন বিতরণ)। প্রত্যেকের জন্য, এর কলামগুলি কেন্দ্র করে, পিসিএ সঞ্চালিত হয়েছিল এবং দুটি পুনর্গঠিত তথ্য ম্যাট্রিকেস গণনা করা হয়েছে: একটি উপাদান 1 থেকে 3 দ্বারা পুনর্গঠিত ( প্রথম হিসাবে স্বাভাবিক হিসাবে), এবং অন্যটি উপাদান 1, 2 দ্বারা পুনর্গঠিত হিসাবে , এবং 4 (অর্থাৎ উপাদান 3 একটি দুর্বল উপাদান 4 দ্বারা প্রতিস্থাপিত হয়েছিল)। পুনর্গঠন ত্রুটি (ছক পার্থক্য এর সমষ্টি = ইউক্লিডিয় দূরত্ব ছক) তাহলে এক জন্য নির্ণিত ছিল , অপরের জন্য । এই দুটি মান একটি স্ক্যাটারপ্লোতে দেখানোর জন্য একটি জুড়ি।XXkk||XXXkXk||2XkXk

পুনর্গঠন ত্রুটি প্রতিবার দুটি সংস্করণে গণনা করা হয়েছিল: (ক) পুরো ম্যাট্রিকেস এবং তুলনা করা; (খ) দুটি ম্যাট্রিকের তুলনায় কেবল অফ-ডায়াগোনাল। সুতরাং, আমাদের দুটি স্ক্রেটারপ্লট রয়েছে যার প্রতিটি 500 পয়েন্ট রয়েছে।XXXkXk

এখানে চিত্র বর্ণনা লিখুন

আমরা দেখতে পাচ্ছি যে "পুরো ম্যাট্রিক্স" প্লটে সমস্ত পয়েন্ট y=xলাইন উপরে রয়েছে । যার অর্থ হ'ল পুরো স্কেলার-প্রোডাক্ট ম্যাট্রিক্সের পুনর্গঠনটি "1, 3, 4 উপাদান" এর চেয়ে "1 থেকে 3 উপাদান" দ্বারা সবসময় আরও নির্ভুল হয়। এটি এককার্ট-ইয়ং উপপাদ্যের সাথে সামঞ্জস্যপূর্ণ: প্রথম প্রধান উপাদানগুলি সেরা ফিটরা।k

যাইহোক, যখন আমরা "অফ-ডায়াগোনাল কেবল" প্লটটি দেখি আমরা y=xলাইনের নীচে বেশ কয়েকটি পয়েন্ট লক্ষ্য করি । দেখা গেছে যে কখনও কখনও "1 মাধ্যমে 3 উপাদান" দ্বারা ত্রিভুজ অংশগুলির পুনর্গঠন "1, 2, 4 উপাদান" এর চেয়ে খারাপ ছিল। যা স্বয়ংক্রিয়ভাবে এই সিদ্ধান্তে পৌঁছে যায় যে প্রথম প্রধান উপাদানগুলি নিয়মিতভাবে পিসিএতে উপলব্ধ ফিটারের মধ্যে অফ-ডায়াগোনাল স্কেলার পণ্যগুলির সেরা ফিটার নয়। উদাহরণস্বরূপ, শক্তিশালীের পরিবর্তে দুর্বল উপাদান গ্রহণ করা কখনও কখনও পুনর্গঠনের উন্নতি করতে পারে।k

সুতরাং, এমনকি পিসিএর ডোমেনেও , সিনিয়র প্রধান উপাদানগুলি - যারা আমাদের জানা হিসাবে প্রায় সামগ্রিক বৈকল্পিকতা করে, এমনকি সমগ্র কোভরিয়েন্স ম্যাট্রিক্সও - অগত্যা অফ-ডায়াগোনাল কোভেরিয়েন্সগুলি আনুমানিক নয় । সেগুলির থেকে আরও ভাল অপ্টিমাইজেশন প্রয়োজন; এবং আমরা জানি যে ফ্যাক্টর এনালাইসিস হ'ল (বা এর মধ্যে) প্রযুক্তি যা এটি সরবরাহ করতে পারে।


@ অ্যামিবার "আপডেট 3" - এর ফলোআপ: ভেরিয়েবলের সংখ্যা বাড়ার সাথে সাথে পিসিএ কি এফএ-র কাছে আসে? পিসিএ এফএ এর একটি বৈধ বিকল্প?

আমি সিমুলেশন স্টাডি একটি জাল্লা চালিয়েছি। কয়েকটি সংখ্যক জনসংখ্যার ফ্যাক্টর কাঠামো, লোডিং ম্যাট্রিক্স এলোমেলো সংখ্যার দ্বারা নির্মিত হয়েছিল এবং তাদের সাথে সম্পর্কিত জনসংখ্যার কোভরিয়েন্স ম্যাট্রিকগুলিকে হিসাবে রূপান্তর করা হয়েছিল , একটি তির্যক গোলমাল (অনন্য) ভেরিয়ানস)। এই সমবায় ম্যাট্রিকগুলি সমস্ত ভেরিয়েন্স 1 দিয়ে তৈরি হয়েছিল, তাই তারা তাদের পারস্পরিক সম্পর্ক ম্যাট্রিক্সের সমান ছিল।AR=AA+U2U2

দুটি ধরণের ফ্যাক্টর কাঠামো ডিজাইন করা হয়েছিল - তীক্ষ্ণ এবং ছড়িয়ে দেওয়া । তীক্ষ্ণ কাঠামো হ'ল পরিষ্কার কাঠামোযুক্ত একটি: লোডিংগুলি "কম" এর "উচ্চ" হয়, মধ্যবর্তী হয় না; এবং (আমার ডিজাইনে) প্রতিটি পরিবর্তনশীল এক ফ্যাক্টর দ্বারা খুব লোড হয়। সংশ্লিষ্ট তাই লক্ষণীয়ভাবে ব্লক-মত is ডিফিউজ কাঠামোটি উচ্চ এবং নিম্ন লোডিংয়ের মধ্যে পার্থক্য করে না: এগুলি একটি গণ্ডির মধ্যে যে কোনও এলোমেলো মান হতে পারে; এবং লোডিংয়ের মধ্যে কোনও নিদর্শন কল্পনা করা হয় না। ফলস্বরূপ, সংশ্লিষ্ট মসৃণ হয়। জনসংখ্যার ম্যাট্রিকগুলির উদাহরণ:RR

এখানে চিত্র বর্ণনা লিখুন

কারণগুলির সংখ্যা ছিল বা । ভেরিয়েবলের সংখ্যা নির্ধারণ করা হয়েছিল অনুপাত অনুসারে k = সংখ্যার অনুপাত দ্বারা ; গবেষণায় কে মান দৌড়ে ।264,7,10,13,16

কয়েক নির্মাণ জনসংখ্যা প্রত্যেকের জন্য , বিশ্বকাপ বন্টন (নমুনা আকার অধীনে থেকে তার র্যান্ডম উপলব্ধির ) উত্পন্ন হয়। এগুলি ছিল নমুনা কোভেরিয়েন্স ম্যাট্রিক্স। প্রতিটি এফএ (প্রধান অক্ষ এক্সট্রাকশন দ্বারা) পাশাপাশি পিসিএ দ্বারা ফ্যাক্টর-বিশ্লেষণ করা হয়েছিল । তদুপরি, এই জাতীয় প্রতিটি কোভরিয়েন্স ম্যাট্রিক্সকে একইভাবে নমুনা পারস্পরিক সম্পর্ক ম্যাট্রিক্সে রূপান্তরিত করা হয়েছিল যা একইভাবে ফ্যাক্টর-এনালাইজড (ফ্যাকটেড) হয়েছিল। শেষ অবধি, আমি নিজেই "পিতামাতা", জনসংখ্যার কোভারিয়েন্স (= পারস্পরিক সম্পর্ক) ম্যাট্রিক্সের ফ্যাক্টরিংও সম্পাদন করেছি। নমুনা দেওয়ার পর্যাপ্ততার কায়সার-মায়ার-ওলকিন পরিমাপ সর্বদা 0.7 এর উপরে ছিল।50R50n=200

২ টি ফ্যাক্টর সহ ডেটাগুলির জন্য বিশ্লেষণগুলি 2 টি বের করে এবং 1 টি পাশাপাশি 3 টি কারণও ("অবমূল্যায়ন" এবং "গুণনীয়ানগুলির সঠিক সংখ্যার" অত্যধিক গুরুত্ব ")। Factors টি কারণ সহ ডেটাগুলির জন্য বিশ্লেষণগুলি একইভাবে racted টি এবং আরও ৪ টি পাশাপাশি 8 টি কারণকেও বিশ্লেষণ করে।

গবেষণার লক্ষ্য ছিল এফএ বনাম পিসিএর সমবায় / পারস্পরিক সম্পর্ক পুনরুদ্ধার গুণাবলী। সুতরাং অফ-তির্যক উপাদানগুলির অবশিষ্টাংশ প্রাপ্ত করা হয়েছিল। আমি পুনরুত্পাদন উপাদান এবং জনসংখ্যার ম্যাট্রিক্স উপাদানগুলির পাশাপাশি পূর্বের এবং বিশ্লেষণকৃত নমুনা ম্যাট্রিক্স উপাদানগুলির মধ্যে অবশিষ্টাংশ নিবন্ধিত করেছি। 1 ম প্রকারের অবশিষ্টাংশগুলি ধারণাগতভাবে আরও আকর্ষণীয় ছিল।

নমুনা কোভেরিয়েন্স এবং নমুনা পারস্পরিক সম্পর্কের ম্যাট্রিকগুলিতে করা বিশ্লেষণের পরে প্রাপ্ত ফলাফলগুলির মধ্যে কিছু পার্থক্য ছিল, তবে সমস্ত মূল ফলাফল একই রকম ছিল। অতএব আমি কেবলমাত্র "পারস্পরিক সম্পর্ক-মোড" বিশ্লেষণ করে আলোচনা করছি (ফলাফল দেখাচ্ছে)।

1. পিসিএ বনাম এফএ দ্বারা সামগ্রিকভাবে অফ ডায়াগোনাল ফিট

প্লটের নীচের গ্রাফিকগুলি, বিভিন্ন সংখ্যক উপাদান এবং বিভিন্ন কে-এর বিপরীতে, গড় স্কোয়ার অফ অফ-ডায়াগোনাল অবশিষ্টাংশের অনুপাত পিসিএতে সমান পরিমাণে এফএতে প্রাপ্ত হয়েছিল । এটি "অ্যামিবা" "আপডেট 3" তে যা দেখায় তার অনুরূপ। প্লটের রেখাগুলি 50 টি সিমুলেশন জুড়ে গড় প্রবণতাগুলি উপস্থাপন করে (আমি তাদের উপর st ত্রুটি বার দেখানো বাদ দিই)।

(দ্রষ্টব্য: ফলাফলগুলি এলোমেলো নমুনা পারস্পরিক সম্পর্ক ম্যাট্রিক্সের ফ্যাক্টরিং সম্পর্কিত, জনসংখ্যার ম্যাট্রিক্স পিতামাতাকে তাদের কাছে ফ্যাক্টরিং করার বিষয়ে নয়: তারা জনসংখ্যার ম্যাট্রিক্সকে কতটা ভালভাবে ব্যাখ্যা করে তা হিসাবে পিসিএর তুলনা করা বোকামি - এফএ সর্বদা জিতবে, এবং যদি সঠিক সংখ্যক উপাদানগুলি বের করা হয়েছে, এর অবশিষ্টাংশগুলি প্রায় শূন্য হবে এবং সুতরাং অনুপাতটি অনন্তের দিকে ছুটে যাবে))

এখানে চিত্র বর্ণনা লিখুন

এই প্লট মন্তব্য:

  • সাধারণ প্রবণতা: কে হিসাবে (প্রতিটি ফ্যাক্টর অনুসারে ভেরিয়েবলের সংখ্যা) পিসিএ / এফএ সামগ্রিক সাবফিট অনুপাত 1 এর দিকে ম্লান হয়। এটি, আরও ভেরিয়েবলের সাথে পিসিএ অফ-ডায়াগোনাল পারস্পরিক সম্পর্ক / কোভেরিয়েন্সগুলি ব্যাখ্যা করার জন্য এফএর সাথে যোগাযোগ করে। (তার উত্তরে @ অ্যামিবা ডকুমেন্টেড।) সম্ভবতঃ বক্ররেখাগুলি অনুমান করা আইনটি অনুপাত = এক্সপ্রেস (বি 0 + বি 1 / কে) 0 এর সাথে বি 0 থাকে।
  • অনুপাতটি আর্টের অবশিষ্টাংশগুলি "জনসংখ্যার বিয়োগ পুনরায় উত্পাদিত নমুনা" (ডান প্লট) এর চেয়ে বৃহত্তর আর্টের অবশিষ্টাংশগুলি "নমুনা বিয়োগ পুনরুত্পৃত নমুনা" (বাম প্লট)। এটি (তুচ্ছভাবে), মেট্রিক্সের সাথে সাথে বিশ্লেষণ করা ফিটিংয়ের ক্ষেত্রে পিসিএ এফএর থেকে নিকৃষ্ট হয়। তবে, বাম চক্রান্তের রেখাগুলিতে দ্রুত হ্রাসের হার রয়েছে, সুতরাং কে = 16 দ্বারা অনুপাতটি 2 এরও নীচে, এটি ডান প্লট হিসাবে রয়েছে।
  • অবশিষ্টাংশগুলির সাথে "জনসংখ্যার বিয়োগ পুনরুত্পাদন করা নমুনা", ট্রেন্ডগুলি সর্বদা উত্তল বা এমনকি একঘেয়ে হয় না (অস্বাভাবিক কনুইটি প্রদত্ত দেখানো হয়)। সুতরাং, যতক্ষণ বক্তৃতাটি একটি নমুনা ফ্যাক্টরিংয়ের মাধ্যমে সহগের একটি জনসংখ্যার ম্যাট্রিক্স ব্যাখ্যা করার জন্য, ভেরিয়েবলের সংখ্যা বৃদ্ধি করা নিয়মিতভাবে পিসিএকে তার ফিটনেক মানের এফএর কাছাকাছি নিয়ে আসে না, যদিও প্রবণতা রয়েছে।
  • জনসংখ্যার মি = factors ফ্যাক্টরের তুলনায় অনুপাত এম = ২ ফ্যাক্টরের চেয়ে বেশি (গা bold় লাল রেখাগুলি গা bold় সবুজ রেখার নীচে থাকে)। যার অর্থ যে আরও বেশি কারণের সাথে ডেটা পিসিএ অভিনয় করে তাড়াতাড়ি এফএতে ধরা দেয়। উদাহরণস্বরূপ, ডান প্লটটিতে k = 4 ফলন অনুপাত 6 কারণের জন্য প্রায় 1.7, যখন 2 কারণের জন্য একই মান কে = 7 এ পৌঁছেছে।
  • অনুপাতের পরিমাণ আরও বেশি হয় যদি আমরা আরও বেশি কারণকে সত্যিকারের সংখ্যার সাথে তুলনা করি। এটি, পিসিএ এফএর তুলনায় আরও কিছুটা খারাপ হয় যদি এক্সট্রাকশনে আমরা কারণগুলির সংখ্যাকে অবমূল্যায়ন করি; এবং কারণগুলির সংখ্যা সঠিক বা অত্যধিক সংশোধন করা হলে (গা bold় রেখার সাথে পাতলা রেখাগুলির তুলনা করুন) এটি এতে আরও বেশি হারায়।
  • ফ্যাক্টর কাঠামোর তীক্ষ্ণতার একটি আকর্ষণীয় প্রভাব রয়েছে যা কেবলমাত্র তখনই উপস্থিত হয় যখন আমরা অবশিষ্টাংশগুলিকে "জনসংখ্যার বিয়োগ পুনরুত্পাদন করা নমুনা" বিবেচনা করি: ডানদিকে ধূসর এবং হলুদ প্লট তুলনা করুন। যদি জনসংখ্যার উপাদানগুলি ভেরিয়েবলগুলি বিচ্ছিন্নভাবে লোড করে তবে লাল রেখাগুলি (এম = 6 ফ্যাক্টর) নীচে ডুবে যায়। এটি হ'ল, ছড়িয়ে পড়া কাঠামোতে (যেমন বিশৃঙ্খলা সংখ্যার লোডিং) পিসিএ (একটি নমুনার উপর সঞ্চালিত) জনসংখ্যা সম্পর্কিত পুনর্গঠনের ক্ষেত্রে এফএর চেয়ে কিছুটা খারাপ - এমনকি ছোট কে-এর অধীনে, শর্ত থাকে যে জনসংখ্যার কারণগুলির সংখ্যা না খুব ছোট. পিসিএ এফএর সবচেয়ে কাছাকাছি অবস্থিত এবং এটির চিপার বিকল্প হিসাবে সর্বাধিক সতর্ক করা হয় এমন অবস্থা সম্ভবত। যদিও ধারালো ফ্যাক্টর কাঠামোর উপস্থিতিতে পিসিএ জনসংখ্যার পারস্পরিক সম্পর্ক (বা সমবায়) পুনর্গঠনে এতটা আশাবাদী নয়: এটি কেবল বড় কে দৃষ্টিকোণে এফএর কাছে পৌঁছেছে।

2. পিসিএ বনাম এফএ দ্বারা প্রাথমিক স্তরের ফিট: অবশিষ্টাংশ বিতরণ

প্রতিটি সিমুলেশন পরীক্ষার জন্য যেখানে জনসংখ্যার ম্যাট্রিক্স থেকে 50 টি এলোমেলো নমুনা ম্যাট্রিক্সের ফ্যাক্টরিং (পিসিএ বা এফএ দ্বারা) সঞ্চালিত হয়েছিল, সেখানে প্রতিটি অফ-ডায়োনাল পারস্পরিক সম্পর্কের উপাদানগুলির জন্য "জনসংখ্যা সম্পর্কিত বিয়োগ পুনরুত্পাদন (ফ্যাক্টরিং দ্বারা) নমুনার পারস্পরিক সম্পর্ক" বন্টন প্রাপ্ত হয়েছিল। বিতরণগুলি সুস্পষ্ট নিদর্শন অনুসরণ করেছে এবং সাধারণ বিতরণের উদাহরণগুলি নীচে চিত্রিত করা হয়েছে। পরে ফলাফল পিসিএ ফ্যাক্টরিং নীল বাম পক্ষের এবং পরে ফলাফল নেই এফএ ফ্যাক্টরিং সবুজ অধিকার পক্ষই।

এখানে চিত্র বর্ণনা লিখুন

প্রধান সন্ধানটি এটি

  • নিখুঁত মাত্রার দ্বারা, জনসংখ্যার পারস্পরিক সম্পর্কগুলি অপরিশোধিতভাবে পিসিএ দ্বারা পুনরুদ্ধার করা হয়: পুনরুত্পাদন করা মানগুলি দৈর্ঘ্যের দ্বারা অতিরিক্ত হয় res
  • কিন্তু পক্ষপাতটি কে (কারণের অনুপাতের সংখ্যার পরিবর্তকের সংখ্যা) বৃদ্ধি পাওয়ার সাথে সাথে অদৃশ্য হয়ে যায় । পিকটিতে, যখন ফ্যাক্টর অনুসারে কেবল কে = 4 ভেরিয়েবল থাকে, পিসিএর অবশিষ্টাংশগুলি 0 থেকে অফসেটে ছড়িয়ে পড়ে যখন 2 টি উপাদান এবং 6 টি কারণ উপস্থিত থাকে তখন এটি উভয়ই দেখা যায়। তবে কে = 16 দিয়ে অফসেটটি খুব কমই দেখা যায় - এটি প্রায় অদৃশ্য হয়ে যায় এবং পিসিএ ফিট ফিট এফএ ফিট করে। পিসিএ এবং এফএ এর মধ্যে অবশিষ্টাংশের স্প্রেড (ভেরিয়েন্স) মধ্যে কোনও পার্থক্য পরিলক্ষিত হয়।

অনুরূপ চিত্রটিও দেখা যায় যখন উত্তোলিত উপাদানগুলির সংখ্যা সঠিক সংখ্যার সাথে মেলে না: কেবলমাত্র অবশিষ্টাংশের ভিন্নতা কিছুটা পরিবর্তিত হয়।

ধূসর পটভূমিতে উপরে দেখানো বিতরণগুলি জনসংখ্যায় উপস্থিত তীক্ষ্ণ (সাধারণ) ফ্যাক্টর কাঠামোর সাথে পরীক্ষাগুলির সাথে সম্পর্কিত । সমস্ত বিশ্লেষণ যখন ছড়িয়ে পড়া জনসংখ্যার ফ্যাক্টর কাঠামোর পরিস্থিতিতে করা হয়েছিল, তখন দেখা গিয়েছিল যে পিসিএর পক্ষপাতদুষ্টতা কেবল কে-এর উত্থানের সাথেই নয়, মিটার (সংখ্যাগুলির সংখ্যা) বৃদ্ধির সাথেও ম্লান হয়ে যায় । অনুগ্রহ করে "6 টি কারণ, কে = 4" কলামে হলুদ-পটভূমি সংযুক্তিগুলি স্কেল করা হয়েছে: পিসিএ ফলাফলের জন্য 0 টি পর্যবেক্ষণ করা থেকে প্রায় কোনও অফসেট নেই (অফসেটটি এখনও এম = 2 দিয়ে উপস্থিত রয়েছে, যা পিকটিতে দেখানো হয়নি) )।

বর্ণিত অনুসন্ধানগুলি গুরুত্বপূর্ণ বলে ভেবে আমি সেই অবশিষ্টাংশগুলি আরও গভীরভাবে পরিদর্শন করার সিদ্ধান্ত নিয়েছি এবং উপাদানগুলির (জনসংযোগ সম্পর্কিত) মান (এক্স অক্ষ) এর বিপরীতে অবশিষ্টাংশ (ওয়াই অক্ষ) এর বিক্ষিপ্ত প্লটগুলি প্লট করেছি । এই স্ক্যাটারপ্লটগুলি প্রতিটি (50) বহু সিমুলেশন / বিশ্লেষণের ফলাফলগুলিকে একত্রিত করে। নিখরচায় ফিট লাইন (50% স্থানীয় পয়েন্ট ব্যবহারের জন্য, ইপেনটেকনিকভ কার্নেল) হাইলাইট করা হয়েছে। প্লটের প্রথম সেটটি জনসংখ্যার তীক্ষ্ণ ফ্যাক্টর কাঠামোর ক্ষেত্রে (পারস্পরিক সম্পর্কের মানগুলির ত্রৈমাসিকত্ব তাই প্রকাশিত হয়):

এখানে চিত্র বর্ণনা লিখুন

মন্তব্য:

  • আমরা স্পষ্টতই (উপরে বর্ণিত) পুনর্গঠন পক্ষপাত দেখতে পাই যা পিসিএর বৈশিষ্ট্য হ'ল স্কিউ, নেতিবাচক প্রবণতা লোস লাইন: পরম মানের জনসংখ্যার পারস্পরিক সম্পর্কের ক্ষেত্রে বড় নমুনা ডেটাসেটের পিসিএ দ্বারা অত্যুক্তি করা হয়। এফএ নিরপেক্ষ (অনুভূমিক লাউস)।
  • কে বাড়ার সাথে সাথে পিসিএর পক্ষপাতিত্ব হ্রাস পায়।
  • জনসংখ্যায় কতগুলি কারণ রয়েছে তা নির্বিশেষে পিসিএ পক্ষপাতদুষ্ট: 6 টি উপাদান বিদ্যমান (এবং 6 বিশ্লেষণে আহরণ করা হয়েছে) এটি 2 টি কারণের অস্তিত্বের সাথে একইভাবে ত্রুটিযুক্ত (2 উত্তোলিত)।

নীচে প্লটের দ্বিতীয় সেটটি জনসংখ্যার মধ্যে ছড়িয়ে পড়া ফ্যাক্টর কাঠামোর ক্ষেত্রে :

এখানে চিত্র বর্ণনা লিখুন

আবার আমরা পিসিএ দ্বারা পক্ষপাতিত্ব পর্যবেক্ষণ। তবে তীব্র ফ্যাক্টর স্ট্রাকচার কেসের বিপরীতে পক্ষপাতগুলি ফ্যাক্টর সংখ্যা বৃদ্ধি করার সাথে সাথে ম্লান হয়ে যায়: 6 জনসংখ্যার কারণের সাথে, পিসিএর লম্ব লাইনটি কেবল 4 কে এর অধীনে অনুভূমিক হওয়া থেকে খুব বেশি দূরে নয় is এটিই আমরা প্রকাশ করেছি " ইয়েলো হিস্টোগ্রাম "এর আগে।

স্ক্যাটারপ্লটসের উভয় সেটগুলির একটি আকর্ষণীয় ঘটনাটি হ'ল পিসিএর জন্য লোস লাইনগুলি এস-বাঁকা। এই বক্রতাটি অন্যান্য জনসংখ্যার ফ্যাক্টর কাঠামোর (লোডিং) এলোমেলোভাবে আমার দ্বারা নির্মিত (আমি পরীক্ষা করে দেখেছি) দেখায় যদিও এর ডিগ্রিটি পরিবর্তিত হয় এবং প্রায়শই দুর্বল থাকে। যদি এস-শেপ থেকে অনুসরণ করা হয় তবে পিসিএ 0 (বা বিশেষত ছোট কে এর অধীনে) থেকে লাফিয়ে নেওয়ার সাথে সাথে দ্রুত সংযোগগুলি বিকৃত করতে শুরু করে, তবে কিছু মান থেকে - প্রায় 30 বা .40 - এটি স্থিতিশীল হয়। সেই আচরণের সম্ভাব্য কারণের জন্য আমি এখনই অনুমান করতে পারি না, তবে আমি বিশ্বাস করি যে "সাইনোসয়েড" পারস্পরিক সম্পর্কের ত্রিকোণমিতি প্রকৃতি থেকে উদ্ভূত।

পিসিএ বনাম এফএ দ্বারা ফিট: উপসংহার

পারস্পরিক সম্পর্ক / কোভেরিয়েন্স ম্যাট্রিক্সের অফ-ডায়াগোনাল অংশের সামগ্রিক ফিটার হিসাবে , পিসিএ - যখন কোনও জনসংখ্যার থেকে একটি নমুনা ম্যাট্রিক্স বিশ্লেষণ করার জন্য প্রয়োগ করা হয় - ফ্যাক্টর বিশ্লেষণের পক্ষে মোটামুটি ভাল বিকল্প হতে পারে। এটি ঘটে যখন ভেরিয়েবলের অনুপাতের সংখ্যা / প্রত্যাশিত উপাদানগুলির সংখ্যা যথেষ্ট বড় হয়। (অনুপাতের উপকারী প্রভাবের জ্যামিতিক কারণটি নীচের পাদটীকাগুলি in ব্যাখ্যা করা হয়েছে more) আরও বেশি কারণের সাথে অনুপাত কেবল কয়েকটি কারণের চেয়ে কম হতে পারে। তীক্ষ্ণ ফ্যাক্টর কাঠামোর উপস্থিতি (জনসাধারণের মধ্যে সহজ কাঠামো বিদ্যমান) এফএর মানের দিকে যেতে পিসিএকে বাধা দেয়।1

পিসিএর সামগ্রিক ফিটের ক্ষমতার উপর তীক্ষ্ণ ফ্যাক্টর কাঠামোর প্রভাব ততক্ষণ স্পষ্ট হয় যতক্ষণ না অবশিষ্টাংশ "জনসংখ্যার বিয়োগ পুনরুত্পাদন নমুনা" বিবেচিত হয়। সুতরাং যেহেতু এটি একটি সিমুলেশন অধ্যয়ন সেটিংয়ের বাইরে এটি সনাক্ত করতে মিস করতে পারে - একটি নমুনার পর্যবেক্ষণ গবেষণায় আমাদের এই গুরুত্বপূর্ণ অবশিষ্টাংশগুলিতে অ্যাক্সেস নেই।

ফ্যাক্টর বিশ্লেষণের বিপরীতে, পিসিএ হ'ল শূন্য থেকে দূরে থাকা জনসংখ্যার পারস্পরিক সম্পর্ক (বা সমবায়) এর বিশালতার এক (ইতিবাচক) পক্ষপাতদায়ক অনুমানকারী। পিসিএর পক্ষপাতদুষ্টতা অবশ্য হ্রাস পায় কারণ ভেরিয়েবলের অনুপাত সংখ্যা / প্রত্যাশিত কারণগুলির সংখ্যা বৃদ্ধি পায়। Biasedness এছাড়াও হ্রাস পায় যেমন জনসংখ্যা কারণের সংখ্যা বৃদ্ধি, কিন্তু এই আধুনিক প্রবণতা একটি ধারালো ফ্যাক্টর গঠন বর্তমান অধীনে বাধাগ্রস্ত হয়।

আমি মন্তব্য করব যে পিসিএ ফিট ফিট পক্ষপাতিত্ব এবং এর উপর তীক্ষ্ণ কাঠামোর প্রভাব অবশিষ্টাংশগুলিকে "নমুনা বিয়োগ পুনরুত্পাদন করা নমুনা" বিবেচনা করেও উদ্ঘাটন করা যেতে পারে; আমি কেবল এ জাতীয় ফলাফল প্রদর্শন করা বাদ দিয়েছি কারণ তারা নতুন ইমপ্রেশনটি যোগ করবে না বলে মনে হয়।

আমার খুব অস্থায়ী, বিস্তৃত পরামর্শটি হতে পারে সাধারণত কারণগুলির জন্য এফএ-এর পরিবর্তে পিসিএ ব্যবহার করা থেকে বিরত থাকুন (অর্থাত্ জনসংখ্যায় প্রত্যাশিত 10 বা কম কারণের সাথে) ফ্যাক্টর অ্যানালিটিক উদ্দেশ্য যদি না থাকে তবে আপনি যদি কারণগুলির চেয়ে 10+ গুণ বেশি পরিবর্তনশীল না হন। এবং সংক্ষিপ্ততরগুলি হ'ল প্রয়োজনীয় অনুপাত factors আমি এফএ স্থানে পিসিএ ব্যবহার না করার পরামর্শ আরো হবে এ সব যখনই সুপ্রতিষ্ঠিত, ধারালো ফ্যাক্টর গঠন সাথে ডেটা বিশ্লেষণ করা হয় - যেমন যখন ফ্যাক্টর বিশ্লেষণ যাচাই করতে সম্পন্ন করা হয় হিসাবে বিকশিত অথবা ইতিমধ্যেই স্পষ্টভাবে নির্মান / দাঁড়িপাল্লা সঙ্গে মনস্তাত্ত্বিক পরীক্ষা বা প্রশ্নাবলী চালু হচ্ছে । পিসিএ একটি সাইকোমেট্রিক যন্ত্রের জন্য প্রাথমিক, প্রাথমিক নির্বাচনের সরঞ্জাম হিসাবে ব্যবহৃত হতে পারে be

অধ্যয়নের সীমাবদ্ধতা । 1) আমি কেবল পিএএফ পদ্ধতিটি ফ্যাক্টর আহরণের জন্য ব্যবহার করেছি। 2) নমুনা আকার স্থির করা হয়েছিল (200)। 3) সাধারণ জনসংখ্যার নমুনা ম্যাট্রিকগুলির নমুনা গ্রহণ করা হয়েছিল। 4) তীক্ষ্ণ কাঠামোর জন্য, প্রতি গুণক হিসাবে মডেলের সমান সংখ্যক ভেরিয়েবল ছিল। 5) জনসংখ্যার ফ্যাক্টর লোডগুলি তৈরি করা আমি তাদের প্রায় ইউনিফর্ম (ধারালো কাঠামোর জন্য - ট্রায়োমডাল, অর্থাৎ 3-পিস ইউনিফর্ম) বিতরণ থেকে ধার করেছিলাম। )) এই তাত্ক্ষণিক পরীক্ষায় অবশ্যই অবশ্যই অন্য কোথাও তদারকি হতে পারে।


পাদটীকাপিসিএ এফএ-এর ফলাফলগুলি নকল করে এবং পারস্পরিক সম্পর্কের সমতুল্য ফিটার হয়ে উঠবে - যেমন এখানে বলা হয়েছে - মডেলের ত্রুটি ভেরিয়েবলগুলি, যাকে অনন্য কারণ বলা হয় , নিরবিচ্ছিন্ন হয়ে উঠবে। এফএ কামনা তাদের সম্পর্কহীন করতে, কিন্তু পিসিএ না, তারা পারে না ঘটতে পিসিএ মধ্যে সম্পর্কহীন হবে। এটি দেখা দিতে পারে তখন প্রধান শর্তটি যখন সাধারণ কারণগুলির সংখ্যার প্রতি উপাদানগুলির সংখ্যা (উপাদানগুলি সাধারণ কারণ হিসাবে রাখা হয়) বড় হয়।1

নিম্নলিখিত ছবিগুলি বিবেচনা করুন (যদি আপনার সেগুলি কীভাবে বোঝার দরকার হয় তবে যদি প্রথমে আপনার প্রয়োজন হয় তবে দয়া করে এই উত্তরটি পড়ুন ):

এখানে চিত্র বর্ণনা লিখুন

কয়েকটি mসাধারণ কারণের সাথে সফলভাবে পারস্পরিক সম্পর্ক পুনরুদ্ধার করতে সক্ষম হওয়ার জন্য ফ্যাক্টর বিশ্লেষণের প্রয়োজনীয়তা অনুসারে , ম্যানিফেস্ট ভেরিয়েবল এর পরিসংখ্যানগতভাবে স্বতন্ত্র অংশগুলিকে বৈশিষ্ট্যযুক্ত অনন্য কারণগুলি , অবশ্যই অসংযুক্ত হতে হবে। যখন পিসিএ ব্যবহার করা হয়, গুলি শুয়ে থাকতে এর subspace -space দ্বারা দৃশ্যও গুলি কারণ পিসিএ নেই বিশ্লেষণ ভেরিয়েবল স্থান ছেড়ে। সুতরাং - বাম ছবিটি দেখুন - এর সাথে (মূল উপাদান হ'ল ফ্যাক্টর) এবং ( , ) বিশ্লেষণ করা, অনন্য উপাদানগুলি ,এক্স ইউ এক্স পি 1 এক্স 1 এক্স 2 ইউ 1 ইউ 2 আর = - 1UpXp Up-mpXm=1P1p=2X1X2U1U2বাধ্যতামূলকভাবে দ্বিতীয় দ্বিতীয় উপাদান (বিশ্লেষণের ত্রুটি হিসাবে পরিবেশন করা) উপর সুপারমোজ করা। ফলস্বরূপ তাদের সাথে সম্পর্কযুক্ত হতে হবে । (ছবিটিতে, ভেক্টরগুলির মধ্যে কোণগুলির সমান কোষীয় সম্পর্কগুলি সংযুক্ত করে)r=1

তবে আপনি যদি আরও একটি পরিবর্তনশীল ( ) যোগ করেন তবে ডান পিক করুন এবং এখনও একটি জনসংযোগ উত্তোলন করুন। সাধারণ উপাদান হিসাবে উপাদান, তিনটি একটি প্লেনে শুয়ে থাকতে হবে (বাকি দুটি জন উপাদান দ্বারা সংজ্ঞায়িত।)। তিনটি তীর এমনভাবে একটি বিমান বিস্তৃত করতে পারে যেগুলির মধ্যে কোণগুলি 180 ডিগ্রির চেয়ে কম হয়। সেখানে কোণগুলির জন্য স্বাধীনতার উদয় হয়। একটি সম্ভাব্য নির্দিষ্ট ক্ষেত্রে হিসাবে, কোণ পারেন সমান 120 ডিগ্রী সম্পর্কে হও। এটি ইতিমধ্যে 90 ডিগ্রি থেকে খুব বেশি দূরে নয়, এটি নিরঙ্কুশতা থেকে। এই পিক দেখানো পরিস্থিতি। ইউX3U

আমরা ৪ র্থ ভেরিয়েবল যুক্ত করার সাথে সাথে 4 এস 3 ডি স্প্যান করবে। 5, 5 থেকে 4 ডি স্প্যান ইত্যাদির সাথে এক সাথে 90 ডিগ্রি কাছাকাছি পৌঁছতে একই সাথে প্রচুর কোণগুলির ঘর প্রসারিত হবে। যার অর্থ এই যে পিসিএর সাথে এফএ-র কাছে যোগাযোগের ক্ষেত্রে ম্যাট্রিক্সের অফ-ডায়াগোনাল ত্রিভুজগুলি ফিট করার ক্ষমতা বাড়ানোর ঘরটিও প্রসারিত হবে।U

তবে সত্য এফএ সাধারণত ছোট অনুপাতের মধ্যে "পার্থক্যের সংখ্যা / কারণগুলির সংখ্যা" এর সাথেও সম্পর্কগুলি পুনরুদ্ধার করতে সক্ষম হয় কারণ এখানে বর্ণিত (এবং ২ য় চিত্র দেখুন) ফ্যাক্টর বিশ্লেষণ সমস্ত ফ্যাক্টর ভেক্টরকে (সাধারণ ফ্যাক্টরগুলি) এবং অনন্যকে মঞ্জুরি দেয় বেশী) ভেরিয়েবলের স্পেসে থাকা থেকে বিচ্যুত হওয়া। সুতরাং কেবলমাত্র 2 ভেরিয়েবল এবং একটি ফ্যাক্টর সহ এর অরথোগোনালটির জন্য জায়গা রয়েছে ।এক্সUX

উপরের ছবিগুলি পিসিএ কেন পারস্পরিক সম্পর্ককে বেশি বিবেচনা করে তা স্পষ্ট ধারণা দেয় । বাম মাংসখণ্ডের, উদাহরণস্বরূপ, উপর , যেখানে s এর অনুমান হয় উপর গুলি (এর loadings ) এবং s এর লেন্থ হয় গুলি (এর loadings )। কিন্তু যে পারস্পরিক সম্পর্ক যেমন দ্বারা পুনর্নির্মিত একা শুধু সমান , অর্থাত্ বড় চেয়ে ।এক্স পি 1 পি 1ইউ পি 2 পি 1 1 2 আর এক্স 1 এক্স 2rX1X2=a1a2u1u2aXP1P1uUP2P1a1a2rX1X2


1
আমি আপনার পিসিএ / এফএ / সিসিএ আঁকাগুলি পছন্দ করি, তাই খুশি +1। এই চিন্তাভাবনাটি এমন একটি জিনিস যা আমি পুরোপুরি অভ্যস্ত নই, সুতরাং এটি আমার জানা গণিতে মানচিত্রের জন্য কিছু চিন্তাভাবনা প্রয়োজন ... তবে, এখানে লক্ষ্য করুন (পাশাপাশি আপনার অন্যান্য বিখ্যাত এফএ-বনাম-পিসিএ উত্তর সহ) অঙ্কন) আপনার কেবল দুটি ভেরিয়েবল রয়েছে। যেমনটি আমি আমার উত্তরে বলেছি, যখন মাত্র দুটি পরিবর্তনশীল রয়েছে, এফএতে একটি ফ্যাক্টর পুরোপুরি পুরোপুরি, 100%, প্রবর্তন করার পক্ষে যথেষ্ট (কারণ কোভরিয়েন্স ম্যাট্রিক্সে কেবল মাত্র এক ডিগ্রি স্বাধীনতা রয়েছে, ত্রিভুজ ছাড়াও) একটি পিসি সাধারণত এটি করতে পারে না। সুতরাং আমার উত্তরের সাথে কোনও দ্বন্দ্ব নেই।
অ্যামিবা

হুম, আমি আশা করি আমি এফএ এবং পিসিএ দ্বারা পৃথক প্রজনন বিন্দু ভুল বুঝতে পারিনি। এখানে আমার অবস্থানটির সংক্ষিপ্ত বিবরণ, আমি এটিকে অন্য উত্তরে রেখেছি
গটফ্রিড হেলস

2
আপনার আপডেটের জবাব (যা আমার আপডেটের উত্তর 2): আপনি এখানে যা লিখেছেন তার সাথে আমি সম্পূর্ণ একমত! পিসিএ লোডিংগুলি পুরো কোভেরিয়েন্স ম্যাট্রিক্সের (তির্যক সহ) সেরা সর্বাধিক সীমাবদ্ধতা, তবে এটির বাহুবিচ্ছিন্ন অংশটির জন্য সর্বোত্তম নিম্ন-র‌্যাঙ্কের সমীকরণের প্রয়োজন হয় না; এই পরবর্তী অনুমানটি ফ্যাক্টর বিশ্লেষণ দ্বারা দেওয়া হয়। মনে হচ্ছে আমরা এখানে পারস্পরিক চুক্তিতে পৌঁছেছি; অথবা আপনি কি এখনও অনুভব করেন যে আমার উত্তরের কিছু অংশ আপনার চিন্তার বিরোধিতা করছে?
অ্যামিবা

1
@ এনটিএনএফএনএস: আমি আমাদের আলোচনার উপরোক্ত বিষয়গুলি আবার পড়ি এবং আমাকে আমার মূল উত্তরে আমি যে এক পয়েন্টে ফিরে এসেছি তা ফিরে আসতে দিন। পিসিএ পুরো কোভারিয়েন্স ম্যাট্রিক্সের সমান লোডিংগুলি সন্ধান করার চেষ্টা করে; এফএ এটির বহিরাগত অংশটি লোডিংগুলি সন্ধান করার চেষ্টা করে। তবে ত্রৈমাসিকের বৃহত্তর, কোভেরিয়েন্স ম্যাট্রিক্সের ছোট অংশটি তার তির্যক দ্বারা নেওয়া হয়, যার অর্থ বৃহত মাত্রায় পিসিএ এটির অফ-ডায়াগোনাল অংশ সম্পর্কে বেশিরভাগ যত্ন নিতে শুরু করে (কারণ তির্যক অংশটি এত ছোট হয়ে যায়)। সুতরাং সাধারণভাবে, মাত্রিক আকারটি যত বড় হবে, পিসিএ এফএ-এর আরও কাছাকাছি হয়ে যায়। তুমি কি একমত?
অ্যামিবা

1
পিং জন্য ধন্যবাদ, ttnphns। বাহ, এটি আকর্ষণীয় দেখায়। আমি এটি মনোযোগ সহকারে পড়ব তবে এখনই নয়; আমি এটি জানুয়ারী পর্যন্ত স্থগিত হতে পারে। আমি একবার এটি পড়ার পরে এখানে মন্তব্য করব। যাইহোক, আমি এই থ্রেডে ফিরে আসার এবং আমার উত্তরটিকে আরও "মিলিত" করার জন্য কিছুটা সম্পাদনা করার বিষয়ে (আমার মাথার পিছনে) ভাবছিলাম। এটি করার একটি ভাল সুযোগ হতে পারে (তবে আপনি প্রথমে যা লিখেছিলেন তা আমাকে পড়তে দিন)। Наступающим наступающим!
অ্যামিবা

4

(এটি সত্যিই @ টিএনএনফেন্সের দ্বিতীয় উত্তরের একটি মন্তব্য)
যতক্ষণ না পিসি এবং এফএ দ্বারা ত্রুটি অনুমান করে প্রচলিত বিভিন্ন প্রকারের প্রজনন সম্পর্কিত, আমি কেবল দুটি প্রবন্ধে ঘটে যাওয়া ভার্চিয়ানের লোডিং / সংযোজনগুলি মুদ্রণ করেছি simply ; উদাহরণস্বরূপ আমি 2 ভেরিয়েবল নিয়েছি।

আমরা দুটি প্রচলিত আইটেমগুলির একটি সাধারণ ফ্যাক্টর এবং আইটেম স্পেসিফিক ফ্যাক্টর হিসাবে ধরে নিই। এখানে সেই ফ্যাক্টর-লোডিংসমেট্রিক্স:

  L_fa: 
          f1       f2      f3         
  X1:   0.894    0.447     .             
  X1:   0.894     .       0.447              

এর মাধ্যমে পারস্পরিক সম্পর্ক মেট্রিক্স

  C:
         X1       X2 
  X1:   1.000   0.800
  X2:   0.800   1.000

যদি আমরা লোডিংস-ম্যাট্রিক্স এল_ফায়ার দিকে তাকান এবং এফএ-তে এটি যথারীতি ব্যাখ্যা করি যে f2 এবং f3 ত্রুটি শর্তাবলী / আইটেমসামান্য ত্রুটি, আমরা সিটিকে ত্রুটি ছাড়াই পুনরুত্পাদন করি, প্রাপ্তি

 C1_Fa 
        X1       X2 
 X1:  0.800   0.800
 X2:  0.800   0.800

সুতরাং আমরা অফ-ডায়াগোনাল উপাদানটি পুরোপুরি পুনরুত্পাদন করেছি, যা সমবায় (এবং তির্যক হ্রাস করা হয়েছে) is

আমরা যদি পিসিএ-সলিউশনটির দিকে লক্ষ্য করি (সাধারণ আবর্তনের মাধ্যমেও করা যায়) আমরা একই সম্পর্ক-ম্যাট্রিক্স থেকে দুটি কারণ পাই:

 L_pca : 
         f1        f2
 X1:   0.949      -0.316
 X2:   0.949       0.316

ত্রুটি হিসাবে দ্বিতীয় ফ্যাক্টর ধরে ধরে আমরা সমবায়ীদের পুনরুত্পাদন ম্যাট্রিক্স পাই

  C1_PC : 
        X1      X2
 X1:   0.900   0.900
 X2:   0.900   0.900

যেখানে আমরা প্রকৃত পারস্পরিক সম্পর্ককে বেশি গুরুত্ব দিয়েছি । এটি কারণ যে আমরা দ্বিতীয় ফ্যাক্টর = ত্রুটিতে সঠিক নেতিবাচক আংশিক কোভেরিয়েন্স উপেক্ষা করেছি । দ্রষ্টব্য যে পিপিসিএ প্রথম উদাহরণের সাথে অভিন্ন হবে।

আরও আইটেমের সাথে এটি এত স্পষ্ট নয় তবে এখনও একটি সহজাত প্রভাব। সুতরাং মিনআরস-এক্সট্রাকশন (বা-বর্ধন?) এর ধারণাটিও রয়েছে এবং আমি সর্বাধিক নির্ধারক নিষ্কাশন এবং এর মতো কিছুও দেখেছি ...


[আপডেট] @ অ্যামিবার প্রশ্ন সম্পর্কে:

আমি "ন্যূনতম অবশিষ্টাংশ" ("মিনআরেস") ধারণাটি বুঝতে পেরেছি - সিএফএ-কম্পিউটেশনের পূর্বের পদ্ধতিগুলির সংক্ষিপ্ত পদ্ধতি হিসাবে ঘূর্ণন, একটি পারস্পরিক সম্পর্ক ম্যাট্রিক্সের অফ-তির্যক উপাদানগুলির সেরা পুনরুত্পাদন অর্জনের জন্য। আমি এটি 80'7 / 90'I তে শিখেছি এবং ফ্যাক্টর-বিশ্লেষণের বিকাশ অনুসরণ করি নি (সাম্প্রতিক বছরগুলিতে আগের মতোই নির্লিপ্ত), সম্ভবত "মাইনরেস" ফ্যাশনের বাইরে।

এটি পিসিএ-সমাধানের সাথে তুলনা করার জন্য : যখন কোনও ইউক্যালিডিয়ান স্পেসে অক্ষ হিসাবে বিবেচনা করা হয় এবং লোডিংগুলি সেই ভেক্টরস্পেসের আইটেমগুলির স্থানাঙ্ক হয় তখন কোনও উপাদানগুলির ঘূর্ণন দ্বারা পিসি-সলিউশন সন্ধান করার কথা ভাবতে পারে।
তারপরে এক জোড়া অক্ষের জন্য x, y এবং x- অক্ষের লোডিংগুলি থেকে যোগফলগুলি গণনা করা হবে y
এর থেকে একটি একটি ঘূর্ণন কোণ খুঁজে পেতে পারে, যার মাধ্যমে আমাদের ঘোরানো উচিত, x on এর উপর ঘোরানো অক্ষগুলিতে সর্বাধিক -বর্গ এবং y ° -axis এর ন্যূনতম (যেখানে লিট বৃত্তটি ঘোরানো অক্ষগুলি নির্দেশ করে) পেতে পারে ।

সমস্ত জোড়া অক্ষের জন্য এটি করা (যেখানে কেবল সর্বদা এক্স-অক্ষটি বাম এবং y- অক্ষটি ডান হয় (সুতরাং 4 টি কারণের জন্য আমাদের কেবল 6 জোড়া আবর্তন রয়েছে) এবং তারপরে পুরো প্রক্রিয়াটি স্থিতিশীল ফলাফলে পুনরাবৃত্তি করুন মূল উপাদানগুলির সমাধান সন্ধানের জন্য তথাকথিত "জ্যাকোবি-পদ্ধতি" উপলব্ধি করে: এটি প্রথম অক্ষটি সনাক্ত করবে যেমন এটি লোডিংয়ের স্কোয়ারের সর্বোচ্চ সম্ভাব্য যোগফল সংগ্রহ করে ("এসএসকিএল") (যার অর্থ এটিও "বৈকল্পিকের" ") বর্তমানের সম্পর্ক সম্পর্কিত কনফিগারেশনের একটি অক্ষরে on

আমি যতদূর বুঝতে পেরেছি , " মাইনআরস " এর এসএসকিএল-এর পরিবর্তে আংশিক পারস্পরিক সম্পর্কের দিকে নজর দেওয়া উচিত; সুতরাং এটি লোডিংয়ের স্কোয়ারগুলি যোগ করতে পারে না (যেমন জ্যাকোবি-পিসি-রোটেশনে হয়েছিল) তবে প্রতিটি ফ্যাক্টারে লোডিংয়ের ক্রস প্রোডাক্টগুলি যোগ করে - প্রতিটি লোডিংয়ের "ক্রস প্রোডাক্ট" (= স্কোয়ার) ব্যতীত নিজেই আইটেম।
এক্স এর জন্য এবং y- অক্ষের মানদণ্ডগুলি গণনা করার পরে এটি পুনরাবৃত্ত জ্যাকোবি-ঘূর্ণনের জন্য বর্ণিত একইভাবে এগিয়ে যায়।

যেহেতু ঘূর্ণন-মাপদটি সর্বাধিক-এসএসকিএল-মাপদণ্ডের থেকে সংখ্যাগতভাবে পৃথক, ফলাফল / ঘূর্ণমানের অবস্থানটি পিসিএ-দ্রবণ থেকে পৃথক হবে। যদি এটি রূপান্তরিত হয় তবে এর পরিবর্তে প্রথম ফ্যাক্টরের এক অক্ষের উপর সর্বোচ্চ সম্ভাব্য আংশিক পারস্পরিক সম্পর্ক সরবরাহ করা উচিত, পরবর্তী ফ্যাক্টরের উপর পরবর্তী সর্বাধিক পারস্পরিক সম্পর্ক এবং আরও অনেক কিছু। ধারণাটি মনে হয়, তারপরে এতগুলি অক্ষ / উপাদান অনুমান করা যে অবশিষ্ট / অবশিষ্ট অংশ আংশিক সমবায় প্রান্তিক হয়ে যায়।

(দ্রষ্টব্য, আমি কেবল কীভাবে বিষয়গুলির ব্যাখ্যা করেছি, আমি সেই প্রক্রিয়াটি স্পষ্টভাবে লিখিতভাবে দেখিনি (বা এই মুহুর্তে মনে করতে পারে না); ম্যাথওয়ার্ল্ডের একটি বিবরণ অ্যামিবার জবাবের মতো সূত্রগুলির পরিবর্তে এটি প্রকাশ করে বলে মনে হয় এবং) সম্ভবত আরও প্রামাণিক। সবেমাত্র আর-প্রকল্পের ডকুমেন্টেশনে অন্য একটি রেফারেন্স খুঁজে পেয়েছে এবং গুগল-বুকের মাধ্যমে উপলব্ধ ফ্যাক্টরানালাইসিস সম্পর্কিত গর্সুচ বইতে 116 পৃষ্ঠাতে সম্ভবত খুব ভাল রেফারেন্স পেয়েছে )


আপনি আপনার শেষ বাক্যে যা উল্লেখ করছেন তা ব্যাখ্যা করতে পারেন? "মিনিআরস" বা "সর্বাধিক নির্ধারক" নিষ্কাশন কী এবং আপনি কী লিখেছিলেন তার সাথে এটি কীভাবে সম্পর্কিত?
অ্যামিবা

"মাইনআরস" হ'ল কিছু নিষ্কাশন বা ঘূর্ণন পদ্ধতি যা আমি বহু বছর আগে এস মুলাইক বা কে। Laberla এর ফ্যাক্টরোনালাইসিসের একক গ্রাফিকগুলিতে এসেছি across এটি অবশিষ্ট অফডিজোনাল উপাদানগুলিকে কমাতে ফোকাস করে। কারণ এটি অন্যান্য অনেক পদ্ধতির প্রেক্ষাপটে স্পষ্টভাবে উল্লেখ করা হয়েছিল বলে আমি ধরে নিয়েছিলাম যে এটি সম্ভবত সম্ভাব্য - সিএফএ থেকে কিছুটা আলাদা - সেই যুগের বাস্তবায়ন। আমি এর যুক্তিটিকে একটি ঘূর্ণন-মাপদণ্ড হিসাবে প্রয়োগ করার চেষ্টা করেছি তবে কোনওরকম সিদ্ধান্তগত ফলাফল হয়নি result আমি আরও প্রত্যাশা করেছিলাম যে "নির্ধারককে সর্বাধিক করে তোলা" এখানে জানা যাবে; আমি 20 বছর আগে আমি কী বিবরণ পেয়েছি তা দেখতে পাচ্ছি ...
গটফ্রাইড হেলস

আহ, আমি উভয় অংশ পেয়েছি। "মিনারেস" -ড্রেশনালটির ঘূর্ণন-মানদণ্ডের একটি বিবরণ go.helms-net.de/stat/fa/minres.htm এ রয়েছে । "সর্বাধিক নির্ধারক" হ'ল গাণিতিক মডেল যা কিছু সংবাদদাতা জেফ্রে ওভেন কাটজ এর নিষ্কাশন / ঘূর্ণন-পদ্ধতির অধীনে যাকে এটিকে "ওব্লিসিম" নামে অভিহিত করেছিলেন এবং সম্ভবত আমাদের সংবাদপত্রের পরে এটি বিকশিত হয়েছিল। ততক্ষণে এটি আমার মাথার উপর দিয়ে গেছে; যাইহোক আমি পদ্ধতিটি বোঝার চেষ্টা করেছি এবং এটি একটি ওয়ার্ডফাইলে ফর্ম্যাট করে পুনর্গঠিত করেছি। Go.helms-net.de/stat/fa/oblisim.zip দেখুন "ওবলিসিম" এর জন্য গুগল একটি নিউজগ্রুপ-এন্ট্রি দিয়েছে যা দেখে মনে হয় এটি এটি চালু করেছে।
গটফ্রাইড হেলস

@ অ্যামিবা: সম্ভবত এখানে প্রথম এন্ট্রি রয়েছে, যেখানে জেফ কাটজ তার পদ্ধতিগুলির সেটটি চালু করেছিলেন: mathforum.org/kb/message.jspa?messageID=1516627 এটি 1998 সালের, সুতরাং প্রায় 20 বছর আগে আমার ধারণাটি কিছুটা অসম্পূর্ণ ছিল ...
গটফ্রিড হেলমস

2

আমার দৃষ্টিতে, "পিসিএ" এবং "এফএ" এর ধারণাগুলি "অনুসন্ধানী", "নিশ্চিতকরণকারী" বা সম্ভবত "অনুমানমূলক" ধারণা থেকে আলাদা মাত্রায় রয়েছে। সুতরাং দুটি গাণিতিক / পরিসংখ্যান পদ্ধতির প্রতিটি তিনটি পদ্ধতির একটির সাথে প্রয়োগ করা যেতে পারে।

উদাহরণস্বরূপ, হাইপোথিসিটি কেন করা উচিত তা সংবেদনশীল হওয়া উচিত, আমার ডেটাতে একটি সাধারণ ফ্যাক্টর এবং মূল উপাদানগুলির একটি সেটও রয়েছে (কারণ আমার বৈদ্যুতিন যন্ত্রের সাথে আমার পরীক্ষা আমাকে প্রায় ত্রুটিযুক্ত ডেটা দিয়েছে) এবং আমি আমার হাইপোথিস পরীক্ষা করি, যে পরবর্তী কারণগুলির ইগন্যালিয়াসগুলি 75% অনুপাতের সাথে ঘটে? এটি তখন নিশ্চিতকরণ কাঠামোর পিসিএ।

অন্যদিকে, এটি হাস্যকর বলে মনে হয় যে আমাদের গবেষণা দলে আমরা শিষ্যদের মধ্যে সহিংসতা পরিমাপ এবং 3 টি মূল আচরণ (শারীরিক আগ্রাসন, হতাশা, কর্তৃপক্ষ / পিতামাতার সহায়তার সন্ধান) এবং সম্পর্কিত প্রশ্নগুলি রাখার জন্য একটি আইটেম ব্যাটারি তৈরি করি work সেই ব্যাটারিতে ... এবং "এক্সপ্লোরেটরলি" আমাদের কয়টি উপাদান রয়েছে তা দেখানোর চেষ্টা করুন ... পরিবর্তে দেখার জন্য, আমাদের স্কেলটিতে কতটা ভালভাবে সনাক্তযোগ্য কারণ রয়েছে (অবহেলাযোগ্য আইটেমফেসিফিক এবং সম্ভবত এমনকি উত্সর্গীয়ভাবে সম্পর্কযুক্ত ত্রুটিও)। এবং তারপরে, যখন আমি নিশ্চিত হয়েছি যে সত্যই আমাদের আইটেম-ব্যাটারি উদ্দেশ্যটি কাজ করে, আমরা অনুমানটি পরীক্ষা করতে পারি যে, ছোট বাচ্চাদের ক্লাসে "অনুসন্ধানে সাহায্য দ্বারা কর্তৃপক্ষের" নির্দেশক ফ্যাক্টরের উপরের লোডগুলি বেশি হয় পুরানো ছাত্রদের চেয়ে হুঁ, আবার নিশ্চিত ...

আর অনুসন্ধানী? আমার 1960 সাল থেকে মাইক্রোবায়োলজি সম্পর্কিত গবেষণা থেকে নেওয়া পদক্ষেপের একটি সেট রয়েছে এবং তাদের তেমন তত্ত্ব ছিল না তবে তারা যা পরিচালনা করতে পারে তার সবকিছুর নমুনা তৈরি করেছিলেন কারণ তাদের গবেষণার ক্ষেত্রটি খুব ছোট ছিল, এবং আমি প্রভাবশালী কাঠামোগত পুনরায় অনুসন্ধান করেছি, ধরে নিলাম (উদাহরণস্বরূপ) , যে সমস্ত ত্রুটিগুলি ব্যবহৃত মাইক্রোস্কোপের অপটিক্যাল যথার্থতার কারণে একই পরিমাণে রয়েছে (পিপিসিএ-আনস্যাটজ যেমন আমি শিখেছি)। তারপরে আমি এফএর জন্য পরিসংখ্যানগত (এবং পরবর্তীকালে গাণিতিক) মডেলটি ব্যবহার করি তবে এই ক্ষেত্রে শোষক পদ্ধতিতে।

এটি অন্তত আমি কীভাবে শর্তগুলি বুঝতে পারি।
সম্ভবত আমি এখানে পুরোপুরি ভুল ট্র্যাকের উপরে আছি, তবে আমি এটি ধরে নিই না।


গীত। নব্বইয়ের দশকে আমি একটি ছোট ইন্টারেক্টিভ প্রোগ্রাম লিখেছিলাম পিসিএ এবং ফ্যাক্টোরানালাইসিসের পদ্ধতিটি নীচে নীচে নেওয়ার জন্য explore এটি টার্বো-পাস্কেলে লেখা হয়েছিল, এটি কেবলমাত্র ডস-উইন্ডোতে চালানো যেতে পারে (উইন 7 এর অধীনে "ডস-বাক্স") তবে এটিতে খুব সুন্দর আবেদন রয়েছে: ইন্টারেক্টিভভাবে উপাদানগুলি অন্তর্ভুক্ত করা যায় বা না করা যায়, তারপরে ঘোরান, পৃথক আইটেম বৈশিষ্ট্যযুক্ত ত্রুটি- ভেরিয়েন্স (এসএমসি-মাপদণ্ড বা সমতুল্য রূপ-মাপদণ্ড (পিপিসিএ?)) অনুসারে, কাইজার-বিকল্পটি চালু এবং বন্ধ করা হয়, সমবায়িকাগুলির ব্যবহার চালু এবং বন্ধ - কেবলমাত্র যখন ফ্যাক্টর লোডিংসমেট্রিক্স স্প্রেডশিটের মতো দৃশ্যমান হয় এবং বেসিক বিভিন্ন ঘূর্ণন-পদ্ধতির জন্য ঘোরানো যেতে পারে।
এটি অত্যন্ত পরিশীলিত নয়: উদাহরণস্বরূপ কোনও চিস্কোয়ার-পরীক্ষা নয়, কেবল অভ্যন্তরীণ গাণিতিক যান্ত্রিকতত্ত্বের স্ব-শিক্ষার উদ্দেশ্যে। এটিতে একটি "ডেমো-মোড" রয়েছে, যেখানে প্রোগ্রামটি নিজেই চালিত হয়, স্ক্রিনে ব্যাখ্যামূলক মন্তব্য দেখায় এবং কীবোর্ড-ইনপুটগুলি সিমুলেট করে, যা ব্যবহারকারী সাধারণত করবেন।
যে কেউ এর সাথে স্বয়স্বাস্থ্য বা শিক্ষকতা করতে আগ্রহী সে আমার ছোট সফ্টওয়্যার-পৃষ্ঠা থেকে এটি ডাউনলোড করতে পারে- (আর)। জিপ ডস-বাক্সের মাধ্যমে অ্যাক্সেসযোগ্য ডিরেক্টরিতে জিপের মধ্যে ফাইলগুলি প্রসারিত করুন এবং "ডেমোল.ব্যাট" ইন কল করুন "ডেমোল" এর তৃতীয় অংশ আমি একটি বিক্ষোভ করেছি যে কীভাবে প্রাথমিকভাবে পিসিএ-সমাধান থেকে আবর্তনের মাধ্যমে আইটেম স্পাইফ ত্রুটিগুলি মডেল করা যায় ...


আপনার প্রোগ্রামের একটি আর পোর্ট আকর্ষণীয় হবে। যাইহোক, আমার প্রথম প্রোগ্রামিং ভাষা (এবং অন্যতম প্রিয়) ছিল [টার্বো] পাস্কাল। এমনকি আমি আমার বিএস ডিপ্লোমা কাজের জন্য সফ্টওয়্যার লেখার জন্য এটি ব্যবহার করেছি। তারপরে, কিছু সময় পরে, আমি অন্যান্য ভাষা এবং সিস্টেমের সাথে কিছুক্ষণের জন্য ডেলফিকে ব্যবহার করেছি। :-)
আলেকজান্ডার ব্লেখ

1
@ আলেকসান্দ্র: ঠিক আছে, এ জাতীয় আমদানি অবশ্যই একটি দুর্দান্ত ধারণা হবে; তবে ... ইতিমধ্যে আমি স্থানীয় ট্র্যাফিক সিস্টেমের জন্য "সিনিয়রদের টিকিট" পেয়েছি, এবং যদিও এখনও পুনরায় ক্লান্ত হয়নি, আমি প্রোগ্রামিং থেকে কিছুটা ক্লান্ত হয়ে পড়েছি ... আমি মনে করি টার্বো পাস্কালের "ডেলফি" একটি প্রাকৃতিক প্রতিস্থাপন ছিল ; আমি অনেকটা উন্নত করেছিলাম ইনসাইড- [র] ডেল্ফি 6 ব্যবহার করে একটি ম্যাট্রিক্স-ক্যালকুলেটর "ম্যাটমেট" অবধি যেখানে আমি সাহায্যকারী-সরঞ্জাম হিসাবে ইনসাইড- [র] অন্তর্ভুক্ত করেছি। যাইহোক, কখনও কখনও আমি মনে করি, পয়েন্ট & ইনসাইড- [r] এ ক্লিক করার সাথে এটি দুর্দান্ত বৈশিষ্ট্যটিও পুনরায় উপলব্ধি করা উচিত - কোনও অত্যাধুনিক স্ক্রিপ্ট- বা দোভাষী অনুবাদ ছাড়াও ...
গটফ্রিড হেলস

2

@ অমিবাসের দীর্ঘ (এবং সত্যই দুর্দান্ত) উত্তরের জন্য একটি অতিরিক্ত মন্তব্য অন্তরঙ্গতার চরিত্রটি সম্পর্কে । Ψ

আপনার প্রাথমিক বিবৃতিতে আপনার কাছে তিনটি : পিসিএর জন্য , পিপিএর জন্য ig এবং এফএর জন্য আপনি রেখে গেছেন অনির্দিষ্ট। ΨΨ=0Ψ=σ2IΨ

তবে এটি উল্লেখ করা উচিত, বিভিন্ন সম্ভাব্য অসীম সংখ্যা রয়েছে (অবশ্যই সীমাবদ্ধ) তবে ঠিক এমন একক যা ফ্যাক্টর ম্যাট্রিক্সের র‌্যাঙ্ককে হ্রাস করে। আসুন এটিকে কল করুন for এর স্ট্যান্ডার্ড (অটোমেটিকাল) অনুমানটি এসএমসির উপর ভিত্তি করে তির্যক হয়, সুতরাং আসুন এটিকে হিসাবে লিখি (এবং এমনকি কিছু সফ্টওয়্যার (মনে হয়) থেকে নীচে অনুকূলকরণের চেষ্টা করে না যখন (সাধারণত) হেইউড-কেসগুলি / নেতিবাচক-নির্দিষ্টতা রোধ করার জন্য প্রয়োজনীয়)। এবং তদুপরি, এমনকি এমন optimΨΨoptΨstdΨstd=α2Dsmcα1α<1 α2অবশিষ্ট covariances ন্যূনতম র্যাঙ্ক গ্যারান্টি না, এইভাবে সাধারণত আমরা এই আছে না সমান: সাধারণভাবে । সত্যিই করা একটি খুব কঠিন খেলা, এবং যতদূর আমি জানি (তবে এটি এত বেশি "দূরে" হিসাবে নেই, বলুন, 20 বছর আগে যখন আমি বইগুলির সাথে আরও বেশি জড়িত ছিলাম এবং এখনও) এটি এখনও রয়েছে একটি অমীমাংসিত সমস্যা ΨstdΨopt
Ψopt


আচ্ছা এই প্রতিফলিত আদর্শ, গাণিতিক সমস্যা পাশ, এবং মধ্যে আমার পার্থক্য এবং এছাড়াও আসলে ছোট হতে পারে। আরও সাধারণ সতর্কতা হ'ল, এটি সম্পূর্ণ ফ্যাক্টেরাইজেশন যন্ত্রপাতিটিকে এই দৃষ্টিভঙ্গি থেকে আলোচনা করে যে আমি কেবল আমার নমুনাটি অধ্যয়ন করি বা পুরো জনসংখ্যার ডেটা রাখি ; আনুপাতিক পরিসংখ্যানের মডেল হিসাবে, যেখানে আমি জনসংখ্যার উপর একটি অপূর্ণ নমুনা অনুমান করি, আমার বৌদ্ধিক সমবায়-এবং এইভাবেও ফ্যাক্টর্যাট্রিক্স কেবলমাত্র একটি অনুমান, এটি কেবল "সত্য" কোভেরিয়েন্সের একটি ছায়া গো - factor সুতরাং এই জাতীয় একটি কাঠামো / মডেল এমনকি আমাদের "ত্রুটি" আদর্শ নয় যে বিবেচনা করা উচিতΨstdΨopt, এবং এইভাবে উত্সর্গীয়ভাবে সম্পর্কযুক্ত হতে পারে। সুতরাং প্রকৃতপক্ষে এই জাতীয় মডেলগুলিতে আমাদের কোনওভাবেই অসম্পর্কিত ত্রুটির আদর্শিক অনুমান ছেড়ে দেওয়া উচিত, এবং এভাবে আমাদের পিছনে এর একটি কঠোর তির্যক রূপ ofΨ


হাই, আমি নিশ্চিত নই যে আমি এখানে আপনার মন্তব্যগুলি পুরোপুরি অনুসরণ করতে পারি। আমি কি সঠিকভাবে বুঝতে পেরেছি যে আপনি ইতিবাচক এমন একটি তির্যক ম্যাট্রিক্সের lowest সবচেয়ে কম সম্ভাব্য র‌্যাঙ্ক (যেখানে কোভ / কর ম্যাট্রিক্স)? আমি মনে করি আকারের সাধারণ এর জন্য এই সর্বনিম্ন সম্ভাব্য র‌্যাঙ্কটি (সম্ভবত বা কিছু) এর চেয়ে খুব ছোট নয় , সুতরাং সন্ধান করা খুব আকর্ষণীয় বলে মনে হয় না। আমি এই ধারণাটি অনুসরণ করেছিলাম যে এফএ একটি প্রদত্ত জন্য এবং ( আকারের) অনুসন্ধান করার চেষ্টা করেΨoptCΨoptCCn×nnn1ΨoptΨWn×kk) হ্রাস করতে। CWWΨ
অ্যামিবা

দুটি পরামিতি যা একে অপরের উপর নির্ভর করে অনুমান করতে সমস্যা সমাধানের পদক্ষেপের ক্রমের ভিত্তিতে ভিউপয়েন্টগুলির পার্থক্য হতে পারে। আমার মন্তব্য আমি বিন্দু দিয়ে শুরু, একটি আছে , যার জন্য অবশিষ্ট র্যাঙ্ক বলে , এর সংক্ষিপ্ত এবং , যদিও এটি হতে পারে আমরা রেখে কিছু সংখ্যক কারণ রয়েছে । যদি আমরা পরে -পজিশনে ঘোরান , ডান থেকে কাটা যে কোনও কারণের কেবলমাত্র ন্যূনতম (আংশিক) কোভেরিয়েন্স সরিয়ে দেয়। ...ΨoptrC=CΨopt||CWrWr||=0kk<rWrr+1k
গটফ্রাইড হেলস

(...) আপনি যদি এর পরিবর্তে দিয়ে শুরু করেন , general সাধারণত কমপক্ষে একটি র‌্যাঙ্ক বেশি থাকে এবং সুতরাং কারণগুলির সংখ্যার । তারপরে ফ্যাক্টরগুলি (পিসি বা মাইনার্সের মতো কিছু মানদণ্ডে আবর্তনের পরেও) ন্যূনতম সম্ভাব্য পরিমাণের সীমাবদ্ধতা সন্ধান করা আপোস্টিমাল হবে। অস্বীকৃতি : এটি এখনও একটি হাইপোথেসি - জন্য খুঁজে পাওয়া মুশকিল , যার কাঠামো স্ব-মনগড়া নয় এবং স্ব-মনগড়া উদাহরণ সহ সমস্ত ক্ষেত্রে কম নির্ভরযোগ্য। ΨstdCstds>rs+1kΨopt
গটফ্রাইড হেলস

ঠিক আছে, আমি বুঝতে পারছি আপনি কী বলছেন। আমার বেশিরভাগ আসল এর জন্য প্রায় এর সমান হবে , অর্থাত্ । । এর পরে যদি কেউ কেবল ঘোরান , তবে এটি সম্ভবত প্রায় সমতুল্য বা উপর পিসিএ করার খুব কাছাকাছি এবং এফএর সাথে মোটেও বিরক্ত করবেন না। C = C - Ψ o p t C r n k W r CCC=CΨoptCrnkWrC
অ্যামিবা

সত্য। ঠিক আছে, আমি ভেবেছিলাম এটিকে সবচেয়ে স্পষ্ট করে তুলতে যেখানে "আদর্শ" কেসটি সন্ধান করতে হবে যেখান থেকে আমরা ব্যবহারিকভাবে তুলনামূলকভাবে কমিয়ে আনতে পারি। <br> এবং এখন পিসিএর পক্ষে আরও বেশি ;-): ত্রুটির মধ্যে উত্সাহজনক পারস্পরিক সম্পর্কের অনুমতি দেওয়া (প্রয়োগের দ্বিতীয় পদ্ধতি / আনুপাতিক পরিসংখ্যানের ক্ষেত্রে) ফলাফলটি আবার পিসি-এক্সট্রাকশন দিয়ে শুরু হওয়া ধরণের একটির নিকটে আসতে দেয়; ...
গটফ্রাইড হেলস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.