স্বাধীন উপাদান বিশ্লেষণ এবং ফ্যাক্টর বিশ্লেষণের মধ্যে সম্পর্ক কী?


67

আমি ইন্ডিপেন্ডেন্ট কম্পোনেন্ট অ্যানালাইসিস (আইসিএ) এ নতুন এবং পদ্ধতিটি সম্পর্কে কেবল প্রাথমিক ধারণা পেয়েছি। আমার কাছে মনে হয় যে আইসিএ একটি ব্যতিক্রম সহ ফ্যাক্টর অ্যানালাইসিস (এফএ) এর অনুরূপ: আইসিএ অনুমান করেছে যে পর্যবেক্ষণ করা এলোমেলো ভেরিয়েবলগুলি স্বাধীন উপাদান / উপাদানগুলির একটি রৈখিক সংমিশ্রণ যা অ গাউশিয়ান যেখানে ক্লাসিকাল এফএ মডেল ধরে নিয়েছে যে পর্যবেক্ষণ করা র্যান্ডম ভেরিয়েবলগুলি সম্পর্কযুক্ত, গাউসিয়ান উপাদান / উপাদানগুলির একটি লিনিয়ার সংমিশ্রণ।

উপরেরটি কি সঠিক?


1
অন্য একটি প্রশ্নের উত্তর ( পিসিএ পুনরাবৃত্তিভাবে সর্বাধিক বৈকল্পিকের দিকনির্দেশগুলি সন্ধান করে; তবে কীভাবে সর্বকেন্দ্রিক বৈকল্পিকতার সাথে একটি সম্পূর্ণ উপগঠন সন্ধান করতে পারে? ) দেখার বিষয় মূল্যবান।
পাইওটর মিগডাল

উত্তর:


72

এখানে চিত্র বর্ণনা লিখুন

এফএ, পিসিএ, এবং আইসিএ, সমস্তই 'সম্পর্কিত', ততক্ষণে এই তিনটিই বুনিয়াদি ভেক্টর খোঁজেন যেগুলির বিরুদ্ধে ডেটা প্রজেক্ট করা হয়, যেমন আপনি সন্নিবেশ-মানদণ্ড-এখানে সর্বাধিকতর করেন। বেসিক ভেক্টরগুলিকে কেবল লিনিয়ার সংমিশ্রণগুলি encapsulating হিসাবে ভাবেন।

উদাহরণস্বরূপ, যাক আপনার ডেটা ম্যাট্রিক্স একটি এক্স ম্যাট্রিক্স ছিল, অর্থাৎ আপনার কাছে দুটি এলোমেলো ভেরিয়েবল এবং প্রতিটি পর্যবেক্ষণ রয়েছে। তারপর আপনি একটি ভিত্তি ভেক্টর পাওয়া বলে দেয় । আপনি যখন প্রথম (প্রথম) সংকেতটি বের করেন, (একে ভেক্টরকে বলুন ), এটি তেমনই করা হয়: 2 এন এন ডাব্লু = [ 0.1 - 4 ] yZ2NNw=[0.14]y

y=wTZ

এর অর্থ হ'ল "আপনার ডেটার প্রথম সারির দ্বারা ০. গুণ করুন এবং আপনার ডেটার দ্বিতীয় সারিতে 4 গুণ বিয়োগ করুন"। তারপরে এটি দেয় যা অবশ্যই x ভেক্টর এর সম্পত্তি রয়েছে যা আপনি নিজের সন্নিবেশ-মানদণ্ড-এখানে সর্বাধিক করেছেন। 1y1N

তাহলে সেই মানদণ্ডগুলি কী কী?

দ্বিতীয়-আদেশের মানদণ্ড:

পিসিএতে, আপনি এমন ভিত্তি ভেক্টরগুলি সন্ধান করছেন যা আপনার ডেটার বৈকল্পিককে 'সর্বোত্তমভাবে ব্যাখ্যা করে'। প্রথম (অর্থাত্ সর্বোচ্চ র‌্যাঙ্কড) বেস ভেক্টর এমন একটি হতে চলেছে যা আপনার ডেটা থেকে সমস্ত বৈকল্পিককে সবচেয়ে ভাল ফিট করে। দ্বিতীয়টিরও এই মাপদণ্ড রয়েছে, তবে অবশ্যই প্রথমটির দিকে অর্থকোনাল হওয়া উচিত, এবং আরও অনেক কিছু। (পিসিএর জন্য সেই ভিত্তি ভেক্টরগুলি সন্ধান করে আপনার ডেটার কোভারিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর ব্যতীত কিছুই নয়)।

এফএ-তে, এটির এবং পিসিএর মধ্যে পার্থক্য রয়েছে, কারণ এফএ জেনারেটর, যেখানে পিসিএ হয় না। আমি এফএ'কে 'পিসিএ শোরগোল হিসাবে' হিসাবে বর্ণিত হিসাবে দেখেছি, যেখানে 'শব্দ'কে' নির্দিষ্ট কারণ 'বলা হয় called সব মিলিয়ে সামগ্রিক উপসংহারটি হ'ল পিসিএ এবং এফএ হ'ল দ্বিতীয়-ক্রমের পরিসংখ্যান, (স্বীকৃতি) এবং উপরের কিছুই নয়।

উচ্চতর আদেশের মানদণ্ড:

আইসিএতে, আপনি আবার ভিত্তি ভেক্টরগুলি সন্ধান করছেন, তবে এবার, আপনি এমন ভিত্তি ভেক্টর চান যা ফলাফল দেয়, যেমন ফলস্বরূপ ভেক্টর মূল তথ্যগুলির একটি স্বতন্ত্র উপাদান । আপনি নরমালাইজড কুর্তোসিসের পরম মানকে সর্বাধিকীকরণের মাধ্যমে এটি করতে পারেন - একটি চতুর্থ আদেশের পরিসংখ্যান। এটি হ'ল, আপনি আপনার ডেটা কোনও ভিত্তিতে ভেক্টর প্রজেক্ট করেন এবং ফলাফলটির কুর্তোসিস পরিমাপ করেন। আপনি আপনার ভিত্তি ভেক্টরকে কিছুটা বদলান, (সাধারণত গ্রেডিয়েন্ট অ্যাসেন্টের মাধ্যমে) এবং তারপরে আবার কার্টোসিসটি পরিমাপ করুন ইত্যাদি ually উপাদান.

উপরের শীর্ষ চিত্রটি আপনাকে এটি কল্পনা করতে সহায়তা করতে পারে। আপনি পরিষ্কারভাবে দেখতে পাচ্ছেন যে আইসিএ ভেক্টরগুলি কীভাবে ডেটা অক্ষের সাথে মিলিত হয় (একে অপরের থেকে পৃথক), সেখানে পিসিএ ভেক্টররা যেখানে দিকটি সর্বাধিকীকরণ করা হয় সেগুলি খুঁজতে চেষ্টা করে। (কিছুটা ফলাফলের মতো)।

উপরের চিত্রটিতে যদি পিসিএ ভেক্টরগুলি দেখতে লাগে যে তারা প্রায় আইসিএ ভেক্টরগুলির সাথে মিল রাখে তবে এটি কেবল কাকতালীয়। এখানে বিভিন্ন ডেটা এবং ম্যাট্রিক্সের মিশ্রণের আরও একটি উদাহরণ রয়েছে যেখানে তারা খুব আলাদা। ;-)

এখানে চিত্র বর্ণনা লিখুন


2
মনে হচ্ছে আপনি উভয় পদ্ধতির সাথে পরিচিত familiar একজন দক্ষ ব্যক্তি হিসাবে, আপনি কি উত্তর দিতে পারবেন যদি সেই পদ্ধতিগুলি অন্তর্নিহিতভাবে বোঝায় যে ভিত্তি ভেক্টরগুলি অরথোগোনাল? একে অপরকে শূণ্যহীন প্রক্ষেপণকারী প্রাথমিক বা স্বতন্ত্র উপাদানগুলি কীভাবে আবিষ্কার করতে পারে, দুই পয়েন্ট মেঘের মতো প্রায় 45 ডিগ্রি কোণে একে অপরকে কেন্দ্র করে তৈরি করা হয়?
mbaitoff

2
@ এমবাইটফ আইসিএ ভেক্টরগুলির একটি অরথোগোনাল ভিত্তিক সেট পুনরুদ্ধার করবে, হ্যাঁ। দ্বিতীয়ত, যখন আপনি যেমন জিজ্ঞাসা করছেন তখন আপনার কাছে দুটি সিগন্যাল যার একে অপরের উপর শূন্য-প্রক্ষেপণ থাকে - এটি আইসিএ হ'ল পূর্বাবস্থায় ফিরিয়ে আনার চেষ্টা করছে। এজন্য আইসিএ দ্বারা প্রাপ্ত চূড়ান্ত ভিত্তি ভেক্টরগুলি একে অপরের কাছে অর্থেগোনাল। তারপরে আপনি যখন এই দুটি নতুন ভেক্টরগুলিতে আপনার ডেটা প্রজেক্ট করবেন তখন সেগুলি একে অপরের কাছে অরথোগোনাল হতে চলেছে।
স্পেসি

1
@ টারান্টুলা আমি যা বলছি সে সম্পর্কে আমি একটি প্রশ্ন জিজ্ঞাসা করেছি: stats.stackexchange.com/questions/6575/… , আপনি চিত্রটি দেখতে পারেন, i.stack.imgur.com/U6fWb.png । আমি বুঝতে পারি না একটি অर्थোগোনাল ভিত্তিতে কীভাবে এই দুটি মেঘকে বর্ণনা করবে। আমার পক্ষে এটি সুস্পষ্ট যে দু'টি ভেক্টর প্রধান দোলনের দিকনির্দেশনা বর্ণনা করে অরথোগোনাল নয়।
mbaitoff

@mbaitoff আপনি দুটি সেন্সর থেকে আপনার ডেটা নিয়েছেন এবং আপনি একে অপরের বিরুদ্ধে চক্রান্ত করেছেন এবং আপনি এই দুটি পদ্ধতি দেখেন, তাই আপনি জানেন যে তারা কমপক্ষে সম্পর্কযুক্ত। তারপরে প্রশ্নটি দাঁড়ায়, আপনি যে সমস্ত পয়েন্টগুলি সেখানে থাকতে পারেন সেগুলি কীভাবে স্বাধীন করতে পারেন? (অর্থাত্, আইসিএ যা আবিষ্কার করে তার মতো একটি অরথোগোনাল ভিত্তিতে)। আইসিএ এটিই আপনাকে খুঁজে পায়। আপনি যখন বলছেন তখন আপনার অর্থ কী তা আমি বুঝতে পারি না "একটি অরথোগোনাল ভিত্তি কীভাবে এই দুটি মেঘকে বর্ণনা করবে"। কেন না?
স্পেসি

@ তারানতুলা ওহ, এখন দেখছি এর অর্থ কী! আমি ভেবেছিলাম এটি 'মূল প্লটটিতে দুটি অর্থোগোনাল ভেক্টর সন্ধান করার মতো ছিল' যদিও এর অর্থ হ'ল মূল প্লটটিতে দু'জন ভেক্টর খুঁজে পাওয়া এমন একটি অভিক্ষেপ যার ফলে তারা অরথোগোনাল (স্বতন্ত্র) করবে।
mbaitoff

31

বেশ না। ফ্যাক্টর বিশ্লেষণ দ্বিতীয় মুহুর্তের সাথে কাজ করে এবং সত্যই আশা করে যে ডেটা গাউসিয়ান যাতে সম্ভাবনা অনুপাত এবং এর মতো স্টাফ অ-স্বাভাবিকতার দ্বারা প্রভাবিত হয় না। অন্যদিকে, আইসিএ এই ধারণাটি দ্বারা অনুপ্রাণিত হয় যে আপনি যখন জিনিসগুলি যুক্ত করেন, তখন সিএলটি-র কারণে আপনি কিছু সাধারণ পেয়ে যাবেন এবং সত্যিকার অর্থে আশা করছেন যে তথ্যগুলি অ-স্বাভাবিক, যাতে অস্বাভাবিক উপাদানগুলি থেকে বের করা যায় তাদের। অ-স্বাভাবিকতা কাজে লাগাতে, আইসিএ ইনপুটগুলির রৈখিক সংমিশ্রণের চতুর্থ মুহূর্তটি সর্বাধিক করে তোলার চেষ্টা করে:

maxa:a=11ni[a(xix¯)]4

যদি কিছু হয় তবে আইসিএকে পিসিএর সাথে তুলনা করা উচিত, যা ইনপুটগুলির একটি মানক সংমিশ্রণের দ্বিতীয় মুহূর্ত (বৈকল্পিকতা) সর্বাধিক করে তোলে।


সুন্দর এবং খালাস উত্তর
সুভাষ সি। দাবার

এখানে চতুর্থ মুহূর্তটি কি? PL.EXPLAIN।
সুভাষ সি। দাবার

@ subhashc.davar ৪ র্থ মুহূর্তটি হ'ল কুর্তোসিস - অর্থাত ডিগ্রিটি ভারী বা লাইটার হিসাবে সাধারণ ডিস্ট্রিবিউশনের চেয়ে টেইলড ছিল। en.wikipedia.org/wiki/Kurtosis
javadba
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.