কার্যকরী প্রধান উপাদান বিশ্লেষণ (এফপিসিএ): এটি সমস্ত কি?


21

কার্যকরী মূল উপাদান বিশ্লেষণ (এফপিসিএ) এমন একটি জিনিস যা আমি হোঁচট খেয়েছি এবং কখনই বুঝতে পারি নি। এটা সব সম্পর্কে কি?

শ্যাং, ২০১১ দ্বারা "কার্যকরী প্রধান উপাদান বিশ্লেষণের সমীক্ষা" দেখুন এবং আমি উদ্ধৃত করছি:

পিসিএ "মাত্রিকতার অভিশাপ" (বেলম্যান 1961) এর কারণে কার্যকরী তথ্য বিশ্লেষণে গুরুতর অসুবিধায় পড়েছে। "মাত্রিকতার অভিশাপ" উচ্চ মাত্রিক স্থানের ডেটা স্পারসিটি থেকে উদ্ভূত হয়েছিল। এমনকি যদি পিসিএর জ্যামিতিক বৈশিষ্ট্য বৈধ থাকে এবং সংখ্যার কৌশলগুলি স্থিতিশীল ফলাফল সরবরাহ করেও, নমুনা কোভারিয়েন্স ম্যাট্রিক্স কখনও কখনও জনসংখ্যার কোভারিয়েন্স ম্যাট্রিক্সের একটি খারাপ অনুমান mate এই সমস্যাটি কাটিয়ে ওঠার জন্য, এফপিসিএ পিসিএর চেয়ে নমুনা কোভেরিয়েন্স কাঠামো পরীক্ষা করার আরও অনেক তথ্যমূলক উপায় সরবরাহ করে [...]

আমি ঠিক এটি পাই না। এই কাগজটি যে ত্রুটিটি বর্ণনা করছে তা কী? "মাত্রিকতার অভিশাপ" এর মতো পরিস্থিতিগুলি পরিচালনা করার জন্য পিসিএকে চূড়ান্ত পদ্ধতি বলে মনে করা হচ্ছে না?

উত্তর:


7

ঠিক যেমনটি আপনি প্রশ্নে বলেছেন এবং @tdc তার উত্তরে উল্লেখ করেছেন, পিসিএর জ্যামিতিক বৈশিষ্ট্য বৈধ থাকার পরেও চূড়ান্ত উচ্চ মাত্রার ক্ষেত্রে, কোভেরিয়েন্স ম্যাট্রিক্স আর প্রকৃত জনসংখ্যার কাওয়্যারিয়েন্সের একটি ভাল অনুমান নয়।


একটি খুব আকর্ষণীয় কাগজ রয়েছে "এফএমআরআই ডেটা সম্পর্কিত ফাংশনাল অধ্যক্ষ উপাদান উপাদান বিশ্লেষণ" ( পিডিএফ ) যেখানে তারা বৈকল্পিকটি কল্পনা করতে ফাংশনাল পিসিএ ব্যবহার করে:

... অন্যান্য শোষক কৌশলগুলির মতো, উদ্দেশ্যটি একটি প্রাথমিক মূল্যায়ন সরবরাহ করা যা কোনও উপযুক্ত মডেল বাছাইয়ের আগে তথ্যটিকে "নিজের পক্ষে কথা বলার" সুযোগ দেয়। [...]

কাগজে তারা ব্যাখ্যা করেছেন যে তারা ঠিক কীভাবে এটি করেছে এবং তাত্ত্বিক যুক্তিও সরবরাহ করে:

এই পদ্ধতির সিদ্ধান্ত গ্রহণযোগ্য সুবিধাটি বেস ফাংশন সেটের পছন্দ এবং ফিট দ্বারা ক্ষুদ্রতর ত্রুটিযুক্ত ত্রুটির ক্ষেত্রে একটি অনুমানের একটি সেট নির্দিষ্ট করার সম্ভাবনা নিয়ে গঠিত। এই অনুমানগুলি এফ-মাস্কিংয়ের মতো কোনও পূর্বসূরি হেমোডাইনামিক ফাংশনের স্পেসিফিকেশন এবং ইভেন্টস বা শর্তগুলির একটি সেটের তুলনায় দুর্বল হবে; এইভাবে প্রক্রিয়াটির অনুসন্ধানের চরিত্রটি সংরক্ষণ করা হবে; যাইহোক, অনুমানগুলি সাধারণ পিসিএর বিভিন্ন অপরাধগুলি কাটিয়ে উঠতে যথেষ্ট কঠোর হতে পারে।


আমি এফপিসিএর পিছনে যুক্তি বোঝার জন্য সংগ্রাম করছি; আপনি উদ্ধৃত কাগজটির দিকে তাকালাম তবে এখনও বিভ্রান্ত রয়েছি। সেটিং ডেটা ম্যাট্রিক্স হয় সঙ্গে আকার দৈর্ঘ্য পর্যবেক্ষিত সময় সিরিজ । পিসিএর সাহায্যে কোভেরিয়েন্স ম্যাট্রিক্সের প্রথম লম্বা ইগেনভেেক্টরটি পাওয়া যাবে; দাবিটি হ'ল এটি খুব শোরগোল হবে। FPCA সমাধান সঙ্গে প্রতিটি সময় সিরিজ আনুমানিক হয় ভিত্তিতে ফাংশন ( ), এবং তারপর ভিত্তি ফাংশন স্থান পিসিএ সঞ্চালন। সঠিক? যদি তা হয় তবে প্রতিটি সময় সিরিজটি মসৃণ করা এবং তারপরে স্ট্যান্ডার্ড পিসিএ চালানো থেকে কীভাবে আলাদা? কেন একটি বিশেষ নাম? n t n টি কে কে টিn×tntntkkt
অ্যামিবা বলেছেন মনিকা পুনরায়

এটি সম্পর্কে আরও কিছুটা পড়ার পরে, আমি আমার নিজের উত্তর পোস্ট করার সিদ্ধান্ত নিয়েছি। সম্ভবত আপনি আগ্রহী হবে। আমি অবশ্যই কোনও অতিরিক্ত অন্তর্দৃষ্টি প্রশংসা করব।
অ্যামিবা বলছেন মনিকা পুনরায়

24

আমি "ফাংশনাল পিসিএ" একটি অহেতুক বিভ্রান্তিকর ধারণা পেয়েছি। এটি মোটেই আলাদা জিনিস নয়, এটি টাইম সিরিজে স্ট্যান্ডার্ড পিসিএ।

এফপিসিএ পরিস্থিতিগুলিকে বোঝায় যখন পর্যবেক্ষণগুলির প্রতিটি টাইম পয়েন্টে পর্যবেক্ষণ করা একটি টাইম সিরিজ (অর্থাত্ একটি "ফাংশন") হয় , যাতে পুরো ডেটা ম্যাট্রিক্স আকারের হয়। সাধারণত , উদাহরণস্বরূপ, প্রতিটিতে ১০ টাইম পয়েন্টে টাইম সিরিজ নমুনা থাকতে পারে। বিশ্লেষণের মূল বিষয়টি হ'ল বেশ কয়েকটি "ইগেন-টাইম-সিরিজ" (দৈর্ঘ্যের ), অর্থাৎ কোভরিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর, যা পর্যবেক্ষণকৃত সময় সিরিজের "সাধারণ" আকৃতি বর্ণনা করবে।t n × t t n 20 1000 tntn×ttn201000t

এক এখানে অবশ্যই প্রমিত পিসিএ প্রয়োগ করতে পারেন। স্পষ্টতই, আপনার উদ্ধৃতিতে লেখক উদ্বিগ্ন যে ফলস্বরূপ ইগেন-টাইম-সিরিজটি খুব শোরগোল হবে। এটা সত্যিই ঘটতে পারে! এর সাথে মোকাবিলার দুটি সুস্পষ্ট উপায় হ'ল: (ক) পিসিএর পরে ফলাফলিত ইগেন-সময়-সিরিজ মসৃণ করা, বা (খ) পিসিএ করার আগে আসল সময় সিরিজটি মসৃণ করা।

একটি কম স্পষ্ট, আরও অভিনব, তবে প্রায় সমতুল্য পদ্ধতির, বেস ভিত্তিক ফাংশনগুলির সাথে প্রতিটি আসল সময় সিরিজটিকে আনুমানিকভাবে থেকে কমিয়ে আনতে হয় । তারপরে কেউ পিসিএ করতে পারে এবং একই ভিত্তিতে ফাংশনগুলির দ্বারা প্রায় ইগন-সময়-সিরিজ অর্জন করতে পারে। এটি সাধারণত এফপিসিএ টিউটোরিয়ালে দেখা যায়। একজন সাধারণত মসৃণ ভিত্তিক ফাংশন (গাউসিয়ান বা ফুরিয়ার উপাদান) ব্যবহার করতে পারেন, আমি যতদূর দেখতে পাচ্ছি এটি মূলত উপরের মস্তিষ্ক-মৃত সহজ বিকল্প (খ) এর সমতুল্য।টি কেktk

এফপিসিএ সম্পর্কিত টিউটোরিয়ালগুলি সাধারণত পিসিএকে অসীম মাত্রিকতার কার্যকরী স্থানে কীভাবে সাধারণীকরণ করা যায় সে সম্পর্কে দীর্ঘ আলোচনায় যায় তবে এর ব্যবহারিক প্রাসঙ্গিকতা পুরোপুরি আমার বাইরে practice

এখানে একটি চিত্রণ র্যামজে এবং সিলভারম্যান থেকে নেওয়া হয় "প্রায়োগিক ডেটা বিশ্লেষণ" পাঠ্যপুস্তক, যা মনে হয় হতে FPCA সহ "কার্মিক তথ্য বিশ্লেষণ" এ নির্ধারক প্রকরণগ্রন্থ:

র‌্যামসে এবং সিলভারম্যান, এফপিসিএ

কেউ দেখতে পাচ্ছেন যে "বিযুক্ত তথ্য" (পয়েন্ট) এর উপর পিসিএ করা ফিউরিয়ার ভিত্তিতে (লাইনগুলি) সম্পর্কিত ফাংশনগুলিতে এফপিসিএ করার মতো ব্যবহারিকভাবে একই জিনিস দেয়। অবশ্যই একজন প্রথমে পৃথক পিসিএ করতে পারে এবং তারপরে একই ফুরিয়ার ভিত্তিতে একটি ফাংশন ফিট করতে পারে; এটি কমবেশি একই ফলাফল দেয়।

পুনশ্চ. এই উদাহরণে যা সহ একটি ছোট সংখ্যা । এই ক্ষেত্রে লেখকরা "ফাংশনাল পিসিএ" হিসাবে যা দেখছেন তার ফলস্বরূপ 12 টি পৃথক পয়েন্টের বিপরীতে একটি "ফাংশন", অর্থাৎ "মসৃণ বক্ররেখা" হওয়া উচিত। তবে এটি ইন্টারপোল্টিং এবং তারপরে ফলস্বরূপ ইগেন-সময়-সিরিজটি মসৃণ করার মাধ্যমে তুচ্ছভাবে যোগাযোগ করা যেতে পারে। আবার, মনে হয় "ফাংশনাল পিসিএ" আলাদা জিনিস নয়, এটি কেবল পিসিএর একটি প্রয়োগ। n > টিt=12n>t


2
খুব কম অনিয়মিতভাবে নমুনাযুক্ত ট্র্যাজেক্টরিগুলির ক্ষেত্রে (উদাহরণস্বরূপ দ্রাঘিমাংশের তথ্য) এফপিসিএ " ইন্টারপোলটিং এবং তারপরে ফলস্বরূপ ইগেন-টাইম-সিরিজটি মসৃণ করা " এর চেয়ে অনেক বেশি জড়িত । উদাহরণস্বরূপ, এমনকি যদি কোনও একরকম কিছু স্পর্শকাতর ডেটারের প্রজেকশন স্কোর গণনা করে কিছু আইজেনকিম্পোনেন্টগুলিও সঠিকভাবে সংজ্ঞায়িত হয় না; উদাহরণস্বরূপ দেখুন: ইয়াও এট আল। জাসা 2005. ঘন নিয়মিত নমুনাপ্রাপ্ত প্রক্রিয়াগুলির জন্য অনুমোদিত এফপিসিএ কার্যকরভাবে পিসিএ শীর্ষে কিছু মসৃণতা জরিমানা সহ।
usεr11852 বলছে 22 ই জুন পুনরায় স্থাপন করুন মনিক

ধন্যবাদ, @ usεr11852 (+1)। এটি আবার খতিয়ে দেখার জন্য আমার সময় বের করা দরকার। আমি আপনার উল্লেখ করা কাগজটি সন্ধান করার চেষ্টা করব এবং এই উত্তরটি ফিরে পাব।
অ্যামিবা বলছেন মনিকা পুনরায় স্থাপন করুন

@ অ্যামিবা, এই সমস্ত শব্দগুলি প্রায় দূষিত ফুরিয়ার রূপান্তরের সাথে সম্পর্কিত, যেখানে আপনি একটি জটিল তরঙ্গ / সময়-সিরিজের উপাদান তরঙ্গগুলি পুনরুদ্ধার করেন?
রাসেল রিচি

9

আমি এফডিএতে জিম রামসেয়ের সাথে বেশ কয়েক বছর কাজ করেছি, তাই আমি @ অ্যামিবার জবাবটিতে সম্ভবত কয়েকটি স্পেসিফিকেশন যুক্ত করতে পারি। আমি ব্যবহারিক স্তরে মনে করি, @ ময়েবা মূলত সঠিক। কমপক্ষে, এফডিএ অধ্যয়ন শেষে অবশেষে আমি এই সিদ্ধান্তে পৌঁছেছি। যাইহোক, এফডিএ কাঠামো কেন ইগেনভেেক্টরগুলিকে স্মুথ করা কেবল একটি ক্লাদজ ছাড়াও কেন একটি আকর্ষণীয় তাত্ত্বিক অন্তর্দৃষ্টি দেয়। দেখা যাচ্ছে যে ফাংশন স্পেসে অপ্টিমাইজেশন, কোনও অভ্যন্তরীণ পণ্য সাপেক্ষে একটি মসৃণতা জরিমানা রয়েছে, ভিত্তি স্প্লাইজের একটি সীমাবদ্ধ মাত্রিক সমাধান দেয়। এফডিএ অসীম মাত্রিক ফাংশন স্পেস ব্যবহার করে তবে বিশ্লেষণে অসীম সংখ্যার মাত্রা প্রয়োজন হয় না। এটি গাউসিয়ান প্রসেস বা এসভিএম এর কার্নেল ট্রিকের মতো। এটি আসলে অনেকটা কার্নেল ট্রিকের মতো।

রামসে এর মূল কাজটি এমন পরিস্থিতিতে পড়েছিল যেখানে ডেটাতে মূল গল্পটি সুস্পষ্ট: ফাংশনগুলি কম বেশি লিনিয়ার, বা আরও বা কম পর্যায়ক্রমিক হয়। স্ট্যান্ডার্ড পিসিএর প্রভাবশালী আইজেনভেেক্টরগুলি কেবলমাত্র ফাংশনগুলির সার্বিক স্তর এবং রৈখিক প্রবণতা (বা সাইন ফাংশন) প্রতিফলিত করবে, মূলত আমরা ইতিমধ্যে যা জানি তা আমাদের জানান। আকর্ষণীয় বৈশিষ্ট্যগুলি অবশিষ্টাংশগুলিতে রয়েছে, যা তালিকার শীর্ষ থেকে এখন বেশ কয়েকটি আইজেনভেেক্টর। এবং যেহেতু প্রতিটি পরবর্তী আইজেনভেেক্টর পূর্ববর্তীগুলির সাথে অর্থেগোনাল হতে হয়, তাই এই গঠনগুলি বিশ্লেষণের নিদর্শনগুলির উপর আরও বেশি নির্ভর করে এবং তথ্যের প্রাসঙ্গিক বৈশিষ্ট্যের উপর কম। ফ্যাক্টর বিশ্লেষণে, তির্যক ফ্যাক্টর রোটেশন এই সমস্যাটি সমাধান করা। র‌্যামসের ধারণা উপাদানগুলি ঘোরানো নয়, বরং অরথোগোনালটির সংজ্ঞাটি এমনভাবে পরিবর্তন করা যাতে বিশ্লেষণের প্রয়োজনগুলি আরও ভাল প্রতিফলিত হয়। এর অর্থ হ'ল আপনি যদি পর্যায়ক্রমিক উপাদানগুলির সাথে সংশ্লিষ্ট হন তবে আপনি এর ভিত্তিতে মসৃণ হনD3DD2

কেউ আপত্তি করতে পারেন যে ওএলএসের সাথে প্রবণতাটি সরিয়ে ফেলা এবং সেই অপারেশনের অবশিষ্টাংশগুলি পরীক্ষা করা সহজ be আমি কখনই নিশ্চিত হইনি যে এফডিএর মান সংযোজন পদ্ধতিটির বিশাল জটিলতার পক্ষে মূল্যবান। তবে একটি তাত্ত্বিক দিক থেকে, জড়িত বিষয়গুলি বিবেচনা করা মূল্যবান। আমরা ডেটাতে যা কিছু করি তা জিনিসগুলিকে গণ্ডগোল করে। মূল ডেটা স্বতন্ত্র ছিল এমনকীও ওএলএসের অবশিষ্টাংশগুলি পারস্পরিক সম্পর্কযুক্ত। কোনও টাইম সিরিজ স্মুথ করা স্ব-সংশোধনগুলি প্রবর্তন করে যা কাঁচা সিরিজে ছিল না। এফডিএর ধারণাটি ছিল তা নিশ্চিত করা যে আমরা প্রাথমিক অবনতি থেকে যে অবশিষ্টাংশ পেয়েছি সেগুলি সুদের বিশ্লেষণের পক্ষে উপযুক্ত ছিল।

আপনাকে মনে রাখতে হবে যে 80 এর দশকের গোড়ার দিকে এফডিএর সূত্রপাত হয়েছিল যখন স্প্লাইন ফাংশনগুলি সক্রিয় গবেষণার অধীনে ছিল - গ্রেস ওয়াহবা এবং তার দলের কথা ভাবেন। মাল্টিভারিয়েট ডেটাতে অনেকগুলি দৃষ্টিভঙ্গি তখন থেকেই প্রকাশ পেয়েছে - যেমন এসইএম, বৃদ্ধি বক্ররেখা বিশ্লেষণ, গাউসিয়ান প্রক্রিয়াগুলি, স্টোকাস্টিক প্রক্রিয়া তত্ত্বের আরও বিকাশ এবং আরও অনেক কিছু। আমি নিশ্চিত নই যে এফডিএ যে প্রশ্নগুলির উত্স দেয় তার মধ্যে সর্বোত্তম পন্থা remains অন্যদিকে, আমি যখন এফডিএ হওয়ার জন্য কী পরিকল্পনা করি তার অ্যাপ্লিকেশনগুলি দেখি, প্রায়শই আমি ভাবছি যে লেখকরা সত্যিই বুঝতে পারেন যে এফডিএ কী করার চেষ্টা করছে।


+1 টি। ওহো, আমি আপনার উত্তরটি এখনই লক্ষ্য করেছি এবং কেবলমাত্র সুযোগেই (অন্য কেউ আমার উত্তরের নীচে এখানে একটি মন্তব্য রেখেছিল এবং আমি স্ক্রোল করে রেখেছি)। অবদান রাখার জন্য অনেক ধন্যবাদ! আমি মনে করি এ সম্পর্কে কিছুটা আরও পড়ার জন্য এবং কার্নেলের কৌশলটির সাথে আপনি কী বলেছিলেন সে সম্পর্কে আমার চিন্তা করার জন্য আমার সময় পাওয়া দরকার। এটা যুক্তিসঙ্গত শোনায়।
অ্যামিবা বলেছেন মোনিকা

5

আমি এফপিসিএ সম্পর্কে নিশ্চিত নই, তবে একটি বিষয় মনে রাখবেন যে, চূড়ান্ত উচ্চ মাত্রায় আরও অনেক "স্থান" রয়েছে এবং স্থানের মধ্যে থাকা পয়েন্টগুলি সমানভাবে বিতরণ করা দেখতে শুরু করে (অর্থাত্ সবকিছুই সব থেকে দূরে)। এই মুহূর্তে কোভেরিয়েন্স ম্যাট্রিক্স মূলত অভিন্ন দেখতে শুরু করবে এবং শব্দের প্রতি খুব সংবেদনশীল হবে। সুতরাং এটি "সত্য" সমবায় একটি খারাপ অনুমান হয়ে যায়। সম্ভবত এফপিসিএ একরকম হয়ে গেছে, তবে আমি নিশ্চিত নই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.