সময়-সিরিজের ডেটাতে পিসিএ কীভাবে ব্যাখ্যা করবেন?


19

আমি "সাম্প্রতিক ক্লাস্টার কম্পিউটিংয়ের সাথে মস্তিষ্কের ক্রিয়াকলাপ ম্যাপিং" শিরোনামের একটি জার্নাল নিবন্ধে পিসিএর ব্যবহার বোঝার চেষ্টা করছি " ফ্রিম্যান এট আল।, ২০১৪ ( ল্যাব ওয়েবসাইটে ফ্রি পিডিএফ উপলব্ধ )"। তারা সময় সিরিজের ডেটাতে পিসিএ ব্যবহার করে এবং মস্তিষ্কের মানচিত্র তৈরি করতে পিসিএ ওজন ব্যবহার করে।

ডেটা ট্রায়াল-গড় ইমেজিং ডেটা, ম্যাট্রিক্স হিসাবে সংরক্ষণ করা হয় ( কাগজে called বলা হয় ) ভক্সেল (বা মস্তিষ্কে চিত্রের অবস্থানগুলি) টাইম পয়েন্ট (একক দৈর্ঘ্য) মস্তিষ্কে উদ্দীপনা)। এন× টিওয়াই^এন×টি^

তারা এসভিডি ব্যবহার করে যার ফলস্বরূপ ( ম্যাট্রিক্স ট্রান্সপোজ ইঙ্গিত করে )।

ওয়াই^=ইউএসভী
ভিভীভী

লেখকরা যে বিবৃতি

মূল উপাদানগুলি ( এর কলামগুলি ) দৈর্ঘ্য এর ভেক্টর এবং স্কোরগুলি ( এর কলামগুলি ) দৈর্ঘ্যের (ভক্সেলের সংখ্যা ) এর ভেক্টর , প্রতিটি ভক্সেলের প্রক্ষেপণের দিক নির্দেশ করে সংশ্লিষ্ট উপাদান দ্বারা প্রদত্ত, ভলিউম, অর্থাৎ পুরো মস্তিষ্কের মানচিত্রের উপর অনুমানগুলি গঠন করে।টি ইউ এনভীটি^ইউএন

তাই পিসিতে দৈর্ঘ্যের ভেক্টর হয় । পিসিএর টিউটোরিয়ালে যেমনটি প্রকাশিত হয় তেমনি "প্রথম প্রধান উপাদানটি সবচেয়ে বৈকল্পিকতা ব্যাখ্যা করে" কীভাবে ব্যাখ্যা করব? আমরা অনেকগুলি অত্যন্ত সংযুক্ত সময়-সিরিজের ম্যাট্রিক্স দিয়ে শুরু করেছি - একক পিসি টাইম সিরিজ আসল ম্যাট্রিক্সের পার্থক্য কীভাবে ব্যাখ্যা করে? আমি পুরো "সবচেয়ে বৈচিত্রপূর্ণ অক্ষের প্রতি পয়েন্টের গাউসিয়ান মেঘের আবর্তন" বুঝতে পারি তবে এটি কীভাবে সময়-সিরিজের সাথে সম্পর্কিত তা নিশ্চিত নয়। লেখকরা যখন নির্দেশ করেছেন তখন নির্দেশক বলতে কী বোঝায় : "স্কোরগুলি ( এর কলামগুলি ) দৈর্ঘ্যের এর ভেক্টরটি^ এনইউএন (ভক্সেলের সংখ্যা), সংশ্লিষ্ট উপাদান দ্বারা প্রদত্ত দিকটিতে প্রতিটি ভক্সেলের প্রজেকশন বর্ণনা করে? "কীভাবে একটি মূল উপাদান টাইম কোর্সের দিকনির্দেশ থাকতে পারে?

নীতি উপাদান 1 এবং 2 এবং সম্পর্কিত মস্তিষ্কের মানচিত্রের লিনিয়ার সংমিশ্রণ থেকে ফলাফল সময়গুলির সিরিজের উদাহরণ দেখতে XY প্লটের ডটগুলিতে নিম্নলিখিত লিঙ্ক এবং মাউসটিতে যান।

ফ্রেম্যান এট।

আমার দ্বিতীয় প্রশ্নটি মূল উপাদানগুলির স্কোরগুলি ব্যবহার করে তারা (রাষ্ট্র-স্থান) ট্রাজেক্টোরিগুলির সাথে সম্পর্কিত ।

এগুলি প্রথম 2 স্কোর গ্রহণ করে তৈরি করা হয়েছে ("অপ্টমোটার" উদাহরণের ক্ষেত্রে আমি উপরে বর্ণিত) এবং পৃথক পরীক্ষাগুলি (উপরে বর্ণিত ট্রায়াল-গড় ম্যাট্রিক্স তৈরি করতে ব্যবহৃত হয়) সমীকরণের মাধ্যমে মূল উপস্থানে প্রোজেক্ট করে:

জে=ইউওয়াই

আপনি যেমন লিঙ্কযুক্ত চলচ্চিত্রগুলি দেখতে পাচ্ছেন, রাষ্ট্রীয় জায়গার প্রতিটি ট্রেস পুরো মস্তিষ্কের ক্রিয়াকলাপকে উপস্থাপন করে।

প্রথম 2 পিসির স্কোরের এক্সওয়াই প্লটকে যুক্ত করে এমন চিত্রের তুলনায় কেউ কি রাষ্ট্রীয় স্পেস মুভিটির প্রতিটি "ফ্রেম" বোঝায় তার জন্য অন্তর্দৃষ্টি সরবরাহ করতে পারে? এক্সওয়াই রাজ্য-স্থানের 1 পদে থাকা এবং অন্য বিচারে অন্য অবস্থানে থাকার জন্য পরীক্ষার 1 টি পরীক্ষার জন্য প্রদত্ত "ফ্রেম" এর অর্থ কী? সিনেমাগুলির এক্সওয়াই প্লটের অবস্থানগুলি কীভাবে আমার প্রশ্নের প্রথম অংশে উল্লিখিত লিঙ্কযুক্ত চিত্রের মূল উপাদানটির চিহ্নগুলির সাথে সম্পর্কিত?

ফ্রিম্যান এট।


1
+1 আমি আপনার প্রশ্ন সম্পাদনা করেছি, এখানে কীভাবে টেক্সট সমীকরণগুলি বিন্যাস করতে পারে তা একবার দেখুন। তা ছাড়া, আমি কাগজটি বেশ ভাল জানি, তাই পরে জবাব দেব।
অ্যামিবা বলছে মনিকাকে পুনরায়

1
এটি ওপি যা চায় তা ঠিক নয়, তবে সময়-সিরিজের ডেটা থেকে নেওয়া যখন মূল উপাদানগুলি ব্যাখ্যা করতে কার্যকর হতে পারে, কারণ আমি এই সময়টা করি। আমি সাধারণত পিসিএকে কারহুনেন-লোভ সম্প্রসারণ হিসাবে ব্যাখ্যা করতে চাই: একটি নির্ধারিত সময় সিরিজটি প্রকাশ করে, (আপনি যে বিভিন্ন টাইম-সিরিজটিতে পিসিএ প্রয়োগ করেন) অসম্পর্কিত সময় সিরিজের লিনিয়ার সংমিশ্রণ হিসাবে (অর্থাত্ মূল উপাদানগুলি)। এই ক্ষেত্রে প্রতিটি সময় সিরিজের ওজন কোভারিয়েন্স ম্যাট্রিক্স থেকে প্রাপ্ত ইগেনভেেক্টর দ্বারা দেওয়া হয়। এক্সটি
নস্টর

1
: (আমার পয়েন্ট একটি মধ্যে গভীরতা explaination জন্য এই দেখুন astro.puc.cl/~nespino/files/Ch2_PCA_nespinoza.pdf )
নেস্টর

1
আমি আপনার প্রশ্নে কিছু স্ক্রিনশট যুক্ত করেছি যা আপনি উল্লেখ করেছেন।
অ্যামিবা

আপনি কিভাবে ছবি যুক্ত করেছেন?
স্ট্যাটহ্যাকার

উত্তর:


16

প্রশ্ন 1: পিসি সময় সিরিজ এবং "সর্বাধিক বৈকল্পিক" এর মধ্যে সংযোগ কী?

তারা যে ডেটাটি বিশ্লেষণ করছে তা হ'ল নিউরনের প্রত্যেকটির জন্য ডেটা পয়েন্ট , সুতরাং যে ডাইমেনশনাল স্পেস in ডেটা পয়েন্ট হিসাবে এটি সম্পর্কে ভাবতে পারেন । এটি "পয়েন্টের মেঘ", সুতরাং পিসিএ সম্পাদন করা সর্বাধিক বৈকল্পিকের দিকনির্দেশনার সমান, যেমন আপনি ভাল জানেন। আমি এই দিকনির্দেশগুলি (যা কোভেরিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর) "প্রধান অক্ষ", এবং এই দিকনির্দেশগুলিতে ডেটার অনুমানগুলি "মূল উপাদানগুলি" বলতে পছন্দ করি। এন টি এনআরএনt^nt^nআরএন

সময় ধারাবাহিক বিশ্লেষণ করার সময়, এই চিত্রটির একমাত্র সংযোজন হ'ল পয়েন্টগুলি অর্থহীনভাবে অর্ডার করা হয় বা সংখ্যায়িত হয় ( থেকে টু ) কেবলমাত্র বিন্দুর অনিয়ন্ত্রিত সংগ্রহ হওয়ার বিপরীতে । যার অর্থ হ'ল আমরা যদি একটি একক নিউরনের (যা মধ্যে একটি সমন্বিত ) এর ফায়ারিং রেট গ্রহণ করি , তবে এর মানগুলি সময়ের ফাংশন হিসাবে প্লট করা যেতে পারে। একইভাবে, আমরা যদি একটি পিসি গ্রহণ করি (যা কিছু লাইনে একটি অভিক্ষেপ ), তবে এর মানও রয়েছে এবং এটি সময়ের ক্রিয়া হিসাবে প্লট করা যেতে পারে। সুতরাং মূল বৈশিষ্ট্যগুলি যদি সময় সিরিজ হয় তবে পিসিগুলিও সময় সিরিজ।টি আর এন আর এন টি1টি^আরএনআরএনটি^

আমি উপরের @ নেস্টারের ব্যাখ্যার সাথে একমত: প্রতিটি আসল বৈশিষ্ট্যটি তারপরে পিসিগুলির একটি রৈখিক সংমিশ্রণ হিসাবে দেখা যায় এবং পিসিগুলি একে অপরের মধ্যে সম্পর্কহীন না হওয়ায়, কেউ এগুলি মূল বৈশিষ্ট্যগুলিকে বিভক্ত করা হয় এমন ভিত্তি ফাংশন হিসাবে ভাবতে পারে। এটি সামান্য কিছুটা ফুরিয়ার বিশ্লেষণের মতো, তবে সাইনস এবং কোসাইনগুলির স্থির ভিত্তির পরিবর্তে আমরা এই নির্দিষ্ট ডেটাসেটের জন্য "সবচেয়ে উপযুক্ত" ভিত্তিটি খুঁজে পাচ্ছি, এই অর্থে যে প্রথম পিসি বেশিরভাগ বৈকল্পিকতার জন্য অ্যাকাউন্ট করে ইত্যাদি

"বেশিরভাগ বৈকল্পের জন্য অ্যাকাউন্টিং" এর অর্থ হ'ল যদি আপনি কেবল একটি ভিত্তি ফাংশন (সময় সিরিজ) নেন এবং এটির সাথে আপনার সমস্ত বৈশিষ্ট্য আনুমানিক করার চেষ্টা করেন তবে প্রথম পিসি সেরা কাজটি করবে। সুতরাং এখানে প্রাথমিক অন্তর্নিহিততা হ'ল প্রথম পিসি হ'ল একটি ভিত্তি ফাংশন সময় সিরিজ যা সমস্ত উপলভ্য সময় সিরিজকে সর্বোত্তমভাবে ফিট করে etc.


ফ্রিম্যান এট এ কেন এই উত্তরণটি? এত বিভ্রান্তিকর?

ফ্রিম্যান এট। কলামগুলিতে নয়, সারিতে (!) ভেরিয়েবল (অর্থাৎ নিউরন) সহ ম্যাট্রিক্স the ডেটা বিশ্লেষণ করুন । নোট করুন যে তারা সারিটির অর্থ বিয়োগ করে, যার অর্থ বোধগম্য হয় কারণ সাধারণত পিসিএর আগে ভেরিয়েবল কেন্দ্রিক হয়। তারপরে তারা এসভিডি সম্পাদন করে:উপরোক্ত পরিভাষাটি ব্যবহার করে, এর কলামগুলি মূল অক্ষ ( দিকনির্দেশ ) এবং of এর কলামগুলি মূল উপাদান (দৈর্ঘ্যের টাইম সিরিজ )। ওয়াই =ইউএসভিইউআরএনএসভি টিওয়াই^

ওয়াই^=ইউএসভী
ইউআরএনএসভীটি^

আপনি যে বাক্যটি ফ্রিম্যান এট আল থেকে উদ্ধৃত করেছেন। সত্যিই বেশ বিভ্রান্তিকর:

মূল উপাদানগুলি ( এর কলামগুলি ) দৈর্ঘ্য এর ভেক্টর এবং স্কোরগুলি ( এর কলামগুলি ) দৈর্ঘ্যের (ভক্সেলের সংখ্যা ) এর ভেক্টর , প্রতিটি ভক্সেলের প্রক্ষেপণের দিক নির্দেশ করে সংশ্লিষ্ট উপাদান দ্বারা প্রদত্ত, ভলিউম, অর্থাৎ পুরো মস্তিষ্কের মানচিত্রের উপর অনুমানগুলি গঠন করে।টি ইউ এনভীটি^ইউএন

প্রথমত, এর কলামগুলি পিসি হয় না, তবে পিসিগুলি ইউনিট আদর্শের আকারে থাকে। দ্বিতীয়ত, এর কলামগুলি স্কোর নয়, কারণ "স্কোর" এর অর্থ সাধারণত পিসি হয়। তৃতীয়ত, "সংশ্লিষ্ট উপাদান দ্বারা প্রদত্ত দিকনির্দেশ" একটি ক্রিপ্টিক ধারণা। আমি মনে করি যে তারা এখানে চিত্রটি ফ্লিপ করে এবং points টু মাত্রিক স্থানের পয়েন্টগুলি সম্পর্কে চিন্তাভাবনা করার পরামর্শ দেয় , যাতে এখন প্রতিটি নিউরন একটি ডেটা পয়েন্ট হয় (এবং কোনও ভেরিয়েবল নয়)। ধারণাগতভাবে এটি একটি বিশাল পরিবর্তনের মতো শোনায়, তবে গাণিতিকভাবে এটি প্রায় কোনও পার্থক্য করে না, কেবলমাত্র মূল অক্ষ এবং [ইউনিট-আদর্শ] প্রধান উপাদানগুলি স্থান পরিবর্তন করে। এই ক্ষেত্রে, উপরে থেকে আমার পিসিগুলি ( দীর্ঘ সময় সিরিজ) মূল অক্ষ হবে, অর্থাত্ইউ এন টি টি ইউভীইউএনটি^টি^দিকনির্দেশ এবং কে এই দিকনির্দেশগুলিতে (নরমালাইজড স্কোর?) স্বাভাবিককরণের অনুমান হিসাবে ভাবা যেতে পারে thoughtইউ

আমি এটি খুব বিভ্রান্তিকর বলে মনে করি এবং তাই আমি তাদের শব্দের পছন্দগুলি উপেক্ষা করার পরামর্শ দিই তবে কেবল সূত্রগুলি দেখুন। এই বিন্দু থেকে আমি শর্তগুলি আমার পছন্দ মতো ব্যবহার করব, না কীভাবে ফ্রিম্যান এট আল। তাদের ব্যাবহার করুন.


প্রশ্ন 2: রাষ্ট্রীয় স্পেস ট্রাজেক্টোরিগুলি কী কী?

তারা একক-পরীক্ষামূলক ডেটা নেয় এবং এটিকে প্রথম দুটি মূল অক্ষের উপর অর্থাৎ এর প্রথম দুটি কলামে প্রোজেক্ট করে । আপনি যদি এটি মূল ডেটা with দিয়ে করেন তবে আপনি দুটি প্রথম প্রধান উপাদান ফিরে পাবেন। আবার একটি মূল অক্ষের প্রজেকশন হ'ল একটি মূল উপাদান, অর্থাত্ একটি দীর্ঘ-দীর্ঘ সময় সিরিজ।ওয়াই টিইউওয়াই^টি^

আপনি যদি কিছু একক-পরীক্ষামূলক ডেটা- দিয়ে এটি করেন তবে আপনি আবার দুটি দীর্ঘ-দীর্ঘ সময় সিরিজ পাবেন। মুভিতে প্রতিটি একক লাইন এ জাতীয় প্রক্ষেপণের সাথে মিলে যায়: পিসি 1 অনুসারে এক্স-কো-অর্ডিনেট বিবর্তিত হয় এবং পিসি 2 অনুযায়ী ওয়াই-কোঅর্ডিনেট থাকে। এটিকেই "রাষ্ট্রীয় স্থান" বলা হয়: PC1 PC2 এর বিরুদ্ধে চক্রান্ত করেছিল। সময় যেমন বিন্দু ঘুরে যায় ততক্ষণে যায়।টিওয়াইটি^

ছবিতে প্রতিটি লাইন একটি ভিন্ন একক বিচারে প্রাপ্ত হয় ।ওয়াই


আমি নীচে একটি মন্তব্য হিসাবে এই প্রশ্নটি জিজ্ঞাসা করেছি, তবে সম্ভবত @ অ্যামিবা সাহায্য করতে পারে? প্রথম প্রধান উপাদান ওয়েট ভেক্টরটি কি ঠিক মাঝারি সময় সিরিজটি সমস্ত ভক্সেল জুড়ে বিপর্যস্ত হয়? যদি এটি গড় হয়, তবে এটি পৃথক ডেটা ট্রেসগুলিতে ফিট করার জন্য ক্ষুদ্রতম স্কোরগুলির ফলাফল করে। -
স্ট্যাটহ্যাকার

1
সংক্ষিপ্ত উত্তর হ'ল না , এটি সাধারণত গড় সময় সিরিজ নয়, যদিও অনেক ক্ষেত্রে এটি বেশ ঘনিষ্ঠ হতে পারে। উদাহরণস্বরূপ, সময় সিরিজের একটি সংগ্রহের কথা চিন্তা করুন যা সমস্ত straightালু (ধনাত্মক এবং নেতিবাচক) সমস্ত শূন্যের মধ্য দিয়ে চলেছে এমন সরল রেখা। তারপরে গড় সময় সিরিজ ধ্রুব শূন্যের কাছাকাছি। তবে প্রথম পিসি হবে শক্তিশালী রৈখিক লাইন। বিটিডাব্লু, আমি মনে করি এটি একটি দুর্দান্ত প্রশ্ন এবং আপনি যদি আরও বিশদ এবং / বা পরিসংখ্যান চান, দয়া করে এটি (আবার) আলাদা প্রশ্ন হিসাবে জিজ্ঞাসা করুন। ফ্রিম্যান এট আল সম্পর্কে এই প্রশ্নের কোনও অংশই নকল করবেন না তা নিশ্চিত করুন; তাদের আলাদা করুন
অ্যামিবা

(বা অন্য যে কোনও প্রতিক্রিয়াতে আগ্রহী) - Q2 র সাথে সম্পর্কিত, "প্রথম দুটি [পিসি]" তে "প্রকল্প [প্রতিটি পরীক্ষার] দ্বারা আপনার অর্থ কী? গাণিতিকভাবে এটি খুব স্পষ্ট যে ইউ দৈর্ঘ্য এন ভক্সেলের একটি ভেক্টর, এবং যখন ম্যাট্রিক্স দৈর্ঘ্য এন ম্যাট্রিক্স ওয়াই দ্বারা গুণিত হয় তখন আমরা 1 ম 2 পিসিতে মাত্রিকতা হ্রাস অর্জন করি। স্কোরের ম্যাট্রিক্স হওয়ার জন্য আপনি ইউ এর সাথে অন্তর্দৃষ্টি দিতে পারেন (অর্থাত্ প্রথম 2 পিসি থেকে প্রতিটি ভক্সেলের দূরত্ব)। আমি কি জেটির প্রতিটি টাইমপয়েন্টকে উপরের 1 ম চিত্রের 2 ত্রিমাত্রিক প্লটে প্রতিটি ভক্সেল অবস্থানের প্রক্ষেপণের 2-ডি গড় হিসাবে ভাবতে পারি?
স্ট্যাটহ্যাকার

ইউইউ

Sভী

1

পিভীটি^

ওয়াই^এন×টি^ইউএন×এনভীটি^×টি^

দ্বিতীয় প্রশ্নে শ্রদ্ধার সাথে। দেওয়া সমীকরণটি হ'ল

জে=ইউটিওয়াই

জে×টি

টিটি^জে

টি^

আমি এর আগে রঙিন পদ্ধতিটি ব্যবহার করি নি এবং আমি সে বিষয়ে মন্তব্য করতে আত্মবিশ্বাসী হওয়ার আগে কিছুটা সময় লাগবে। আমি চিত্র 4 সি এর মিলের জন্য মন্তব্যটি বিভ্রান্তিমূলক পেয়েছি কারণ প্রতি-ভক্সেল রিগ্রেশন দ্বারা রঙিনতা এখানে পাওয়া যায়। যেখানে চিত্র 6-এ প্রতিটি ট্রেস একটি সম্পূর্ণ চিত্রের নিদর্শন। যতক্ষণ না আমি সোজা হয়ে থাকি আমি মনে করি এটি চিত্রের মন্তব্য অনুসারে সেই সময়ের বিভাগের সময় উদ্দীপনাটির দিক।


উপরের প্রথম চিত্রটি প্রতিবার উপস্থাপিত একই ভিজ্যুয়াল উদ্দীপনা সহ একটি পরীক্ষাকে বোঝায়। এই ডেটাগুলির জন্য আলাদা চিত্র এবং চলচ্চিত্র রয়েছে। উপরের দ্বিতীয় চিত্রটি একটি পৃথক পরীক্ষা নির্দেশ করে যাতে উদ্দীপনাটি ভিন্ন ভিন্ন দৃষ্টিভঙ্গির সাথে ভিজ্যুয়াল উদ্দীপনা হয়, উপরের ২ য় চিত্রের ট্রেসগুলি বর্ণনামূলক উদ্দীপনা ওরিয়েন্টেশনের সাথে সামঞ্জস্যপূর্ণ রঙিন।
স্ট্যাটহ্যাকার

YT^ \ N

ভীএস
জে=ইউওয়াই
ইউ

আমি জিনিস পুনরায় সাজিয়েছি। আমি অন্য কিছু বাছাইয়ের আগে ক্ষমা চেয়ে নিয়েছি।
অনুমান করা হয়েছে

সব আপনার সাহায্যের জন্য ধন্যবাদ। প্রথম প্রধান উপাদান ওয়েট ভেক্টরটি কি ঠিক মাঝারি সময় সিরিজটি সমস্ত ভক্সেল জুড়ে বিপর্যস্ত হয়? যদি এটি গড় হয়, তবে এটি পৃথক ডেটা ট্রেসগুলিতে ফিট করার জন্য ক্ষুদ্রতম স্কোরগুলির ফলাফল করে।
স্ট্যাটহ্যাকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.