পিসিএ স্বতঃসংশ্লিষ্ট ডেটা দিয়ে কী করছে?


9

কিছু সংবাদদাতা স্বতঃসংশোধনের গণনার পদ্ধতিগুলি সম্পর্কে একটি আকর্ষণীয় প্রশ্ন উত্থাপন করার কারণে, আমি এটির সাথে খেলতে শুরু করেছিলাম, প্রায় সময় সিরিজ এবং স্বতঃসংশ্লিষ্টতা সম্পর্কে কোনও জ্ঞান ছাড়াই।

সংবাদদাতা তার ডেটা ( একটি টাইম সিরিজের ডেটা পয়েন্টগুলি) একের পর এক পিছিয়ে দিয়ে সাজিয়েছে যাতে তার কাছে ম্যাট্রিক্স থাকে ডাটা (যেমন আমি তাকে বুঝতে পেরেছি) যেখানে প্রথম সারির মূল তথ্য, দ্বিতীয় সারি ইউনিট দ্বারা ডেটা স্থানান্তরিত হয় , পরের সারিতে অন্য এক এবং আরও কিছু দ্বারা। আমি অতিরিক্ত হিসাবে লেজ শেষ আঠালো দ্বারা এটি উপলব্ধি করা, তাই "বিজ্ঞপ্তি" ডেটাসেট তৈরি।3232×321

তারপরে, এটি থেকে কী বেরিয়ে আসতে পারে তা সন্ধানের জন্য, আমি পারস্পরিক সম্পর্ক ম্যাট্রিক্স এবং এটি থেকে মূল উপাদানগুলি গণনা করেছি। আশ্চর্যরূপে আমি একটি ফ্রিকোয়েন্সি-পচনের চিত্র পেয়েছি এবং (আবার অন্য ডেটার সাথে) একটি ফ্রিকোয়েন্সি বলেছি যে ডেটাতে একটি সময়কাল প্রথম মূল উপাদানটিতে ছিল এবং চার পিরিয়ড সহ দ্বিতীয় পিসিতে ছিল (আমি ইগন্যালু সহ "প্রাসঙ্গিক" পিসি পেয়েছি326>1)। প্রথমে আমি ভেবেছিলাম এটি ইনপুট ডেটার উপর নির্ভর করে, তবে এখন আমি ধরে নিয়েছি এটি নিয়মিতভাবে এটির বৃত্তাকার শিফ্ট ("টোপলিটজ" ম্যাট্রিক্স নামে পরিচিত) সেট সেট ডেটাগুলির বিশেষ নির্মাণ দ্বারা this ভেরিম্যাক্স বা অন্যান্য ঘূর্ণন-মাপদণ্ডের পিসি-সলিউশনটির আবর্তনগুলি কিছুটা আলাদা এবং সম্ভবত আকর্ষণীয় ফলাফল দিয়েছে, তবে সাধারণভাবে মনে হয় যে এইরকম ফ্রিকোয়েন্সি-পচন ধরে।

এখানে ছবিগুলির একটি লিঙ্ক যা আমি পয়েন্টের ডেটা সেট থেকে তৈরি করেছি ; কার্ভগুলি কেবল ফ্যাক্টরমেট্রিক্সের লোডিং থেকে তৈরি করা হয়: একটি ফ্যাক্টারে লোডিংয়ের একটি কার্ভ। প্রথম পিসি 1 এর বক্ররেখাটি সর্বোচ্চ প্রশস্ততাগুলি দেখাতে পারে (মোটামুটি কারণ এটি লোডিংসকোয়ারের সর্বোচ্চ পরিমাণ বহন করে)32

প্রশ্নাবলী:

  • প্রশ্ন 1: এটি কি ডিজাইনের বৈশিষ্ট্য? (এই ধরণের ডেটাসেট সহ পিসিএ)
  • প্রশ্নোত্তর: ফ্রিকোয়েন্সি- / তরঙ্গদৈর্ঘ্য বিশ্লেষণের গুরুতর পদ্ধতির জন্য এই পদ্ধতির কি কোনও উপায়ে ব্যবহারযোগ্য?

[আপডেট] এখানে ডেটাসেট (আশা করি এটি আপনার পক্ষে অনুলিপিযোগ্য হয়ে উঠবে)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3

ধন্যবাদ @ অ্যামিবা এবং প্রচুর সম্পাদনার জন্য। আমি কেবল দুটি ত্রুটি দেখতে পেয়েছি যা আমি পরে সম্পাদনা করতে চাইছিলাম, প্রশ্নটি এখন খুব সুন্দর দেখাচ্ছে!
গটফ্রিড হেলস

উত্তর:


4

আমাকে আমার আগের মন্তব্যটি একটি উত্তরে রূপান্তর করতে দিন।

আপনার ডেটা ম্যাট্রিক্সের সারিগুলি ভেরিয়েবল বা নমুনাগুলি হিসাবে ধারণ করার জন্য কী আপনি কল্পনা করেন? আমি ধরে নেব সেগুলি নমুনা: যেমন আপনার আছেএন=32 বিভিন্ন সময় সিরিজ (নমুনা)।

তারপর, যদি সব এন=32 সারিগুলি অভিন্ন, তবে কেবল বিজ্ঞপ্তি দ্বারা স্থানান্তরিত 1 প্রতিটি অবস্থান, তারপর এন×এনসমস্ত জোড়া সারিগুলির মধ্যে ডট পণ্যযুক্ত আপনার ডেটা গ্রাম ম্যাট্রিক্সে টোপলিটজ কাঠামো থাকবে: তির্যকের নিকটবর্তী উচ্চ মানের এবং এ থেকে ধীরে ধীরে শূন্য মানগুলিতে হ্রাস পাবে। Toeplitz ম্যাট্রিক্স তাদের eigenvectors যেমন পরপর ফুরিয়ার মোড (এবং গ্রাম ম্যাট্রিক্স eigenvectors প্রধান উপাদান, স্কেলিং আপ করতে চলেছেন), তাই হ্যাঁ আপনার চতুর্থাংশ 1 থেকে: এটা কোন আশ্চর্য যে আপনার পিসিতে যেমন ফ্রিকোয়েন্সি বৃদ্ধি sinusoidal তরঙ্গ পাবেন।

কোনও ধারণা নেই এটি কার্যকর হতে পারে কিনা (কিউ 2)। আমার অভিজ্ঞতায় এটি বিরক্তিকর নিদর্শন হিসাবে উপস্থিত হতে ঝোঁক। অর্থাত্ লোকেদের কিছু ডেটা রয়েছে, পিসিএ থেকে ফিউরিয়ার পদ্ধতিগুলির মতো কিছু পাওয়া যায় এবং ভাবতে শুরু করে যে তাদের অর্থ কী হতে পারে, যেখানে তারা মূল সময় সিরিজের কিছু সময় পরিবর্তনের কারণে ঘটে are


ভাল, খুব সুন্দর, ধন্যবাদ! হ্যাঁ, আমি সারি বরাবর ডেটা ভেবেছি। কিউ 2 আসে কারণ আমি আজ পর্যন্ত কখনই বুঝতে পারি নি যে ফুরিয়ার বিশ্লেষণ ঠিক কীভাবে কাজ করে - এবং দুর্ঘটনাক্রমে এটি সম্পর্কে কিছুটা অন্তর্দৃষ্টি পেতে এক ধাপ হতে পারে (তবে এই অস্পষ্ট আশা এখানে সত্যই ফলস্বরূপ বলে মনে হয় ...)
গটফ্রিড দীর্ঘ

যাইহোক, আপনি আপনার 32-মূল্যবান সময়-সিরিজ ভাগ করে নিতে মন চাইবেন? আমি গ্রাম ম্যাট্রিক্স দেখাচ্ছে এমন একটি চিত্র সন্নিবেশ করতে চাই এবং এটি সরাসরি আপনার ডেটা দিয়ে করতে পারলাম।
অ্যামিবা

আপনি আমার প্রশ্নে লিঙ্কটি দেখতে পেয়েছেন? এটি একটি ওয়েবপৃষ্ঠায় পুনঃনির্দেশ করে যা আমি এক্সেস.ল ব্যবহার করে তৈরি করেছি এটির 4 বা 5 টি পৃষ্ঠা রয়েছে, যা স্ক্রিনের নীচে ট্যাববারের একটি ক্লিপ দ্বারা আমার ইনস্টলেশনতে "ফায়ারফক্স" দ্বারা নির্বাচনযোগ্য। প্রথম সাবপেজটি তথ্যের তালিকা প্রদর্শন করে। তবে উল্লম্বভাবে: একটি নতুন টেবিলে এটি প্রথম সারির হিসাবে নেওয়া উচিত এবং ডানদিকে সাইকেল চালানোর সময় 31 টি সারি যুক্ত করা উচিত। যদি
গটফ্রিড হেল্মস

ওহ বাহ, আমি বুঝতে পারি নি এটি একটি সম্পূর্ণ অনলাইন স্প্রেডশিট, এবং কেবল একটি স্ক্রিনশট নয়! ধন্যবাদ।
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.