কীভাবে পরিসংখ্যানগতভাবে দুটি সময়ের সিরিজের তুলনা করবেন?


43

আমার দুটি টাইম সিরিজ রয়েছে, যা নীচের চক্রান্তে দেখানো হয়েছে:

সময় সিরিজ প্লট

প্লটটি উভয় সময়ের সিরিজের পুরো বিশদ প্রদর্শন করছে, তবে প্রয়োজনে আমি সহজেই এটি কাকতালীয় পর্যবেক্ষণগুলিতে সহজেই হ্রাস করতে পারি।

আমার প্রশ্নটি: সময় সিরিজের পার্থক্যগুলি মূল্যায়নের জন্য আমি কোন পরিসংখ্যানমূলক পদ্ধতিগুলি ব্যবহার করতে পারি?

আমি জানি এটি মোটামুটি বিস্তৃত এবং অস্পষ্ট প্রশ্ন, তবে আমি এর কোথাও খুব বেশি প্রারম্ভিক উপাদান খুঁজে পাচ্ছি না। আমি এটি দেখতে পাচ্ছি, মূল্যায়ন করার জন্য দুটি স্বতন্ত্র জিনিস রয়েছে:

1. মান কি একই?

2. প্রবণতাগুলি কি একই রকম?

এই প্রশ্নগুলি মূল্যায়নের জন্য আপনি কোন ধরণের পরিসংখ্যানগত পরীক্ষা দেখার পরামর্শ দিচ্ছেন? প্রশ্ন 1 এর জন্য আমি স্পষ্টতই বিভিন্ন ডেটাসেটের মাধ্যমগুলি মূল্যায়ন করতে পারি এবং বিতরণে উল্লেখযোগ্য পার্থক্যগুলি সন্ধান করতে পারি, তবে এমন কি এমন কোনও উপায় আছে যা ডেটার সময়-সিরিজের প্রকৃতিটিকে বিবেচনা করে?

প্রশ্ন 2 - এর জন্য মান-কেন্ডাল পরীক্ষার মতো কিছু আছে যা দুটি ট্রেন্ডের মধ্যে মিল খুঁজে পায়? আমি উভয় ডেটাসেটের জন্য ম্যান-কেন্ডাল পরীক্ষা করতে পারি এবং তুলনা করতে পারি, তবে আমি জানি না যে এটি করার একটি কার্যকর উপায় কিনা, বা আরও ভাল উপায় আছে কিনা?

আমি আর এ সবই করছি, সুতরাং যদি আপনার প্রস্তাবিত পরীক্ষাগুলিতে কোনও আর প্যাকেজ থাকে তবে দয়া করে আমাকে জানান।


9
এই সিরিজের মধ্যে গুরুত্বপূর্ণ পার্থক্য কী হতে পারে তা প্লটটি অস্পষ্ট করে: এটি বিভিন্ন ফ্রিকোয়েন্সিগুলিতে নমুনাযুক্ত হতে পারে। কালো লাইনটি (অ্যারোনেট) প্রায় 20 বার এবং লাল রেখা (দৃশ্যমানতা) কয়েকবার বা তারও বেশি সময় স্যাম্পলড বলে মনে হচ্ছে। আর একটি সমালোচনামূলক কারণ নমুনা নিয়মিত হওয়া বা এর অভাব হতে পারে: অ্যারোনেট পর্যবেক্ষণের মধ্যে সময়টি কিছুটা আলাদা হয় বলে মনে হয়। সাধারণভাবে, এটি সংযোগকারী রেখাগুলি মুছে ফেলতে এবং সত্যিকারের তথ্যের সাথে সম্পর্কিত কেবলমাত্র পয়েন্টগুলি প্রদর্শন করতে সহায়তা করে, যাতে দর্শক এই জিনিসগুলিকে দর্শনীয়ভাবে নির্ধারণ করতে পারে।
শুক্র

অসম ব্যবধানে সময় সিরিজের বিশ্লেষণের জন্য এখানে পাইথন লাইব্রেরি রয়েছে।
কেজেটিল বি হালওয়ারসন

উত্তর:


27

অন্যরা যেমন বলেছে, আপনার পরিমাপের একটি সাধারণ ফ্রিকোয়েন্সি থাকা প্রয়োজন (অর্থাত পর্যবেক্ষণের মধ্যে সময়)। সেই জায়গায় আমি এমন একটি সাধারণ মডেল সনাক্ত করব যা যুক্তিযুক্তভাবে প্রতিটি সিরিজকে আলাদাভাবে বর্ণনা করবে। এটি একটি আরিমা মডেল বা সম্ভাব্য লেভেল শিফট বা উভয় মেমরি (এআরআইএমএ) এবং ডামি ভেরিয়েবলগুলিকে একীভূত করার একটি সমন্বিত মডেল সহ একাধিক-ট্রেন্ডেড রিগ্রেশন মডেল হতে পারে। এই সাধারণ মডেলটি দুটি সিরিজের প্রতিটিটির জন্য বিশ্বব্যাপী এবং পৃথকভাবে অনুমান করা যেতে পারে এবং তারপরে প্যারামিটারগুলির একটি সাধারণ সেটের অনুমানটি পরীক্ষা করার জন্য একটি এফ পরীক্ষা তৈরি করতে পারে।


1
ভাল, আপনার উভয় সিরিজের জন্য একই ফ্রিকোয়েন্সি থাকার দরকার নেই। এটি কেবলমাত্র এতটাই ভাড়া যে অন্যান্য মামলার জন্য খুব কম সফ্টওয়্যার রয়েছে, তবে ট্রেসস.ড্রেডহেডসস.আইও / এএন / স্লেস্ট দেখুন । মনে হচ্ছে অনেক জ্যোতির্বিদ্যা পত্রিকা এবং অর্থ ও ভূপদার্থবিদ্যা অন্যান্য মামলা সম্পর্কে pubslihed হয় মত ... মধ্যে refs দেখতে en.wikipedia.org/wiki/Unevenly_spaced_time_series
kjetil খ halvorsen

12

grangertest()সবচেয়ে কম গ্রন্থাগারের মধ্যে বিবেচনা করুন ।

এক সময়ের সিরিজ অন্যটি পূর্বাভাস দেওয়ার ক্ষেত্রে কার্যকর কিনা তা দেখার পরীক্ষা।

আপনাকে শুরু করার জন্য একটি দম্পতি উল্লেখ:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
আপনাকে গ্রেঞ্জারে ফিট করার জন্য প্রয়োজনীয় পরামিতিগুলির তুলনায় <10 ডেটাপয়েন্ট সহ তার নমুনার আকার খুব ছোট হবে।
জেস

1
@ ফিওন, আপনার উত্তরের লিঙ্কগুলি মারা গেছে। আপনি আপনার উত্তর আপডেট করতে পারেন?
জোশিপোভিচ

0

সবেমাত্র এদিকে এসেছিল। আপনার প্রথম উত্তর আমাদের দুটি ষড়যন্ত্র একইভাবে স্কেল করে (সময় অনুসারে) পার্থক্যটি দৃষ্টিভঙ্গি দেখতে। আপনি এটি করেছেন এবং সহজেই দেখতে পাচ্ছেন কিছু সুস্পষ্ট পার্থক্য রয়েছে। পরবর্তী পদক্ষেপটি হ'ল সহজ পারস্পরিক সম্পর্ক বিশ্লেষণ ... এবং দেখুন পারস্পরিক সম্পর্ক সহগ (আর) ব্যবহার করে তারা কতটা ভাল সম্পর্কিত। আরআর যদি ছোট হয় তবে উপসংহারটি হ'ল এগুলি দুর্বলভাবে সম্পর্কিত এবং তাই কোনও পছন্দসই তুলনা এবং বৃহত্তর মান যদি আর দুটি সিরিজের মধ্যে ভাল তুলনা করার পরামর্শ দেয়। তৃতীয় ধাপে যেখানে ভাল সম্পর্ক রয়েছে তা হ'ল r এর পরিসংখ্যানগত তাত্পর্য পরীক্ষা করা। এখানে আপনি শাপিরো ওয়েলচ পরীক্ষাটি ব্যবহার করতে পারেন যা ধরে নেবে যে দুটি সিরিজ সাধারণত বিতরণ করা হয় (নাল অনুমান) বা না (বিকল্প অনুমান)। আপনি করতে পারেন এমন অন্যান্য পরীক্ষাগুলি রয়েছে তবে আশা করি আমার উত্তরটি সহায়তা করে।


1
সময় সিরিজের তুলনা করার সময় এটি স্বতঃসংশোধন এবং সম্ভবত সময় সিরিজের মডেলগুলির উপযুক্ত। যেমন আরিমা মডেলগুলি যা তারা কতটা অনুরূপ তা নির্ধারণ করতে সহায়তা করতে পারে। একই স্টোকাস্টিক প্রক্রিয়ার দুটি উপলব্ধিগুলি প্লট করার সময় অগত্যা একইরকম লাগে না।
মাইকেল চেরনিক

-2

পলিফিট ব্যবহার করে সময় সিরিজের সংকেত উভয়কেই একটি সরলরেখায় ফিট করুন। তারপরে উভয় লাইনের জন্য রুট-গড়-স্কোয়ার-ত্রুটি (আরএমএসই) গণনা করুন। লাল-রেখার জন্য প্রাপ্ত মান ধূসর রেখার জন্য প্রাপ্ত চেয়ে অনেক কম হবে।

কিছু সাধারণ ফ্রিকোয়েন্সি পড়ুন ings


2
ক্রস ভ্যালিটেডে আপনাকে স্বাগতম এবং আপনার প্রথম উত্তরের জন্য ধন্যবাদ! তবে আমি উদ্বিগ্ন যে আপনি সরাসরি প্রশ্নের উত্তর দিচ্ছেন না - প্রস্তাবিত পদ্ধতির মূল্যায়ন এবং / বা প্রবণতাগুলি একইরকম কিনা তা নির্ধারণে জিজ্ঞাসাবাদকে ঠিক কীভাবে সহায়তা করবে?
মার্টিন Modrák
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.