টাইম সিরিজে হারিয়ে যাওয়া তথ্য কীভাবে পূরণ করবেন?


16

আমার কাছে দূষণের ডেটাগুলির একটি বিশাল সেট রয়েছে যা 2 বছর ধরে প্রতি 10 মিনিটে রেকর্ড করা হয়, তবে তথ্যগুলিতে অনেকগুলি ফাঁক রয়েছে (কিছু কিছু যা একসাথে কয়েক সপ্তাহের জন্য যায়)।

রাতের তুলনায় ডেটাটি বেশ মৌসুমী বলে মনে হয় এবং দিনের বেলাতে একটি বিশাল পার্থক্য রয়েছে যেখানে মানগুলির মধ্যে খুব বেশি প্রকরণ নেই এবং ডেটা পয়েন্টগুলি কম are

আমি দিন এবং রাতের সময় উপচ্ছেদে পৃথকভাবে একটি লোস মডেল ফিট করার বিষয়টি বিবেচনা করেছি (যেহেতু তাদের মধ্যে সুস্পষ্ট পার্থক্য রয়েছে) এবং তারপরে নিখোঁজ হওয়া ডেটার মানগুলি পূর্বাভাস দেওয়া এবং এই পয়েন্টগুলি পূরণ করা।

আমি ভাবছিলাম যে এটি কি এই সমস্যাটির কাছে পৌঁছানোর উপযুক্ত উপায় এবং যদি পূর্বাভাসিত পয়েন্টগুলির মধ্যে স্থানীয় প্রকরণটি যুক্ত করার দরকার হয় তবে।

উত্তর:


20

উত্তরটি আপনার অধ্যয়নের নকশার উপর নির্ভর করবে (উদাঃ, ক্রস-বিভাগীয় সময় সিরিজ? কোহোর্ট টাইম সিরিজ, সিরিয়াল কোহোর্টস টাইম সিরিজ?)। হোনেকার এবং কিং এমন একটি ধারণা তৈরি করেছেন যা ক্রস-বিভাগীয় সময় সিরিজের জন্য কার্যকর (আপনার অনুমানের উপর নির্ভর করে সিরিয়াল কোহোর্টস টাইম সিরিজের জন্য সম্ভবত কার্যকর) এই জাতীয় ডেটা বোঝার জন্য আর প্যাকেজ অ্যামেলিয়া II সহ II ইতিমধ্যে স্প্রেট এন্ড কো। একটি ভিন্ন পদ্ধতির বর্ণনা দিয়েছেন যা কিছু সংঘবদ্ধ সময় সিরিজের ডিজাইনে ব্যবহার করা যেতে পারে তবে এটি সফ্টওয়্যার বাস্তবায়নের ক্ষেত্রে খুব কম।

একটি ক্রস বিভাগীয় সময় সিরিজ নকশা (ওরফে প্যানেল অধ্যয়ন নকশা) এক যা জনসংখ্যা (গুলি) (হয়) বারবার নমুনা হয় (যেমন, প্রতি বছর), একই গবেষণায় প্রোটোকল ব্যবহার করছে (যেমন, একই ভেরিয়েবল, যন্ত্র, ইত্যাদি )। যদি স্যাম্পলিং কৌশলটি প্রতিনিধি হয় তবে এই ধরণের ডেটা অধ্যয়নের প্রতিটি জনগোষ্ঠীর জন্য সেই ভেরিয়েবলগুলির বিতরণের একটি বার্ষিক চিত্র (অংশগ্রহণকারী বা বিষয় অনুযায়ী একটি পরিমাপ) উত্পাদন করে।

একটি দল সময় সিরিজ নকশা (ওরফে পুনরাবৃত্তি দল অধ্যয়ন নকশা, অনুদৈর্ঘ্য অধ্যয়ন নকশা, মাঝে মাঝে একটি প্যানেল অধ্যয়ন নকশা বলা হয়) এক যা বিশ্লেষণ পৃথক ইউনিট একবার নমুনা এবং সময় একটি দীর্ঘ সময়কাল ধরে অনুসৃত হয়। এক বা একাধিক জনগোষ্ঠীর প্রতিনিধি ফ্যাশনে ব্যক্তিদের নমুনা দেওয়া যেতে পারে। যাইহোক, একটি প্রতিনিধি দলবদ্ধ সময় সিরিজের নমুনা লক্ষ্য জনসংখ্যার (কমপক্ষে মানুষের জনসংখ্যায়) যত বেশি লোক জন্মগ্রহণ করে বা বৃদ্ধ বয়সে জন্মগ্রহণ করে এবং এর মধ্য দিয়ে মারা বা বৃদ্ধ হয় তার কারণ হিসাবে লক্ষ্য জনসংখ্যার ক্রমবর্ধমান দরিদ্র প্রতিনিধি হয়ে উঠবে along অভিবাসন এবং হিজরত সহ।

একটি ক্রমিক দল সময় সিরিজ নকশা (ওরফে পুনরাবৃত্তি, মাল্টি-, এবং একাধিক দল, অথবা প্যানেল অধ্যয়ন নকশা) এক যা জনসংখ্যা (গুলি) (হয়) বারবার নমুনা হয় (যেমন, প্রতি বছর), একই গবেষণায় প্রোটোকল ব্যবহার (হয় উদাহরণস্বরূপ, একই ভেরিয়েবল, যন্ত্র ইত্যাদি), যা পরিবর্তনের হারের ব্যবস্থার ব্যবস্থা করার জন্য পিরিয়ডের সময়ে (যেমন, বছরের সময়কালে) একটি জনসংখ্যার মধ্যে পৃথক বিশ্লেষণের পৃথক ইউনিটগুলি পরিমাপ করে। যদি নমুনা কৌশলটি প্রতিনিধি হয় তবে এই ধরণের ডেটা অধ্যয়নের প্রতিটি জনগণের জন্য সেই পরিবর্তনশীলগুলির পরিবর্তনের হারের বার্ষিক চিত্র উত্পন্ন করে।

রেফারেন্সস
হোনেকার, জে এবং কিং, জি। (2010) টাইম-সিরিজ ক্রস-বিভাগের ডেটাতে অনুপস্থিত মানগুলি সম্পর্কে কী করবেনআমেরিকান জার্নাল অফ পলিটিকাল সায়েন্স , 54 (2): 561–581।

স্প্রেট, এম।, কার্পেন্টার, জে।, স্টের্ন, জেএসি, কার্লিন, জেবি, হেরন, জে।, হেন্ডারসন, জে।, এবং টিলিং, কে। (2010)। অনুদৈর্ঘ্য গবেষণায় একাধিক নিন্দা জন্য কৌশলআমেরিকান জার্নাল অফ এপিডেমিওলজি , 172 (4): 478–4876।


ধন্যবাদ তোমার উত্তরের জন্য. আমি কেবল ভাবছিলাম যে আপনি বিভিন্ন ধরণের টাইম সিরিজ (কোহোর্ট, ক্রস-বিভাগীয় ইত্যাদি) সংজ্ঞায়িত করতে পারেন কারণ আমি এই ধরণের গবেষণার তুলনায় তুলনামূলকভাবে নতুন এবং এই শর্তগুলি পূর্বে না এসে পৌঁছেছি।
জেমস 131

@ Jamesm131 আমার সম্পাদিত উত্তর দেখুন।
অ্যালেক্সিস

7

তুমি ব্যবহার করতে পার আর-তে ইমপুটটিএস প্যাকেজটি । আমি বিশ্বাস করি আপনি যে ডেটাতে কাজ করছেন তা ইউনিফেরিয়েট টাইম সিরিজ imp ইমপুটটিএস প্যাকেজটি (অবিচ্ছিন্ন) সময় সিরিজের প্রতিস্থাপনে বিশেষী। এটি বিভিন্ন ইম্পিউটেশন অ্যালগরিদম বাস্তবায়ন প্রস্তাব করে। অভিব্যক্তির অ্যালগরিদমের বাইরেও প্যাকেজটি হারিয়ে যাওয়া ডেটা পরিসংখ্যানের প্লটিং এবং মুদ্রণ ফাংশন সরবরাহ করে। ভাল আমি আপনাকে মূল্যবান মূল্যবোধের জন্য রাজ্য স্পেস মডেলগুলি সন্ধান করার পরামর্শ দিচ্ছি his এই প্যাকেজটি আপনাকে আপনার বিশ্লেষণে সহায়তা করবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.