একটি সময় সিরিজ তৈরি করা যাতে প্রতিটি তারিখের জন্য একাধিক পর্যবেক্ষণ অন্তর্ভুক্ত থাকে


11

আমি 10 বছরের সময়কালের মধ্যে ত্রৈমাসিক স্যাম্পলড ডেটা (পশুর বায়োমাস) এ সময়সীমা প্রয়োগ করার চেষ্টা করছি যাতে প্রতি ত্রৈমাসিক 3 টি রেপস থাকে। সুতরাং 40 তারিখগুলি কিন্তু 120 টি সম্পূর্ণ পর্যবেক্ষণ।

আমি শামওয়ে এবং স্টোফারের টাইম সিরিজ বিশ্লেষণে SARIMA'a পর্যন্ত পড়েছি এবং এর অ্যাপ্লিকেশনগুলির পাশাপাশি স্কিমড উডওয়ার্ড, ইত্যাদি। আল। এর প্রয়োগকৃত সময় সিরিজ বিশ্লেষণ, এবং আমার বুঝতে প্রতিটি মডেল সময় সিরিজের প্রতিটি পয়েন্টে একক পর্যবেক্ষণের ভিত্তিতে তৈরি is

প্রশ্ন: আমি কীভাবে আমার মডেলটিতে প্রতিটি পর্যবেক্ষণের প্রকরণকে অন্তর্ভুক্ত করতে পারি? আমি গড়পড়তাভাবে একটি সিরিজ বানাতে পারি, তবে প্রতিটি পর্যবেক্ষণে আমি তারতম্যটি হ্রাস করব এবং আমার মনে হয় যা ঘটছে তা আমার বোঝার পক্ষে এটি গুরুত্বপূর্ণ।


SARIMA মাল্টিভারিয়েট ক্ষেত্রে বাড়ানো যেতে পারে, এটি আপনার পক্ষে উপযুক্ত might এই ক্ষেত্রে কীওয়ার্ডটি ভিএআর হয়। এর অর্থ হ'ল আপনি প্রতিটি সময়ের জন্য একটি সংখ্যার পরিবর্তে সংখ্যার ভেক্টর পর্যবেক্ষণ করেন।
এমপিটিকাস

উত্তর:


4

একটি প্যানেল ডেটা ( উইকিপিডিয়া ) মডেলটি "ত্রৈমাসিকের প্রতি 3 টি রেপস" বলতে কী বোঝাতে চেয়েছেন তার উপর নির্ভর করে may এর অর্থ হ'ল আপনি চতুর্থাংশে তিনটি পরিমাপ নিচ্ছেন, তিনটি স্বতন্ত্র উত্সগুলির মধ্যে একটি যা সময়ের সাথে একই থাকে। আপনার ডেটা এমন কিছু দেখাচ্ছে:

obs quarter value
  A       1   2.2 
  A       2   2.3 
  A       3   2.4 
  B       1   1.8 
  B       2   1.7 
  B       3   1.6 
  C       1   3.3 
  C       2   3.4 
  C       3   3.5 

আপনি যদি এটিই খুঁজছেন তবে প্যানেল ডেটা নিয়ে কাজ করার জন্য বেশ কয়েকটি মডেল রয়েছে। এখানে একটি শালীন উপস্থাপনা যা বুনিয়াদি আর কিছু কভার করে যা আপনি প্যানেল ডেটা দেখার জন্য ব্যবহার করবেন। একনোমেট্রিক্স দৃষ্টিকোণ থেকে এই দস্তাবেজটি আরও কিছুটা গভীরতায় যায়।

তবে, যদি আপনার ডেটা প্যানেল ডেটা পদ্ধতিগুলির সাথে পুরোপুরি ফিট না হয় তবে "পুলড ডেটা" জন্য অন্যান্য সরঞ্জাম উপলব্ধ available এই কাগজ থেকে একটি সংজ্ঞা (পিডিএফ) :

ডেটা পুলিং মানে একাধিক জনসংখ্যার সাথে সম্পর্কিত একাধিক ডেটা উত্স ব্যবহার করে পরিসংখ্যান বিশ্লেষণ। এটিতে গড় গড় তুলনা এবং তথ্যের সাধারণ ব্যাখ্যা রয়েছে। জড়িত ডেটা উত্স এবং জনসংখ্যা একই / অনুরূপ বা পৃথক কিনা তার উপর নির্ভর করে বিভিন্ন পরিস্থিতি এবং সমস্যাগুলিও দেখা দেয়।

যেমন আপনি দেখতে পাচ্ছেন, সেই সংজ্ঞা থেকে, আপনি যে কৌশলগুলি ব্যবহার করতে যাচ্ছেন তা আপনার ডেটা থেকে ঠিক কী শিখতে পারে তার উপর নির্ভরশীল।

আমি যদি আপনার শুরু করার জন্য কোনও স্থান প্রস্তাব করি তবে ধরে নিই যে প্রতিটি ত্রৈমাসিকের জন্য আপনার তিনটি আঁকাগুলি সময়ের সাথে সামঞ্জস্যপূর্ণ, আমি আপনার প্যানেল ডেটা মডেলটির সাথে একটি স্থির প্রতিক্রিয়া হিসাবরক্ষক (এটি অনুমানকারী হিসাবেও পরিচিত) ব্যবহার করে শুরু করব your ডেটা।

আমার উপরের উদাহরণের জন্য, কোডটি এমন কিছু দেখাচ্ছে:

> Panel = data.frame(value=c(2.2,2.3,2.4,1.8,1.7,1.9,3.3,3.4,3.5), 
                     quarter=c(1,2,3,1,2,3,1,2,3), 
                     obs=c("A","A","A","B","B","B","C","C","C"))
> fixed.dum <-lm(value ~ quarter + factor(obs), data=Panel)
> summary(fixed.dum)

যা আমাদের নিম্নলিখিত ফলাফল দেয়:

Call:
lm(formula = value ~ quarter + factor(obs), data = Panel)

Residuals:
         1          2          3          4          5          6          7 
-1.667e-02 -8.940e-17  1.667e-02  8.333e-02 -1.000e-01  1.667e-02 -1.667e-02 
         8          9 
 1.162e-16  1.667e-02 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)   2.13333    0.06055  35.231 3.47e-07 ***
quarter       0.08333    0.02472   3.371 0.019868 *  
factor(obs)B -0.50000    0.04944 -10.113 0.000162 ***
factor(obs)C  1.10000    0.04944  22.249 3.41e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 0.06055 on 5 degrees of freedom
Multiple R-squared: 0.9955, Adjusted R-squared: 0.9928 
F-statistic: 369.2 on 3 and 5 DF,  p-value: 2.753e-06 

এখানে আমরা কোয়ার্টারে চলমান কোয়ার্টারে ভেরিয়েবলের সময় স্পষ্টভাবে দেখতে পাচ্ছি, পাশাপাশি গ্রুপ বি, বা গ্রুপ সি তে থাকা প্রভাব (গ্রুপ এ এর ​​বিপরীতে)।

আশা করি এটি আপনাকে কোথাও সঠিক দিকে নির্দেশ করবে।


3

আমি মনে করি এটি আকর্ষণীয়। আমার পরামর্শটি হ'ল মসৃণ সময় সিরিজটি ফিট করার জন্য তিনটি ডাটা পয়েন্টকে গড়ে গড়ে তোলা হবে। আপনি যখন উল্লেখ করেছেন যে আপনি যদি এটি উপেক্ষা করে থাকেন যে আপনি গড়ে তিনটি পর্যবেক্ষণ করেছেন যা আপনি তথ্য ফেলে দিচ্ছেন। তবে প্রতিটি সময় পয়েন্টের জন্য আপনি গড় থেকে স্কোয়ার বিচ্যুতির যোগ করতে পারেন। সেই সমস্ত স্কোয়ারের সমস্ত সময়কালে পুল করুন এবং n-1 দ্বারা ভাগ করুন যেখানে n গণনায় ব্যবহৃত মোট পয়েন্টের সংখ্যা। আপনার যদি টাইম সিরিজের কাঠামোর (যেমন ট্রেন্ডস, মৌসুমী উপাদান, এআর নির্ভরতা কাঠামো) মডেল থাকে তবে এই গণনাটি মডেলটিতে ত্রুটি শর্তের ভিন্নতার একটি স্বাধীন এবং পক্ষপাতহীন অনুমান হতে পারে।


1
সহজে কার্যকরভাবে কার্যকর এবং তাত্ত্বিকভাবে কার্যকর এমন একটি দরকারী ধারণার জন্য +1। একটি ছোট সংশোধন, যদিও: সময় সময় ধরে মান পালন করা হবে । বৈষম্যের একটি নিরপেক্ষ অনুমানটি সমস্ত স্কোয়ার বিচ্যুতির যোগফলকে বা পরিবর্তে দ্বারা বিভক্ত করবে (উভয়ই একটিতে যথেষ্ট আলাদা এবং ভুল)। খুব সম্ভবত সময়ের সাথে সাথে পৃথক বৈকল্পিক অনুমানগুলি (প্রতিটি সময়কালের জন্য একটি) প্লট করা উচিত, এটি নির্ধারণ করার জন্য যে এটি সমস্তকে এই জাতীয়ভাবে পোড়ানো বৈধ। এন 3 এন 2 এন এন - 1 3 এন - 13nn3n2nn13n1
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.