সহজ সংস্করণটি হ'ল যে কোনও দুটি ভেরিয়েবল যা সময়ের সাথে সাথে এক দিকের পরিবর্তনের প্রবণতা দেখা দেয় সেগুলির মধ্যে কোনও সংযোগ আছে কিনা তা পরস্পর সম্পর্কযুক্ত বলে মনে হবে। নিম্নলিখিত পরিবর্তনশীল বিবেচনা করুন:
set.seed(1)
time = seq(from=1, to=100, by=1)
x = .5 + .3*time + rnorm(100)
y1 = 3 + .3*time + rnorm(100)
y2 = 7 + .1*time + .8*x + rnorm(100)
হল সময় মাত্র একটি ফাংশন, হিসাবে ওয়াই 1 । y 2 সময় এবং এক্স উভয়েরই ফাংশন। বিন্দুটি কোড থেকে সনাক্ত করা যায় যে x এবং y 2 এর মধ্যে সত্যই একটি সম্পর্ক রয়েছেএবং x এবং y 1 এর মধ্যে কোনও সম্পর্ক নেই। এখন নীচের চিত্রটি দেখুন, তিনটি লাইনই ভয়ঙ্করভাবে অনুরূপ দেখাচ্ছে, তাই না?এক্সY1Y2এক্সএক্সY2এক্সY1
আর2এক্সY1আর2এক্সY2এক্সY1এক্সY2সুতরাং, আমরা কীভাবে নিখুঁত উপস্থিতি থেকে বাস্তবকে আলাদা করতে পারি? এখানেই ভিন্নতা আসে any যে কোনও দুটি ভেরিয়েবলের জন্য, যেহেতু তারা উভয়ই সময়ের সাথে সাথে যেতে থাকে, এটি খুব তথ্যবহুল নয়, তবে একটি নির্দিষ্ট পরিমাণে বেড়ে যায়, তা কি আমাদের জানায় যে অন্যটি কতটা উপরে যায়? পার্থক্য আমাদের সেই প্রশ্নের উত্তর দিতে দেয়। নিম্নলিখিত দুটি চিত্র নোট করুন, স্ক্রেটারপ্লটগুলি আমি তিনটি ভেরিয়েবলকে আলাদা করার পরে তৈরি করেছিলাম।
এক্সY2R2=.43xy1R2=.07R2
কিছু অন্যান্য বিষয়: পরিসংখ্যানগুলিতে, আমি একটি বিষয় উল্লেখ করছি যে এগুলি যুগপত পরিবর্তনগুলি। এতে কোনও ভুল নেই এবং আমি সমস্যাটি সেট আপ করার পদ্ধতিটি অনুসরণ করে, তবে সাধারণত লোকেরা কিছুটা পিছনে প্রভাব নিয়ে আগ্রহী। (এটি হ'ল, সময়ে এক পর্যায়ে একটি জিনিসে পরিবর্তন পরবর্তী সময়ে অন্য কোনও পরিবর্তনের দিকে পরিচালিত করে)) দ্বিতীয়ত, আপনি আপনার সিরিজের কোনওটির লগ নেওয়ার কথা উল্লেখ করেছেন। লগটি নেওয়া আপনার ডেটা স্তর থেকে হারে সরিয়ে দেয়। এবং এইভাবে, যখন আপনি পার্থক্য করেন, আপনি স্তরগুলির পরিবর্তে হারের পরিবর্তনের দিকে লক্ষ্য করছেন। এটি খুব সাধারণ, তবে আমি আমার প্রদর্শনীতে সেই উপাদানটি অন্তর্ভুক্ত করি নি; আমি আলোচিত ইস্যুগুলির কাছে এটি অর্থেগোনাল। সবশেষে, আমি স্বীকার করতে চাই যে সময় প্রদর্শন সিরিজের ডেটা প্রায়শই আমার জটিলতার চেয়ে জটিল হয়।