আর-তে কোনও সময়ের সিরিজের স্বচ্ছতা পরিমাপ করবেন কীভাবে?


25

আর-তে কোনও টাইম সিরিজের স্বচ্ছতা পরিমাপ করার জন্য কি কোনও ভাল উপায় আছে? উদাহরণ স্বরূপ,

-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0

তুলনায় অনেক মসৃণ

-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0

যদিও তাদের একই গড় এবং স্ট্যান্ডার্ড বিচ্যুতি রয়েছে। একটি টাইম সিরিজে আমাকে একটি মসৃণ স্কোর দেওয়ার জন্য যদি কোনও ফাংশন থাকে তবে এটি দুর্দান্ত হবে।


4
স্টোকাস্টিক প্রসেসগুলির তত্ত্বে স্মুথনের একটি সুস্পষ্ট সংজ্ঞা দেওয়া অর্থ রয়েছে। ( "একটি variogram পরিসংখ্যানগতভাবে ভিত্তিক, পরিমাণগত, একটি পৃষ্ঠ এর বন্ধুরতা বিবরণ": goldensoftware.com/variogramTutorial.pdf ।, পি 16.) স্নিগ্ধতা সঙ্গে সম্পর্কযুক্ত বহির্পাতন শূন্য দূরে variogram করুন। (ধারাবাহিক পার্থক্যের এসডি এবং ল্যাগ-ওন স্বতঃসংশোধন এটির দ্রুত এবং নোংরা সংস্করণ)। প্রয়োজনীয় তথ্য 0 এ টেলর সিরিজের সহগগুলিতে অন্তর্ভুক্ত রয়েছে Eg 0-তে একটি হাই-অর্ডার শূন্য একটি খুব মসৃণ সিরিজ নির্দেশ করে।
whuber

আমি খুব ঘৃণ্য অভিযানের কথা শুনেছি ।
টেলর

কত মজার, আমি নিজেও এই একই জিনিসটি ভাবছিলাম। পোস্ট করার জন্য ধন্যবাদ!
ক্রিস বিলি

@ শুভ: এটি একটি উত্তর, মন্তব্য নয়।
nnot101

@ নুন্ত ১০১১ আমি নম্রভাবে পৃথক হতে অনুরোধ করছি: আমার মন্তব্য একটি সম্পর্কিত পরিস্থিতি অ্যাপ্রোপস এবং এটি কেবল স্থানিক ডেটা মডেল করার জন্য ব্যবহৃত তাত্ত্বিক প্রক্রিয়াটিকে বোঝায়, আসলে কীভাবে এই মসৃণতার অনুমান করা যায় তা নয়। এই অনুমানের একটি শিল্প আছে যার সাথে আমি একাধিক মাত্রায় পরিচিত, তবে একটিতে নয়, যা বিশেষ (সময়ের তীরের দিকনির্দেশনার কারণে), তাই আমি দাবি করতে দ্বিধা করি যে বহুমাত্রিক পদ্ধতিটি সময় সিরিজে প্রয়োগ করা মোটেও প্রচলিত বা এমনকি একটি ভাল পদ্ধতির।
whuber

উত্তর:


22

পার্থক্যগুলির স্ট্যান্ডার্ড বিচ্যুতি আপনাকে মোটামুটি মসৃণতার অনুমান দেবে:

x <- c(-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0)
y <- c(-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0)
sd(diff(x))
sd(diff(y))

আপডেট: সায়ান যেমন উল্লেখ করেছেন, এটি আপনাকে স্কেল নির্ভর নির্ভর পরিমাপ দেয়। একটি অনুরূপ স্কেল-স্বতন্ত্র মাপ স্ট্যান্ডার্ড বিচ্যুতি পরিবর্তনের পরিবর্তনের সহগ ব্যবহার করবে:

sd(diff(x))/abs(mean(diff(x)))
sd(diff(y))/abs(mean(diff(y)))

উভয় ক্ষেত্রেই, ছোট মানগুলি মসৃণ সিরিজের সাথে মিলে যায়।


1
এই স্কোরটি স্কেল-ইনগ্রায়েন্ট নয়, যা প্রয়োগের উপর নির্ভর করে বোধগম্য হতে পারে বা নাও পারে। (এবং আমার নিজের প্রস্তাবনা হয় তাই একই উদ্বেগ এটা প্রযোজ্য, স্কেল-পরিবর্তিত।) এছাড়া, এটিও এর ইশারা মূল্য যে উপরোক্ত স্কোর জন্য ছোট মান বাধামুক্ত সময় সিরিজ ইঙ্গিত দেয়।
সায়ান

1
ধন্যবাদ @ সায়ান আমি এখন একটি স্কেল-স্বতন্ত্র সংস্করণও যুক্ত করেছি।
রব হেন্ডম্যান

2
আপনি কি সত্যই ডিনোনিটরে অন্তর্ভুক্ত করতে চান diff? মানগুলি বীজগণিতভাবে হ্রাস পাবে (x[n]-x[1])/(n-1)যা প্রবণতার একটি (অশোধিত) পরিমাপ এবং অনেক ক্ষেত্রে শূন্যের খুব কাছাকাছি হওয়া উচিত, যার ফলস্বরূপ একটি অস্থিতিশীল এবং ভয়াবহ অর্থবহ পরিসংখ্যান নয়। আমি এতে অবাক হয়েছি, তবে সম্ভবত আমি কিছু স্পষ্টতই উপেক্ষা করছি ...
শুক্রবার

1
আমি diffস্থিরত্বের অনুমান এড়াতে চাইতাম । যদি এটি ডিনোমিনেটরের সাথে সংজ্ঞায়িত করা হয় abs(mean(x))তবে xস্থির থাকাকালীন স্কেলিংটি কেবল তখনই কাজ করবে । ডিফস গ্রহণের অর্থ এটি পৃথক স্থিতিশীল প্রক্রিয়াগুলির জন্যও কাজ করবে। অবশ্যই, ভিন্নতাগুলি xস্থির না করে এবং তারপরেও সমস্যা রয়েছে। স্কেলিং টাইম সিরিজ এই কারণে জটিল। তবে আমি স্থিতিশীলতা সম্পর্কে আপনার বক্তব্য। আমি মনে করি আরও ভাল কিছু করার জন্য যথেষ্ট পরিশীলিত কিছু প্রয়োজন হবে --- উদাহরণস্বরূপ একটি ননপ্যারমেট্রিক স্মুথ ব্যবহার করে।
রব হ্যান্ডম্যান

1
আমি ভাবতাম যে একটি ধ্রুবক প্রবণতা পুরোপুরি মসৃণ হওয়া উচিত, সুতরাং উত্তরটি 0 হওয়া উচিত
রব হেন্ডম্যান

13

লেগ-ওয়ান স্বতঃসংশোধন একটি স্কোর হিসাবে পরিবেশন করবে এবং যুক্তিসঙ্গত সোজাসাপ্টা পরিসংখ্যানগত ব্যাখ্যাও রয়েছে।

cor(x[-length(x)],x[-1])

স্কোর ব্যাখ্যা:

  • 1 এর কাছাকাছি স্কোরগুলি সহজেই বিভিন্ন ধরণের সিরিজ বোঝায়
  • ০ এর কাছাকাছি স্কোরগুলি বোঝায় যে কোনও ডাটা পয়েন্ট এবং নিম্নলিখিতটির মধ্যে সামগ্রিক রৈখিক সম্পর্ক নেই (অর্থাত্ প্লট (x [দৈর্ঘ্য (x)], x [-1]) কোনও স্পষ্টতুল্য বর্ণের সাথে একটি স্ক্র্যাটারপ্লট দেবে না)
  • -1 এর কাছাকাছি স্কোরগুলি নির্দেশ করে যে সিরিজটি একটি নির্দিষ্ট উপায়ে ঝাঁকুনি দেওয়া হয়েছে: যদি একটি বিন্দু গড়ের উপরে থাকে তবে পরেরটি প্রায় একই পরিমাণে গড়ের নীচে থাকে এবং বিপরীত হয়।

0

আপনি কেবল টাইমস্টেপ নম্বরটির সাথে পারস্পরিক সম্পর্ক পরীক্ষা করতে পারেন। এটি টাইমসারিগুলিতে একটি সাধারণ লিনিয়ার রিগ্রেশন এর আর² নেওয়ার সমতুল্য। নোট করুন, যদিও, এটি দুটি খুব আলাদা টাইমসিরিজ, সুতরাং আমি জানি না যে এটি তুলনা হিসাবে কতটা ভাল কাজ করে।


4
এটি সময়ের সাথে রৈখিকতার একটি পরিমাপ হবে, তবে মসৃণতার নয়।
রব হেন্ডম্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.