আর বনাম এক্সেলে স্বতঃসংশোধনের সূত্র


13

আমি কীভাবে আর-কে লেগ-কে স্বতঃসংশোধনগুলি গণনা করে (এটি দৃশ্যত মিনিতাব এবং এসএএস দ্বারা ব্যবহৃত একই সূত্র) তা নির্ধারণ করার চেষ্টা করছি, যাতে আমি সিরিজের এবং এর কে-লেগড সংস্করণে প্রয়োগ হওয়া এক্সেলের CORREL ফাংশনটি ব্যবহার করে এটি তুলনা করতে পারি। আর এবং এক্সেল (CORREL ব্যবহার করে) কিছুটা আলাদা স্ব-সংশোধন মান দেয়।

আমি আরও জানতে আগ্রহী যে একটি গণনা অপরটির চেয়ে বেশি সঠিক কিনা।


Rএর সূত্রটি আরও বিশ্লেষণ করা হয়েছে এবং stats.stackexchange.com/questions/81754/… এ ব্যাখ্যা করা হয়েছে
whuber

উত্তর:


17

সঠিক সমীকরণটি এখানে দেওয়া হয়েছে: ভেনেবলস, ডাব্লুএন এবং রিপলি, বিডি (২০০২) এসএস এর চতুর্থ সংস্করণ সহ আধুনিক প্রয়োগিত পরিসংখ্যান। স্প্রিঙ্গের-ভার্ল্যাগ। আমি আপনাকে একটি উদাহরণ দেব:

### simulate some data with AR(1) where rho = .75
xi <- 1:50
yi <- arima.sim(model=list(ar=.75), n=50)

### get residuals
res <- resid(lm(yi ~ xi))

### acf for lags 1 and 2
cor(res[1:49], res[2:50])      ### not quite how this is calculated by R
cor(res[1:48], res[3:50])      ### not quite how this is calculated by R

### how R calculates these
acf(res, lag.max=2, plot=F)

### how this is calculated by R
### note: mean(res) = 0 for this example, so technically not needed here
c0 <- 1/50 * sum( (res[1:50] - mean(res)) * (res[1:50] - mean(res)) ) 
c1 <- 1/50 * sum( (res[1:49] - mean(res)) * (res[2:50] - mean(res)) ) 
c2 <- 1/50 * sum( (res[1:48] - mean(res)) * (res[3:50] - mean(res)) ) 
c1/c0
c2/c0

এবং এইভাবে (যেমন, res[1:47]এবং পিছিয়ে res[4:50]3)


ধন্যবাদ ওল্ফগ্যাং! আমি ঠিক এটিই খুঁজছিলাম। এখন আমি এটিকে এক্সেলের মাধ্যমে চেষ্টা করতে এবং প্রতিলিপি করতে পারি (আমার শিক্ষার্থীরা যারা কেবল এক্সেল ব্যবহার করেন) for
গ্যালিট শমুয়েলই

11

অটোর সংযোগ গণনা করার সহজ উপায় (এবং সম্ভবত এক্সেল কী ব্যবহার করে) ভেক্টরের 2 টি অনুলিপি তৈরি করে তারপরে প্রথম অনুলিপি থেকে প্রথম এন উপাদানগুলি এবং দ্বিতীয় অনুলিপি থেকে শেষ এন উপাদানগুলি সরিয়ে ফেলুন (যেখানে এন ল্যাগটি আপনি হ'ল থেকে কম্পিউটিং করা হয়)। তারপরে পারস্পরিক সম্পর্ক গণনা করতে ফাংশনে সেই 2 ভেক্টরকে পাস করুন। এই পদ্ধতিটি ঠিক আছে এবং একটি যুক্তিসঙ্গত উত্তর দেবে, তবে এটি যে দুটি ভেক্টরকে তুলনা করা হচ্ছে এটি একই জিনিসটির পদক্ষেপগুলি সত্য তা উপেক্ষা করে।

উন্নত সংস্করণ (ওল্ফগ্যাং দ্বারা প্রদর্শিত হিসাবে) নিয়মিত পারস্পরিক সম্পর্কের অনুরূপ ফাংশন ব্যতীত, এটি গড় এবং বৈকল্পিক গণনার জন্য পুরো ভেক্টর ব্যবহার করে।


3
অন্য পার্থক্যটি হ'ল 1 / n এর পরিবর্তে 1 / (এনকে) এর পরিবর্তে যেখানে এন সিরিজের দৈর্ঘ্য এবং কে ল্যাগের সংখ্যা। এটি স্বতঃসংশ্লিষ্ট ম্যাট্রিক্স ইতিবাচক সুনিশ্চিত তা নিশ্চিত করার জন্য।
রব হ্যান্ডম্যান

1
@ রব: আমি বিশ্বাস করি যে এক্সেলের CORREL সূত্রটি n ব্যবহার করে (এন কে এর পরিবর্তে) does উদাহরণস্বরূপ, লেগ -১ এসিএফ-এর জন্য আপনি একই ফলাফল পেয়েছেন (ওল্ফগ্যাংয়ের স্বরলিপি ব্যবহার করে) আপনি যদি কভার ব্যবহার করেন (আর [1:49], রেস [2:50]) / (এসটিডিইভিপি (পুনরায় [1:49]) * এসটিডিইভিপি (পুনরায় [2:50])) এবং COVAR এবং STDEVP ফাংশনগুলি হ'ল "জনসংখ্যা" পরিসংখ্যান।
গ্যালিট শমুয়েলই

@Galit। এমনকি COVAR এবং STDEVP ব্যবহার করেও আপনার কোডের ডিনোমিনেটর 49 হবে, তবে স্বতঃসংশোধনের পছন্দসই সংজ্ঞা 50 টি ব্যবহার করবে
রব হ্যান্ডম্যান

1
1 / এন বনাম 1 / (এন কে) পয়েন্ট উপরের অন্যান্য পয়েন্টগুলি ছাড়াও বোঝার জন্য ভাল। তবে ব্যবহারিক / পর্যবেক্ষণ সংখ্যার জন্য এটি যতক্ষণ না এটি সুসংগত হিসাবে বিবেচ্য হবে না, যেহেতু এই পদটি সংখ্যার এবং বিভাজন উভয় ক্ষেত্রেই প্রদর্শিত হবে এটি বাতিল হয়ে যাবে। অঙ্ক এবং ডিনোমিনেটরে বিভিন্ন ভগ্নাংশ ব্যবহার করা হলে আপনি সমস্যা পেতে পারেন।
গ্রেগ স্নো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.