আমি যখন একটি এআর (1) দিয়ে এলোমেলো হাঁটার অনুমান করি তখন সহগ খুব 1 এর কাছে তবে সবসময় কম থাকে less
গুণাগুলি একের চেয়ে বড় না হওয়ার কারণটি কী?
আমি যখন একটি এআর (1) দিয়ে এলোমেলো হাঁটার অনুমান করি তখন সহগ খুব 1 এর কাছে তবে সবসময় কম থাকে less
গুণাগুলি একের চেয়ে বড় না হওয়ার কারণটি কী?
উত্তর:
আমরা ওএলএস দ্বারা অনুমান করি যে মডেল
টি টি আকারের নমুনার জন্য, অনুমানক
সত্যিকারের ডেটা উত্পন্ন করার পদ্ধতিটি যদি খাঁটি এলোমেলো হাঁটা হয় তবে এবং
OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মূল্নির্ধারক নমুনা বিতরণ, বা equivalently, নমুনা বন্টন ρ - 1 , প্রতিসম প্রায় শূন্য নয়, বরং শূন্য বাঁদিকে স্কিউ হয়, সঙ্গে ≈ 68 প্রাপ্ত মূল্যবোধের% (অর্থাত ≈ সম্ভাব্যতা ভর) নেতিবাচক হচ্ছে, এবং তাই আমরা আরো বেশী না আরো প্রায়ই প্রাপ্ত ρ < 1 । এখানে একটি আপেক্ষিক ফ্রিকোয়েন্সি বিতরণ
একে কখনও কখনও "ডিকি-ফুলার" বিতরণ বলা হয়, কারণ এটি একই নামের ইউনিট-রুট পরীক্ষা করতে ব্যবহৃত সমালোচনামূলক মানগুলির ভিত্তি।
নমুনা বিতরণের আকারের জন্য অন্তর্দৃষ্টি সরবরাহ করার প্রয়াস দেখে আমি পুনরায় মনে করি না । আমরা র্যান্ডম ভেরিয়েবলের নমুনা বিতরণের দিকে তাকিয়ে আছি
যদি আমরা স্বতন্ত্র পণ্য সাধারন মানগুলি যোগ করি তবে আমরা এমন একটি বিতরণ পাই যা শূন্যের কাছাকাছি প্রতিসাম্য বজায় থাকে। উদাহরণ স্বরূপ:
তবে আমরা যদি অ-স্বতন্ত্র পণ্যের নরমালগুলি যোগ করি তবে আমাদের ক্ষেত্রে তা পাই
যা ডান দিকে স্কুড করা হয়েছে তবে আরও সম্ভাবনার ভর সহ নেতিবাচক মানগুলিতে বরাদ্দ। এবং যদি আমরা নমুনার আকার বৃদ্ধি করি এবং যোগফলের সাথে আরও বেশি সংযুক্ত উপাদান যুক্ত করি তবে ভরটিকে আরও বাম দিকে আরও চাপ দেওয়া হচ্ছে বলে মনে হয়।
অ-স্বতন্ত্র গ্যামাসের যোগফলের পারস্পরিক ক্রিয়াকলাপটি ইতিবাচক স্কিউ সহ একটি অ-নেতিবাচক এলোমেলো পরিবর্তনশীল।
এটি আসলে কোনও উত্তর নয় তবে একটি মন্তব্যের জন্য খুব দীর্ঘ, সুতরাং আমি যাইহোক এটি পোস্ট করি।
আমি 100 এর নমুনা আকারের ("আর" ব্যবহার করে) একশটির মধ্যে 1 বারের চেয়ে 1 বারের চেয়ে বেশি গুণফল পেতে সক্ষম হয়েছি:
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
অনুধাবন ৮৪ এবং 95 এর 1 এর উপরে সহগ রয়েছে, সুতরাং এটি সর্বদা একের নীচে থাকে না । তবে প্রবণতাটি নিম্নগামী পক্ষপাতদুষ্ট অনুমান করার স্পষ্ট clearly প্রশ্ন থেকে যায়, কেন ?
সম্পাদনা করুন: উপরের রিগ্রেশনগুলিতে একটি ইন্টারসেপ্ট শব্দ অন্তর্ভুক্ত ছিল যা মডেলটির সাথে সম্পর্কিত বলে মনে হয় না। একবার বিরতি সরিয়ে ফেলা হলে, আমি 1 এর উপরে আরও অনেক অনুমান পেয়েছি (10000 এর মধ্যে 3158) - তবে এখনও এটি সমস্ত ক্ষেত্রে 50% এর নিচে স্পষ্ট:
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1