আর-এআরআইএমএ-র অবশিষ্টদের জন্য লুং-বক্স পরিসংখ্যান: বিভ্রান্তিকর পরীক্ষার ফলাফল


15

আমার একটি সময় সিরিজ আমি পূর্বাভাস দেওয়ার চেষ্টা করছি, যার জন্য আমি মৌসুমী আরিমা (0,0,0) (0,1,0) [12] মডেল (= ফিট 2) ব্যবহার করেছি। আর অটো.রিমা (আর কে গণনা করা আরিমা (0,1,1) (0,1,0) [12] এর চেয়ে ভাল ফিট হতে পারে তার চেয়ে আলাদা), আমি এর নামটি ফিট 1 রেখেছি)। যাইহোক, আমার সময় সিরিজের শেষ 12 মাসগুলিতে আমার মডেল (ফিট 2) অ্যাডজাস্ট করার সময় আরও ভাল ফিট বলে মনে হচ্ছে (এটি দীর্ঘস্থায়ী পক্ষপাতমূলক ছিল, আমি অবশিষ্টাংশটি যুক্ত করেছি এবং নতুন ফিটটি মূল সময় সিরিজের আশেপাশে আরও বেশি snugly বসে বলে মনে হচ্ছে এখানে গত 12 মাসের উদাহরণ এবং ম্যাপ দুটি সাম্প্রতিক মাসের 12 টির জন্য ফিট করে:

ফিট 1, ফিট 2 এবং মূল ডেটা

সময় সিরিজটি এর মতো দেখাচ্ছে:

মূল সময় সিরিজ

এ পর্যন্ত সব ঠিকই. আমি উভয় মডেলের জন্য অবশিষ্ট বিশ্লেষণ করেছি, এবং এখানে বিভ্রান্তি রয়েছে।

এসিএফ (অবশেষ (ফিট 1) দেখতে দুর্দান্ত, খুব সাদা-গোলমাল:

ফিট 1 এর এসিফ

তবে, ল্যাং-বক্স পরীক্ষাটি ভাল লাগে না, উদাহরণস্বরূপ, 20 ল্যাগ:

    Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)

আমি নিম্নলিখিত ফলাফলগুলি পেয়েছি:

    X-squared = 26.8511, df = 19, p-value = 0.1082

আমার বোঝার জন্য, এটি নিশ্চিতকরণ যে অবশিষ্টাংশগুলি স্বাধীন নয় (পি-ভ্যালু ইন্ডিপেন্ডেন্স হাইপোথিসিসের সাথে থাকার জন্য খুব বড়)।

যাইহোক, পিছিয়ে 1 এর জন্য সবকিছু দুর্দান্ত:

    Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)

আমাকে ফলাফল দেয়:

    X-squared = 0.3512, df = 0, p-value < 2.2e-16

হয় আমি পরীক্ষাটি বুঝতে পারছি না, বা এটিসিএফ প্লটে যা দেখছি তার সাথে এটি সামান্য বিপরীত। স্বতঃসংশ্লিষ্টতা হেসে কম।

তারপরে আমি ফিট 2 পরীক্ষা করেছিলাম। স্বতঃসিদ্ধকরণ ফাংশনটি দেখতে এরকম দেখাচ্ছে:

acf ফিট 2

বেশ কয়েকটি প্রথম লেগগুলিতে এ জাতীয় সুস্পষ্ট স্বীকৃতি সত্ত্বেও লাজং-বক্স পরীক্ষা আমাকে ফিট 1 এর চেয়ে 20 ল্যাগে অনেক ভাল ফলাফল দিয়েছে:

    Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)

ফলাফল স্বরূপ :

    X-squared = 147.4062, df = 20, p-value < 2.2e-16

যেখানে কেবল লেগ 1 এ স্বতঃসংশোধন পরীক্ষা করা আমাকে নাল-হাইপোথিসিসের নিশ্চয়তা দেয়!

    Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
    X-squared = 30.8958, df = 1, p-value = 2.723e-08 

আমি কি পরীক্ষা সঠিকভাবে বুঝতে পারছি? অবশিষ্টাংশের স্বাধীনতার নাল অনুমানটি নিশ্চিত করতে পি-মানটি 0.05 এর চেয়ে কম হওয়া উচিত। পূর্বাভাস, ফিট 1 বা ফিট 2 এর জন্য কোন ফিট ব্যবহার করা ভাল?

অতিরিক্ত তথ্য: ফিট 1 এর অবশিষ্টাংশগুলি সাধারণ বন্টন প্রদর্শন করে, ফিট 2 এর এটি হয় না।


2
আপনি পি-মানগুলি বুঝতে পারছেন না, এবং তাদের ভুল উপায়ে ব্যাখ্যা করছেন।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

হ্যাঁ, এটি বোঝার প্রশ্ন হতে পারে। আপনি কি প্রসারিত করতে পারেন? উদাহরণস্বরূপ, পি-মান 0.5 এর চেয়ে বড় হলে ঠিক কী বোঝায়? আমি পি-মান সংজ্ঞাটি পড়েছি (নাল হাইপোথিসিগুলি ধারণ করে যে পরীক্ষার পরিসংখ্যান হিসাবে কমপক্ষে পরিসংখ্যান পাওয়ার সম্ভাবনা) read এটি কীভাবে ল্যাং-বক্স পরীক্ষায় প্রযোজ্য? "কমপক্ষে চরম" এর অর্থ কি "এক্স স্কোয়ারের চেয়ে বড়"? আমি আমার ডেটা সহ উদাহরণটির জন্য কৃতজ্ঞ হব, যেহেতু তা বোঝার জন্য তাত্পর্যপূর্ণতা আমার জন্য চ্যালেঞ্জপূর্ণ।
জিমা

6
লজুং-বাক্স পরীক্ষার পরিসংখ্যান ( X-squared) অবশিষ্টগুলির নমুনা স্ব-সংযোগগুলি বৃহত্তর হওয়ার সাথে সাথে এর বৃহত্তর হয় (এর সংজ্ঞাটি দেখুন), এবং এর পি-মানটি শূন্যের নীচে পর্যবেক্ষণকৃত তার চেয়ে বড় বা বৃহত্তর প্রাপ্তির সম্ভাবনা অনুমান যে সত্য উদ্ভাবন স্বাধীন। সুতরাং একটি ছোট পি-মান স্বাধীনতার বিরুদ্ধে প্রমাণ ।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ স্কোর্টচি, আমি মনে করি এটি পেয়েছি। তবে এটি ফিট 1 এর জন্য আমার পরীক্ষাটি পিছিয়ে = 1 এ ব্যর্থ করে। এটি কীভাবে ব্যাখ্যা করা যায়? আমি পিছনে = 1 তে কোনও স্বতঃসংশোধন দেখতে পাচ্ছি না। অল্প সংখ্যক ল্যাগ (খুব ছোট নমুনা) সহ এই পরীক্ষার কি একধরণের বাড়াবাড়ি?
জিমা

3
বক্স-লাজং আপনার নির্দিষ্ট করা একটি পর্যন্ত স্বাধীনতার এক সর্বকোষ পরীক্ষা। ব্যবহৃত ডিগ্রি হ'ল নং। বিয়োগ নম্বরটি না এআর ও এমএ প্যারামিটারগুলি ( fitdf) তাই আপনি শূন্য ডিগ্রির স্বাধীনতার সাথে চি-স্কোয়ার বিতরণের বিরুদ্ধে পরীক্ষা করছিলেন।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

উত্তর:


34

আপনি পরীক্ষাকে ভুল ব্যাখ্যা করেছেন। যদি পি মানটি 0.05 এর বেশি হয় তবে অবশিষ্টাংশগুলি স্বতন্ত্র থাকে যা আমরা মডেলটি সঠিক হতে চাই। আপনি যদি নীচের কোডটি ব্যবহার করে একটি সাদা শব্দ সময় সিরিজ অনুকরণ করেন এবং এর জন্য একই পরীক্ষা ব্যবহার করেন তবে পি মানটি 0.05 এর চেয়ে বেশি হবে than

m = c(ar, ma)
w = arima.sim(m, 120)
w = ts(w)
plot(w)
Box.test(w, type="Ljung-Box")

3
একটি সংক্ষিপ্ত এবং ঝরঝরে ব্যাখ্যা। কোড উদাহরণের জন্য +1।
দাওয়ানি 33

1
আপনার ব্যাখ্যাটিও সঠিক নয়। ০.০৫ এর একটি পি-মানটির অর্থ হ'ল যদি আপনি আপনার ক্ষেত্রে অর্ডার ১ অবধি কোনও স্বয়ংক্রিয়-সম্পর্ক সম্পর্কিত নাল অনুমানকে বাতিল করেন তবে আপনার ত্রুটি করার 5% সুযোগ রয়েছে।
ডিজেজে

8

অনেক পরিসংখ্যানমূলক পরীক্ষা কিছু নাল অনুমানকে প্রত্যাখ্যান করার চেষ্টা করতে ব্যবহৃত হয় to এই বিশেষ ক্ষেত্রে ল্যাং-বক্স পরীক্ষা কিছু মূল্যবোধের স্বাধীনতা প্রত্যাখ্যান করার চেষ্টা করে। এর মানে কী?

  • যদি পি-মান <0.05 1 : আপনি ভুল করার 5% সম্ভাবনা ধরে নাল অনুমানটি বাতিল করতে পারেন। সুতরাং আপনি ধরে নিতে পারেন যে আপনার মানগুলি একে অপরের উপর নির্ভরশীলতা দেখাচ্ছে।

  • যদি পি-মান> 0.05 1 : নাল অনুমানটি প্রত্যাখ্যান করার মতো পর্যাপ্ত পরিসংখ্যান প্রমাণ আপনার কাছে নেই। সুতরাং আপনি ধরে নিতে পারবেন না যে আপনার মানগুলি নির্ভরশীল। এর অর্থ এই হতে পারে যে আপনার মানগুলি যে কোনওভাবে নির্ভরশীল বা এর অর্থ আপনার মানগুলি স্বাধীন। তবে আপনি কোনও সুনির্দিষ্ট সম্ভাবনা প্রমাণ করছেন না, আপনার পরীক্ষাটি যা বলেছিল তা হ'ল আপনি মূল্যবোধের নির্ভরতা জোর করতে পারবেন না, মানগুলির স্বাধীনতাও জোর করতে পারবেন না।

সাধারণভাবে, এখানে যা গুরুত্বপূর্ণ তা মনে রাখা উচিত যে পি-মান <0.05 আপনাকে নাল-অনুমানটি বাতিল করতে দেয় তবে একটি পি-মান> 0.05 আপনাকে নাল-হাইপোথিসিসটি নিশ্চিত করতে দেয় না

বিশেষত, আপনি লাজং-বক্স পরীক্ষা ব্যবহার করে টাইম সিরিজের মানগুলির স্বাধীনতার প্রমাণ দিতে পারবেন না। আপনি কেবল নির্ভরতা প্রমাণ করতে পারেন।


α=0.05


α=0.05

0

এসিএফ গ্রাফ অনুসারে, এটি স্পষ্টতই যে ল্যাগ কে (কে> 1) এর পারস্পরিক সম্পর্কের গুণাগুণটি তীব্রভাবে নেমে আসে এবং 0-এর কাছাকাছি থেকে ফিট 1 টি আরও ভাল।


0

আপনি যদি এসিএফ দিয়ে বিচার করছেন তবে ফিট 1 আরও উপযুক্ত। লজং পরীক্ষায় বিভ্রান্ত হওয়ার পরিবর্তে আপনি এখনও ফিট 1 এবং ফিট 2 এর মধ্যে সেরা ফিট নির্ধারণ করতে অবশিষ্টাংশের সংশোধনগ্রাম ব্যবহার করতে পারেন


1
আমি এই উত্তর বুঝতে পারি না।
মাইকেল আর চেরনিক

আমরা যখন লাজং বাক্সের পরিসংখ্যানগুলি পরিদর্শন করি তখন আমরা মডেল ডায়াগনস্টিক চেক আই, মডেল পর্যাপ্ততা সম্পর্কে আগ্রহী হতে পারি ..... যদি এটি আপনাকে বিভ্রান্ত করে তোলে তবে মডেলের পর্যাপ্ততা যাচাই করার অন্যান্য উপায় রয়েছে যা আমি উপরে বলেছি। আপনি ডেটা রেসিডুয়াল এর কর্লোগ্রাম আই, এসিএফ এবং পিএসিএফ প্লট করতে পারেন এবং তারপরে শ্বেত গোলমাল হলে সিরিজের সীমানা পরীক্ষা করতে পারেন ...... লজং বক্স পরীক্ষাটি ব্যবহার করা উচিত নয়
ভিনসেন্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.