সময় সিরিজের ডেটা দিয়ে আপনি কীভাবে বুটস্ট্র্যাপিং করবেন?


33

আমি সম্প্রতি অনুমানকারীদের জন্য স্ট্যান্ডার্ড ত্রুটি এবং আত্মবিশ্বাসের অন্তরগুলি গণনা করতে বুটস্ট্র্যাপিং কৌশলগুলি ব্যবহার সম্পর্কে শিখেছি। আমি যা শিখেছি তা হ'ল যদি ডেটা আইআইডি হয় তবে আপনি নমুনা ডেটাটিকে জনসংখ্যা হিসাবে বিবেচনা করতে পারেন এবং প্রতিস্থাপনের সাথে নমুনা করতে পারেন এবং এটি আপনাকে পরীক্ষার পরিসংখ্যানের একাধিক সিমুলেশন পেতে অনুমতি দেবে।

সময় সিরিজের ক্ষেত্রে, আপনি পরিষ্কারভাবে এটি করতে পারবেন না কারণ স্বতঃসংশ্লিষ্টতার উপস্থিতি সম্ভবত। আমার একটি সময় সিরিজ আছে এবং একটি নির্দিষ্ট তারিখের আগে এবং পরে ডেটার গড় গণনা করতে চাই। বুটস্ট্র্যাপিংয়ের সংশোধিত সংস্করণ ব্যবহার করে কি এমন কোনও সঠিক উপায় আছে?


16
কী অনুসন্ধান শব্দ: বুটস্ট্র্যাপ ব্লক করুন।
কার্ডিনাল

উত্তর:


26

@ কার্ডিনাল হিসাবে উল্লেখ করা হয়েছে যে, 'ব্লক বুটস্ট্র্যাপ' এর বিভিন্নতা একটি প্রাকৃতিক পদ্ধতি। এখানে, পদ্ধতির উপর নির্ভর করে আপনি টাইম সিরিজের প্রসারগুলি নির্বাচন করুন, হয় ওভারল্যাপিং হবে না এবং নির্দিষ্ট দৈর্ঘ্য বা এলোমেলো, যা নমুনাগুলিতে স্থিরতার গ্যারান্টি দিতে পারে ( পলাইটিস এবং রোমানো, 1991 ) তারপরে পুনরায় মডেল টাইম সিরিজ তৈরি করতে এগুলি আবার একসাথে সেলাই করুন যার উপর আপনি আপনার পরিসংখ্যান গণনা। আপনি অস্থায়ী নির্ভরতার মডেলগুলি তৈরির চেষ্টা করতে পারেন, যা মার্কোভ পদ্ধতিগুলি, স্বতঃসংশোধক চালক এবং অন্যদের দিকে পরিচালিত করে। তবে ব্লক বুটস্ট্র্যাপিং সম্ভবত বাস্তবায়নের জন্য এই পদ্ধতিগুলির মধ্যে সবচেয়ে সহজ।

গোনালভস এবং পলিটাইটিস (২০১১) একটি উল্লেখ সহ সংক্ষিপ্ত পর্যালোচনা। একটি বইয়ের দৈর্ঘ্যের চিকিত্সা হ'ল লাহিড়ী (২০১০)


@ স্ট্যাটনব যদি এটি আপনার পূর্ববর্তী সাপ্তাহিক বিক্রয় হস্তক্ষেপ প্রশ্নের সাথে সম্পর্কিত হয় তবে মনে রাখবেন যে আপনি যে মডেল অনুমানের উপর নির্ভর করছেন সেখানে বিশ্বাস না রাখলে আপনি বুটস্ট্র্যাপ করেন। প্রথম স্থানে ন্যায়সঙ্গত টাইম সিরিজের মডেলটি ব্যবহার করা এমন জিনিসগুলির ঝুঁকিটি আদর্শভাবে কমিয়ে আনতে হবে যা এই ধরণের বুটস্ট্র্যাপিং নির্দেশ করে ...
কনজুগেটপায়ার

6
ভাল উত্তর. আমাকে শুধু যোগ যা আপনি ব্যবহার করতে পারি tsbootbootআর প্যাকেজ এই কাজ করতে।
MånsT

@ MånsT নিস। আমি এই প্যাকেজ সম্পর্কে জানতাম না।
কনজুগেটপায়ার

5

ইফ্রোন (1979) এ চালু হওয়া পুনরায় মডেলিং পদ্ধতিটি আইআইডি অবিবাহিত ডেটার জন্য ডিজাইন করা হয়েছিল তবে সহজেই মাল্টিভারিয়েট ডেটাতে প্রসারিত হয়। হিসাবে আলোচনা করা হয়েছে। যদি নমুনায় তথ্যের কোভেরিয়েন্স কাঠামো বজায় রাখতে ভেক্টরগুলির একটি নমুনা হয়। এটি কোনও সময়ের সিরিজ নমুনা নিতে পারে কিনা তা তাত্ক্ষণিকভাবে স্পষ্ট নয় । একটি টাইম সিরিজ মূলত স্টোকাস্টিক প্রক্রিয়া থেকে 1 মাপের একটি নমুনা। একটি নমুনা পুনঃনির্মাণ করা আসল নমুনা, তাই কেউ পুনরায় মডেলিং করে কিছুই শিখেন না। সুতরাং, একটি সময় সিরিজ পুনরায় মডেলিং জন্য নতুন ধারণা প্রয়োজন।এক্স1,···,এক্সএনএক্স1,এক্স2,···,এক্সএন

মডেল-ভিত্তিক পুনরায় মডেলিং সময় সিরিজে সহজেই গৃহীত হয়। সময় সিরিজের মডেলটি অনুকরণ করে প্রতিকারগুলি পাওয়া যায়। উদাহরণস্বরূপ, যদি মডেলটি আরিমা (পি, ডি, কিউ) হয় তবে অটোরিগ্রেসিভ এবং চলমান গড় সহগ এবং শব্দের বৈকল্পিকের এমএলইএস (ডিফারেন্ট সিরিজ থেকে) সহ একটি আরিমা (পি, কিউ) মডেলের ফলাফলগুলি। প্রতিকারগুলি হ'ল সিমুলেটেড আরিমা (পি, কিউ) প্রক্রিয়াটির আংশিক যোগের ক্রম।

টাইম সিরিজের মডেল-ফ্রি রিস্যাম্পলিং ব্লক রিসাম্পলিংয়ের মাধ্যমে সম্পন্ন হয়, একে ব্লক বুটস্ট্র্যাপও বলা হয়, যা আর-র বুট প্যাকেজে tsboot ফাংশন ব্যবহার করে প্রয়োগ করা যেতে পারে। ধারাবাহিকভাবে পর্যবেক্ষণের সমান দৈর্ঘ্যের ব্লকগুলিকে বিভাজন করা, প্রতিস্থাপনের সাথে ব্লকটির পুনরায় নমুনা তৈরি করা এবং তারপরে ব্লকগুলি একসাথে পেস্ট করার ধারণা। উদাহরণস্বরূপ, যদি সময় সিরিজটি দৈর্ঘ্য 200 হয় এবং একটিতে 20 দৈর্ঘ্যের 10 টি ব্লক ব্যবহার করা হয়, তবে ব্লকগুলি প্রথম 20 টি পর্যবেক্ষণ, পরবর্তী 20 এবং আরও অনেক কিছু। সম্ভাব্য রেজাল্টটি হ'ল চতুর্থ ব্লক (পর্যবেক্ষণ 61 থেকে 80), তারপরে শেষ ব্লক (পর্যবেক্ষণ 181 থেকে 200), দ্বিতীয় ব্লক (পর্যবেক্ষণ 21 থেকে 40), আবার চতুর্থ ব্লক, এবং 10 টি ব্লক না হওয়া পর্যন্ত রেজাল্টে।


1
ওভারল্যাপিং ব্লক বুটস্ট্র্যাপ এবং বৃত্তাকার ব্লক বুটস্ট্র্যাপ সহ ব্লক বুটস্ট্র্যাপ পদ্ধতিগুলির অন্যান্য রূপ রয়েছে যা লাহিড়ির (2003) বই "নির্ভরশীল ডেটার জন্য পুনরায় মডেলিং পদ্ধতি" সম্পর্কে বিশদভাবে বর্ণনা করা হয়েছে। এই পদ্ধতিগুলি স্থায়ী সময় সিরিজের জন্য প্রযোজ্য।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.