সময় সিরিজের ডেটা পূর্বাভাসের জন্য একবার খুঁজে পাওয়া আউটলিয়ারগুলি কীভাবে সংশোধন করবেন?


10

আমি একবার আউটলাইজারদের সময় সিরিজের ডেটা খুঁজে পেয়ে / সনাক্ত করার পরে তাদের সংশোধন করার কোনও উপায় অনুসন্ধান করার চেষ্টা করছি। কিছু পদ্ধতি, যেমন আর নেনেটারের মতো, বড় / বড় বহিরাগতদের সাথে সময় সিরিজের জন্য কিছু ত্রুটি দেয়। আমি ইতিমধ্যে অনুপস্থিত মানগুলি সংশোধন করতে সক্ষম হয়েছি, তবে বহিরাগতরা এখনও আমার পূর্বাভাসের ক্ষতি করছে ...


"সংশোধন" বলতে কী বোঝ?
rbatt

প্রতিস্থাপন বা প্রতিস্থাপন ... বা এটি কি কেবল বিয়োগ করা উচিত ...?
মিলা

3
বিদেশী কি "সত্য"? এর অর্থ আমার অর্থ কি মডেলটির অক্ষমতার কারণে চরম ঘটনা বা ধাক্কা লেগে যেতে পারে? বা এগুলি "ত্রুটি" যেমন ডেটা এন্ট্রি সমস্যা?
সম্ভাব্যতাব্লোগিক

উত্তর:


9

আরএল এর জন্য পূর্বাভাস প্যাকেজে বিদেশিদের সনাক্তকরণ এবং তাদের প্রতিস্থাপনের জন্য একটি সুবিধা রয়েছে। (এটি অনুপস্থিত মানগুলিও পরিচালনা করে)) আপনি স্পষ্টতই পূর্বাভাস প্যাকেজটি ব্যবহার করছেন, এটি আপনার পক্ষে সুবিধাজনক সমাধান হতে পারে। উদাহরণ স্বরূপ:

fit <- nnetar(tsclean(x))

tsclean()ফাংশন একটি শক্তসমর্থ প্রবণতা (অ-মৌসুমি সিরিজের জন্য) ধুসর - হরিদ্রাভ রঙের মিহি মাটির স্তর যা রাইন ব্যবহার করে, বা শক্তসমর্থ প্রবণতা এবং মৌসুমী উপাদান STL ব্যবহার (মৌসুমি সিরিজের জন্য) মাপসই করা হবে। অবশিষ্টাংশ গণনা করা হয় এবং নিম্নলিখিত সীমা গণনা করা হয়:

ইউ=কুই0.9+ +2(কুই0.9-কুই0.1)এল=কুই0.1-2(কুই0.9-কুই0.1)
কুই0.1কুই0.9

ইউএল

অ-মৌসুমী সময় সিরিজের জন্য, আউটলিয়ারগুলি লিনিয়ার ইন্টারপোলেশন দ্বারা প্রতিস্থাপিত হয়। মৌসুমী সময় সিরিজের জন্য, ফলাফলটি পুনরায় মৌসুমীকরণের আগে, এসটিএল ফিট থেকে alতু উপাদান সরানো হয় এবং ফলস্বরূপ পুনরায় মৌসুমীকরণের আগে, বহিরাগতদের প্রতিস্থাপনের জন্য মৌসুমী সামঞ্জস্য করা সিরিজটি লাইনগতভাবে বিরতিযুক্ত হয়।


1
এখানে আপনার সম্প্রসারণও সহায়ক: স্ট্যাটাস.স্ট্যাকেক্সেঞ্জার.কমিশন / সেকশনস / ১১৪৪/২ (tsclean কল্টসুটায়ার্সকে কল করুন)

4

আপনি যখন একটি আরিমা মডেল শনাক্ত করেন তখন আপনাকে একই সাথে ডাল / স্তর স্তর / মৌসুমী ডাল এবং / অথবা স্থানীয় সময় ট্রেন্ডগুলি সনাক্ত করা উচিত। আপনি http://www.ebay.com/ctg/Time-S ्री-- অ্যানালাইসিস- ইউনিভারিটি- এবং- মাল্টিভাইয়ারেট -Methods- ডেভিড- পি- রিলি- এবং- উইলিয়াম- Wii-1999 এ হস্তক্ষেপ সনাক্তকরণ পদ্ধতি সম্পর্কিত কিছু পাঠ্য সামগ্রী পেতে পারেন - / 85697 এবং http://www.unc.edu/~jbhill/tsay.pdf । আমি দেখেছি নিখরচায় সফ্টওয়্যারটি চাইছে এমন কোনও কার্যকর ফলাফল পেতে আপনাকে এসএএস / এসপিএসএস / আউটবক্সের মতো বাণিজ্যিক সফ্টওয়্যার অনুসরণ করতে হতে পারে। উত্তীর্ণ হওয়ার সময় আমি এই ক্ষেত্রের অটোবক্সে বড় প্রযুক্তিগত উন্নতিতে অবদান রেখেছি।

সম্পাদনা করুন:

আরও ভাল পদ্ধতির হ'ল কঠোর আরিমা পদ্ধতি ব্যবহার করে হস্তক্ষেপ সনাক্তকরণ পদ্ধতিটি শক্তিশালী আরিমা পরামিতি এবং একটি ভাল পূর্বাভাসের দিকে পরিচালিত করে আউটলিয়ারদের সনাক্ত করা। এখন স্পন্দিত পূর্বাভাস বিকাশ বিবেচনা করুন নাড়ি প্রভাব ছাড়াই পুনরায় নমুনাযুক্ত অবশিষ্টাংশ অন্তর্ভুক্ত। এইভাবে আপনি উভয় পৃথিবীর সেরা একটি মডেল এবং পূর্বাভাসের জন্য আরও বাস্তবসম্মত অনিশ্চয়তার বিবৃতি পাবেন যা অনুমান করা হয় না যে মডেল পরামিতিগুলি জনসংখ্যার মান।


1

আমি @ আকসাকালের সাথে একমত নাগরিকদের অপসারণের পরিবর্তে, এর চেয়ে ভাল উপায় হ'ল বিদেশীদের সাথে ডিল করার জন্য কিছু ধরণের পরিসংখ্যানিক পদ্ধতি ব্যবহার করা। আমি আপনাকে আপনার ডেটাটি উইনসরাইজ করার পরামর্শ দিচ্ছি। যদি যথাযথভাবে প্রয়োগ করা হয় তবে উইনসরাইজেশন অপেক্ষাকৃত শক্তিশালী হতে পারে li এই পৃষ্ঠায়: http://www.r-bloggers.com/winsorization/ , আপনি উইনসরাইজেশন বাস্তবায়নের জন্য আর-কোডগুলি পাবেন। আপনি যদি আপনার ডেটাটি উইনসরাইজিংয়ের কথা বিবেচনা করেন তবে আপনাকে বিতরণের লেজগুলি সম্পর্কে সাবধানতার সাথে চিন্তা করতে হবে। প্রবাসীরা কি চূড়ান্ত নিম্নমানের প্রত্যাশিত, বা তারা চূড়ান্ত, বা উভয়ই হতে পারে বলে আশা করা হচ্ছে? এটি আপনি 5% বা 10% এবং / অথবা 95% বা 99% স্তরে জিতবেন কিনা তা প্রভাবিত করবে।


1
সামগ্রিক গড় অনুমানের উদ্দেশ্যে উইনসরাইজেশন ডেটাতে কোনও প্রবণতা বা মৌসুমী উপাদানগুলির অভাবে কিছুটা বোধ করতে পারে তবে অন্যথায় গুরুত্বপূর্ণ তথ্য নষ্ট করার হুমকি দেয় ns
শুক্র

0

পূর্বাভাসের প্রসঙ্গে, আউটলিয়ারদের অপসারণ করা খুব বিপজ্জনক। উদাহরণস্বরূপ, আপনি একটি মুদি দোকান বিক্রয় পূর্বাভাস। ধরা যাক পার্শ্ববর্তী বিল্ডিংয়ে একটি গ্যাস বিস্ফোরণ হয়েছিল, যার ফলে আপনি কিছুদিনের জন্য দোকানটি বন্ধ করে দিয়েছেন। 10 বছরের মধ্যে এই একমাত্র দোকান বন্ধ ছিল। সুতরাং, আপনি সময় সিরিজ পান, আউটলেটটিকে সনাক্ত করুন, এটি সরান এবং পূর্বাভাস। আপনি নিঃশব্দে ধরে নিয়েছেন যে ভবিষ্যতে এরকম কিছুই হবে না। ব্যবহারিক অর্থে, আপনি আপনার পর্যবেক্ষণের বৈকল্পিকতা সংকুচিত করেছেন, এবং সহগ বৈকল্পগুলি সঙ্কুচিত হয়েছে। সুতরাং, আপনি যদি আপনার পূর্বাভাসটির জন্য আত্মবিশ্বাস ব্যান্ডগুলি দেখান তবে আপনি যদি আউটলেটটিকে অপসারণ না করেন তবে তারা তাদের তুলনায় আরও সংক্ষিপ্ত হবে।

অবশ্যই, আপনি আউটলেট রাখতে পারেন, এবং যথারীতি এগিয়ে যেতে পারেন, তবে এটিও ভাল পন্থা নয়। কারণটি হ'ল এই আউটলেটর সহগকে স্কু করবে।

আমি মনে করি এই ক্ষেত্রে আরও ভাল পদ্ধতির ফলে চর্বি লেজের সাথে ত্রুটি বিতরণের অনুমতি দেওয়া হতে পারে, সম্ভবত একটি স্থিতিশীল বিতরণ। এক্ষেত্রে আপনার আউটলার সহগকে খুব বেশি স্কু করবে না। তারা একটি বহির্মুখী সরানো সহ সহগের নিকটবর্তী হবে। তবে, খেলোয়াড় ত্রুটি বিতরণ, ত্রুটির বৈকল্পিকতায় প্রদর্শিত হবে। মূলত, আপনি বিস্তৃত পূর্বাভাস আত্মবিশ্বাস ব্যান্ডের সাথে শেষ করবেন।

আত্মবিশ্বাস ব্যান্ডগুলি একটি অত্যন্ত গুরুত্বপূর্ণ তথ্য সরবরাহ করে। আপনি যদি ভবিষ্যদ্বাণী করে থাকেন যে এই মাসে বিক্রয়টি ১,০০,০০০ ডলার হবে তবে 5% সম্ভাবনা রয়েছে যে তারা 10,000 ডলার হবে, এটি ব্যয়, নগদ পরিচালন ইত্যাদির বিষয়ে আপনার সিদ্ধান্তগুলিকে প্রভাবিত করে


-1

অপসারণকারীদের সাথে একটি মডেল (বা না) ব্যবহার করে পূর্বাভাস সম্পাদন করা ভবিষ্যতে আউটলিয়ারদের সম্ভাব্যতা এবং এর প্রভাবের প্রত্যাশিত বিতরণের উপর নির্ভর করে, যদি তা সত্যই ঘটে থাকে। ট্রেনিং ডেটা কি এটির ইলিমিনেট করার জন্য যথেষ্ট ?. বায়েশিয়ান পদ্ধতির সাহায্য করা উচিত ...


1
এটি ভুল। আপনি যদি আউটলিয়ারদের জন্য সামঞ্জস্য না করেন তবে আপনার আউটলিয়ার্স সিরিজের শেষে থাকলে আপনার পূর্বাভাসটি ভুল হতে পারে।
পূর্বাভাসকারী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.