সময় সিরিজের পূর্বাভাসের মূল্যায়ন করা


11

ধরুন আমার 20'000 মাসের টাইম সিরিজটি জানুয়ারি -55 থেকে ডিসেম্বর 11 পর্যন্ত ছড়িয়ে আছে। এগুলির প্রতিটি পৃথক পণ্যের জন্য বৈশ্বিক বিক্রয় ডেটা উপস্থাপন করে। যদি তাদের প্রত্যেকের জন্য পূর্বাভাস গণনা করার পরিবর্তে, আমি কেবলমাত্র "আসলেই গুরুত্বপূর্ণ" এমন সংখ্যক পণ্যগুলিতে মনোযোগ দিতে চাই?

আমি মোট বার্ষিক উপার্জন দ্বারা সেই পণ্যগুলিকে র‌্যাঙ্ক করতে পারি এবং ক্লাসিকাল পেরেটো ব্যবহার করে তালিকাটি ছাঁটাতে পারি। তবুও এটি আমার কাছে মনে হয়, যদিও তারা নীচের অংশে খুব বেশি অবদান রাখে না, কিছু পণ্য এত সহজেই অনুমান করা যায় যে এগুলি ছেড়ে দেওয়া খারাপ বিচার হবে। এমন একটি পণ্য যা গত 10 বছরে প্রতি মাসে 50 $ মূল্য বিক্রি করে সেটির মতো খুব বেশি না শোনা যায় তবে ভবিষ্যতের বিক্রয় সম্পর্কে ভবিষ্যদ্বাণী উত্পন্ন করতে খুব কম প্রচেষ্টা দরকার যা আমি এটি করতে পারি।

সুতরাং আসুন আমি বলি যে আমি আমার পণ্যগুলিকে চারটি বিভাগে ভাগ করেছি: উচ্চ আয়ের / পূর্বাভাসের পক্ষে সহজ - কম আয় / পূর্বাভাসের পক্ষে সহজ - উচ্চ আয়ের / পূর্বাভাসের পক্ষে শক্ত - কম আয় / পূর্বাভাসের পক্ষে শক্ত hard

আমি মনে করি কেবল চতুর্থ গ্রুপের অন্তর্গত সেই সময় সিরিজগুলি রেখে যাওয়া যুক্তিসঙ্গত হবে। তবে আমি কীভাবে "পূর্বাভাস" মূল্যায়ন করতে পারি?

তারতম্যের গুণাগুলি একটি ভাল সূচনা পয়েন্টের মতো মনে হয় (এটি সম্পর্কে কিছুক্ষণ আগে কিছু কাগজও দেখেছি মনে আছে)। তবে আমার সময় সিরিজটি যদি মৌসুমীতা / স্তর স্তরগুলি / ক্যালেন্ডার প্রভাবগুলি / শক্তিশালী প্রবণতা প্রদর্শন করে?

আমি কল্পনা করব যে আমার মূল্যায়নটি কেবল এলোমেলো উপাদানগুলির পরিবর্তনশীলতার উপর ভিত্তি করে করা উচিত, "কাঁচা" ডেটার একটির নয়। নাকি আমি কিছু মিস করছি?

এর আগেও কি কেউ একই সমস্যায় হোঁচট খেয়েছে? আপনি কিভাবে এটি সম্পর্কে যেতে হবে?

সর্বদা হিসাবে, যে কোনও সাহায্যের প্রশংসা করা হয়!

উত্তর:


9

এখানে একটি দ্বিতীয় ধারণা stl উপর ভিত্তি করে।

আপনি প্রতিটি সিরিজের একটি stl পচন ফিট করতে পারে এবং তারপরে বাকী অংশের স্ট্যান্ডার্ড ত্রুটিটিকে কোনও আংশিক বছর উপেক্ষা করে মূল ডেটার গড়ের সাথে তুলনা করতে পারেন। পূর্বাভাস দেওয়া সহজ সিরিজের অর্থ (ডেটা) বোঝার জন্য একটি ছোট অনুপাত থাকতে হবে (অবশিষ্ট)।

আমি আংশিক বছর উপেক্ষা করার পরামর্শ দেওয়ার কারণটি হ'ল মৌসুমতা ডেটাগুলির গড়কে অন্যথায় প্রভাবিত করবে। প্রশ্নের উদাহরণে, সমস্ত সিরিজের সাতটি সম্পূর্ণ বছর রয়েছে, সুতরাং এটি কোনও সমস্যা নয়। তবে যদি সিরিজটি অংশটি 2012 পর্যন্ত প্রসারিত হয় তবে আমি প্রস্তাব দিচ্ছি যে গড়টির মৌসুমী দূষণ এড়াতে কেবল 2011 এর শেষ অবধি গণনা করা হবে।

এই ধারণাটি ধরে নিয়েছে যে এর অর্থ (ডেটা) অর্থবোধ করে - এটি হ'ল ডেটা মানে স্টেশনারি (alityতু ছাড়া) are এটি সম্ভবত শক্তিশালী প্রবণতা বা ইউনিট শিকড় সহ ডেটার জন্য ভাল কাজ করবে না।

এটিও ধরে নিয়েছে যে একটি ভাল স্টিল ফিট ভাল পূর্বাভাসে অনুবাদ করে, তবে আমি এমন একটি উদাহরণের কথা ভাবতে পারি না যেখানে এটি সত্য হবে না তাই এটি সম্ভবত একটি অনুমিত ধারণা।


হাই রব, আমার কাছে ফিরে আসার জন্য ধন্যবাদ। আমি আপনার ধারণা পছন্দ করি তাই আমি এটি ব্যবহার করে দেখুন এবং এটি ফিল্টারিংয়ের কাঙ্ক্ষিত স্তর সরবরাহ করে কিনা তা দেখুন। আরও একটি বিষয়, গড় (ডেটা) ওভারের গড় (বাকী) ব্যবহারের কোনও বিশেষ কারণ আছে কি? আমি ভয় করি আমার কিছু সময় সিরিজের কিছুটা প্রবণতা থাকতে পারে। পরিবর্তে, এসটিএল পচে যাওয়া সিরিজগুলি করা উচিত নয়। এছাড়াও আপনি কী ভাবেন যে পূর্বাভাসযোগ্যতা / স্পটিং আউটলিয়ারদের মূল্যায়নের জন্য আমরা এখনও অবধি যে পদ্ধতিটি রূপরেখা দিয়েছি তা বাস্তব ব্যবসায় পরিবেশে বাস্তবায়িত হওয়ার পক্ষে যথেষ্ট ভাল? নাকি এটা খুব ‘অপেশাদার’? আপনি কি সাধারণত কিছু আলাদাভাবে করতে চান?
ব্রুডার

গড় (বাকি) শূন্যের কাছাকাছি হবে। আপনি শব্দটির সাথে ডেটা স্কেলের সাথে তুলনা করতে চান, সুতরাং অর্থ (ডেটা) ঠিক হওয়া উচিত। আপনার ট্রেন্ডগুলি কীভাবে মোকাবেলা করবেন তা নিশ্চিত নন। ফলাফলগুলিকে বিশ্বাস করার আগে আমি মনোযোগ দিয়ে অনেকগুলি ডেটাতে পরীক্ষা করব।
রব হ্যান্ডম্যান

8

এটি পূর্বাভাসে মোটামুটি সাধারণ সমস্যা। Traditionalতিহ্যবাহী সমাধানটি হ'ল প্রতিটি আইটেমের উপর নিখুঁত শতাংশের ত্রুটি (এমএপিই) গণনা করা। এমএপই যত কম হবে তত সহজেই পূর্বাভাস দেওয়া আইটেমটি।

এর সাথে একটি সমস্যা অনেকগুলি সিরিজের শূন্য মানগুলি ধারণ করে এবং তারপরে এমএপিই অপরিজ্ঞাত হয়।

আমি হিন্ডম্যান এবং কোহেলার (আইজেএফ 2006) [প্রিপ্রিন্ট সংস্করণ] -এর পরিপূর্ণ আকারযুক্ত ত্রুটি (এমএএসই) ব্যবহার করে একটি সমাধানের প্রস্তাব দিয়েছিলাম। মাসিক সময় সিরিজের জন্য, স্কেলিংটি ইন-স্যাম্পল মরসুমের ভোটাধিকার পূর্বাভাসের ভিত্তিতে তৈরি হবে। এটি যদি সময়ে পর্যবেক্ষণ হয় তবে 1 থেকে এবং তারপর একটি ছোটো ত্রুটি , যেখানে একটি পূর্বাভাস ব্যবহার যাই হোক না কেন পূর্বাভাস পদ্ধতি আপনি যে আইটেমটি জন্য বাস্তবায়ন করছে। ম্যাসেজ পেতে স্কেলড ত্রুটিগুলির গড় নিরঙ্কুশ মানটি ধরুন। উদাহরণস্বরূপ, আপনি একটি ঘূর্ণায়মান উত্স (ওরফে) ব্যবহার করতে পারেনyttT

Q=1T12t=13T|ytyt12|,
qt=(yty^t)/Q Y টিYটিy^tytসময় সিরিজ ক্রস-বৈধকরণ ) এবং ফলাফলের এক-পদক্ষেপের (বা -স্টেপ ) ত্রুটির গড় নিরঙ্কুশ মানটি গ্রহণ করুন ।h

পূর্বাভাস দেওয়া সহজ সিরিজের ম্যাসেজের মান কম হওয়া উচিত। এখানে "পূর্বাভাসের পক্ষে সহজ" এর অর্থ মৌসুমী নিষ্পাপ পূর্বাভাসের সাথে সম্পর্কিত। কিছু পরিস্থিতিতে, ফলাফলগুলি স্কেল করার জন্য বিকল্প বেস ব্যবস্থা ব্যবহার করা আরও বোধগম্য হতে পারে।


হাই রব, আপনার সদয় জবাবের জন্য আপনাকে ধন্যবাদ। সর্বদা আপনার পদ্ধতির খুব ঝরঝরে, সরল এবং যুক্তিসঙ্গত। আমি ইতিমধ্যে একটি মৌসুমী নিষ্পাপ মডেলের বিপরীতে পূর্বাভাসের মান যুক্ত ( এফটিভি ) মূল্যায়ন করি যাতে একই "বেস পরিমাপ" ব্যবহার করে পূর্বাভাসের মূল্যায়ন করার আপনার ধারণাটি খুব আকর্ষণীয় বলে মনে হয়। একমাত্র সমস্যাটি হ'ল ম্যাসে গণনা করার জন্য, আমাকে আমার 20000 টাইম-সিরিজের জন্য একটি পূর্বাভাস পদ্ধতি বেছে নেওয়া এবং সিমুলেশনগুলি চালানো দরকার। আমি আশা করছিলাম যে আমি আগে থেকে সহজে পূর্বাভাসের সিরিজটি দেখতে পাব, যাতে আমি গণনার সময় সাশ্রয় করতে পারি।
ব্রুডার

কিছু কারণে আমি ভেবেছিলাম যে একটি কম আপেক্ষিক পরিবর্তনশীলতার (যেমন সিভি) সহ টাইম-সিরিজ অগত্যা সহজতর এবং আরও নির্ভুল পূর্বাভাসের ফলাফল করবে। পূর্বাভাস এবং তারপরে গণনা করা, এবং কেবল তখনই ত্রুটিগুলি পরিমাপ করা, ধরণের প্রতিবন্ধকতাগুলি, আমার মনে হয়, আমার পারপাস। আমি অনুমান করি যে আমি যা বলতে চাইছি তা হ'ল আমি পূর্বাভাসের পরিমাপের চেয়ে পূর্বাভাসের নির্ভুলতার একটি পরিমাপের মতো বেশি দেখি। তবে আমি ভুল হতে পারি ... :)
ব্রুডার

1
@ ব্রুডার: ২ টি চিন্তাভাবনা: ১. আপনি মৌসুমী পূর্বাভাসের চেয়ে সাধারণ সরল পূর্বাভাসের দিকে নজর দিতে পারেন। একটি সাধারণ নিষ্পাপ পূর্বাভাস কেবল সময়ের সিরিজের পূর্ববর্তী মানটি ব্যবহার করে এবং একটি শক্তিশালী প্রবণতা বাছাই করে (একটি 1-সময় ব্যবধান সহ) with 2. এসটিএল পচে যাওয়া একটি ভাল ধারণা। Ifতু এবং প্রবণতা উপাদানগুলির তুলনায় যদি অবশিষ্টাংশগুলি খুব ছোট হয়, তবে আপনি সম্ভবত সিরিজটি খুব সহজেই পূর্বাভাস করতে পারেন।
জাচ

1
@ রব - এসটিএল পচে যাওয়া সম্পর্কে কী? আমি কি একটি পাথর দিয়ে দুটি পাখি পেতে পারি (অর্থাত্ বিদেশীদের চিহ্নিত করা এবং পূর্বাভাসের মূল্যায়ন, সুতরাং "সত্য" পূর্বাভাসের মূল্যায়ন)? এটি আমাকে অবাক করে দেয় যে আমি কেবল এসটিএল এবং একটি মৌসুমী নিষ্পাপ মডেল দিয়ে কতটা অর্জন করতে পারি। তবে আপনি জানেন যে জিনিসগুলি সত্য হতে খুব ভাল হলে কী হয় ...
ব্রুডার

1
আমি বিশ্বাস করি যে যোগফলের সূচকটি পরিবর্তে হওয়া উচিত । iti
ব্লেকওফট

5

আপনি ফোরকা-তে আগ্রহী হতে পারেন : পূর্বাভাসযোগ্য উপাদান বিশ্লেষণ (অস্বীকৃতি: আমি লেখক)। নামটি যেমন বোঝায় যে এটি বহু মাত্রিক - বেশি বা কম স্থির - সময় সিরিজ থেকে সর্বাধিক পূর্বাভাসযোগ্য সংকেতগুলি খুঁজে পাওয়ার জন্য একটি মাত্রা হ্রাস / অন্ধ উত্স বিভাজন (বিএসএস) কৌশল। আপনার 20,000 টাইম সিরিজের নির্দিষ্ট ক্ষেত্রে এটি করা সবচেয়ে দ্রুত কাজ নাও হতে পারে (সমাধানটি মাল্টিভারিয়েট পাওয়ার স্পেকট্রা এবং পুনরাবৃত্তির সাথে জড়িত, সেরা ওয়েট ওয়েক্টারের বিশ্লেষণী আপডেটিং জড়িত; তদুপরি আমি এটি অনুমান করি যে এটি সমস্যার মধ্যে চলে যেতে পারে ))pn

সিআরএএন- তে একটি আর প্যাকেজ ফোরসিএও রয়েছে (আবার: আমি লেখক) যা বুনিয়াদি কার্যকারিতা প্রয়োগ করে; এখনই এটি সময় সিরিজের জন্য পূর্বাভাসযোগ্যতা পরিমাপ অনুমান করতে কার্যকারিতা সমর্থন করে এবং এটি মাল্টিভারিয়েট স্পেকট্রার জন্য কিছু ভাল র‌্যাপার ফাংশন রয়েছে (আবার ২০,০০০ টাইম সিরিজ সম্ভবত একবারে হ্যান্ডেল করার জন্য খুব বেশি)।Ω(xt)

তবে আপনি বিভিন্ন উপ-গ্রুপে 20,000 এর মোটা গ্রিড বিভাজন করতে রব কর্তৃক প্রস্তাবিত MASE পরিমাপটি ব্যবহার করার চেষ্টা করতে পারেন এবং তারপরে প্রতিটি আলাদা আলাদাভাবে ফোরসিএ প্রয়োগ করতে পারেন।


0

এই উত্তরটি খুব দেরীতে, তবে যারা এখনও পণ্য চাহিদা সময় সিরিজের জন্য যথাযথ পরিমাপের পূর্বাভাসের সন্ধান করছেন তাদের পক্ষে আমি আনুমানিক এনট্রপির দিকে সন্ধানের পরামর্শ দিই ।

একটি সময় সিরিজে ওঠানামাটির পুনরাবৃত্তিক নিদর্শনগুলির উপস্থিতি এটি এমন সময় সিরিজের তুলনায় আরও অনুমানযোগ্য করে তোলে যেখানে এই ধরণগুলি অনুপস্থিত। অ্যাপেন সম্ভাবনা প্রতিফলিত করে যে পর্যবেক্ষণগুলির অনুরূপ প্যাটার্নগুলি অতিরিক্ত অনুরূপ পর্যবেক্ষণ দ্বারা অনুসরণ করা হবে না [[]] অনেক পুনরাবৃত্ত নিদর্শন সমন্বিত একটি সময় সিরিজের তুলনামূলকভাবে ছোট অ্যাপেন থাকে; কম অনুমানযোগ্য প্রক্রিয়াটির উচ্চতর অ্যাপেন থাকে।

পণ্যের চাহিদাতে খুব শক্তিশালী মৌসুমী উপাদান থাকে, পরিবর্তনের সহগ (সিভি) অনুপযুক্ত করে তোলে। অ্যাপেন (মি, আর) সঠিকভাবে এটি পরিচালনা করতে সক্ষম। আমার ক্ষেত্রে, যেহেতু আমার ডেটাগুলিতে একটি শক্তিশালী সাপ্তাহিক seasonতু রয়েছে, তাই আমি এখানে সুপারিশ অনুসারে প্যারামিটারগুলি m = 7 এবং r = 0.2 * std সেট করি ।


উইকিপিডিয়া নিবন্ধে, আপনার mean অর্থ কী? u
ব্লেকফট

আমি এখন দেখি. আমি ভেবেছিলাম এবং সম্পর্কযুক্ত, তবে বাস্তবে তা নয়। তোমার দর্শন লগ করা *uu
ব্লেকওফট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.