অনেক শূন্য মান সহ সময় সিরিজ বিশ্লেষণ


19

এই সমস্যাটি আসলে আগুন সনাক্তকরণ সম্পর্কিত, তবে এটি কয়েকটি তেজস্ক্রিয় ক্ষয় সনাক্তকরণ সমস্যার সাথে দৃ strongly়ভাবে অনুরূপ। যে ঘটনাটি পর্যবেক্ষণ করা হচ্ছে তা বিক্ষিপ্ত এবং অত্যন্ত পরিবর্তনশীল; সুতরাং, একটি টাইম সিরিজটি ভেরিয়েবলের মান দ্বারা বাধাগ্রস্থ শূন্যগুলির দীর্ঘ স্ট্রিং নিয়ে গঠিত।

উদ্দেশ্যটি কেবল ইভেন্টগুলি (শূন্যগুলিতে বিরতি) ক্যাপচার করা নয়, বরং ইভেন্টগুলি নিজেরাই পরিমাণগত বৈশিষ্ট্যযুক্তকরণ। তবে সেন্সরগুলি সীমাবদ্ধ, এবং "বাস্তবতা" শূন্য-শূন্য হলেও এমনকি কখনও কখনও শূন্য রেকর্ড করে। এই কারণে সেন্সরগুলির সাথে তুলনা করার সময় জিরোগুলি অবশ্যই অন্তর্ভুক্ত থাকতে হবে।

সেন্সর বি সেন্সর এ এর ​​চেয়ে সংবেদনশীল হতে পারে এবং আমি পরিসংখ্যানগতভাবে এটি বর্ণনা করতে সক্ষম হতে চাই। এই বিশ্লেষণের জন্য, আমার কাছে "সত্য" নেই, তবে আমার কাছে সেন্সর সি রয়েছে, যা সেন্সর এএন্ডবি থেকে স্বতন্ত্র। সুতরাং আমার প্রত্যাশাটি হ'ল A / B এবং C এর মধ্যে আরও ভাল চুক্তি "সত্যের" সাথে আরও ভাল চুক্তি নির্দেশ করে। (এটি নড়বড়ে মনে হতে পারে তবে আপনি আমাকে বিশ্বাস করতে হবে - সেন্সর সম্পর্কিত অন্যান্য গবেষণা থেকে যা জানা যায় তার ভিত্তিতে আমি এখানে দৃ solid় ভিত্তিতে আছি)।

সমস্যাটি হ'ল কীভাবে "সময়ের ধারাবাহিকের আরও ভাল চুক্তি" নির্ধারণ করা যায়। সহযোগিতা হ'ল সুস্পষ্ট পছন্দ, তবে all সমস্ত শূন্য দ্বারা প্রভাবিত হবে (যা বাদ যায় না), এবং অবশ্যই সর্বোচ্চ মূল্যবোধ দ্বারা অপ্রয়োজনীয়ভাবে প্রভাবিত। আরএমএসইও গণনা করা যায়, তবে কাছাকাছি-শূন্য ক্ষেত্রে সেন্সরগুলির আচরণের প্রতি দৃ strongly়ভাবে ওজন করা হবে।

প্রশ্ন 1: অ-শূন্য মানগুলিতে লগারিদমিক স্কেলিং প্রয়োগের সর্বোত্তম উপায় কী যা পরে সময়-সিরিজের বিশ্লেষণে শূন্যের সাথে মিলিত হবে?

প্রশ্ন 2: আপনি এই ধরণের টাইম-সিরিজ বিশ্লেষণের জন্য কোন "সেরা অনুশীলনগুলি" সুপারিশ করতে পারেন, যেখানে শূন্য-অমূল্যতে আচরণ মনোযোগ কেন্দ্রীভূত হয়, তবে শূন্য মানগুলি প্রাধান্য পায় এবং বাদ যায় না?

উত্তর:


11

আপনার প্রশ্নটি পুনঃস্থাপনের জন্য "বিশ্লেষক দীর্ঘমেয়াদে কোনও নির্দিষ্ট প্যাটার্ন অনুসরণ না করে এমন দাবিগুলির সাথে কীভাবে আচরণ করবেন?"

আপনার প্রশ্নের উত্তর হ'ল ইন্টারমিটেন্ট ডিমান্ড অ্যানালাইসিস বা স্পার ডেটা অ্যানালাইসিস। এটি সাধারণত উত্থাপিত হয় যখন আপনার অ-জিরো সংখ্যার সাথে তুলনামূলকভাবে "প্রচুর জিরো" থাকে issue সমস্যাটি হ'ল দুটি এলোমেলো ভেরিয়েবল রয়েছে; ইভেন্ট এবং ইভেন্টের প্রত্যাশিত আকারের মধ্যে সময়। আপনি যেমনটি বলেছিলেন যে সম্পূর্ণ পঠন-পাঠের স্বতঃসংশোধন (এসিএফ) মিথ্যাভাবে এসিফকে বর্ধন করে জিরোগুলির ক্রমের কারণে অর্থহীন। আপনি "ক্রোস্টনের পদ্ধতি" এর মতো থ্রেডগুলি অনুসরণ করতে পারেন যা ডেটা-ভিত্তিক পদ্ধতির পরিবর্তে একটি মডেল-ভিত্তিক পদ্ধতি। ক্রোস্টনের পদ্ধতিটি বহিরাগতদের এবং ঝুঁকির সাথে প্রবণতা / স্তরের পরিবর্তনের জন্য চাহিদার হারে অর্থাৎ চাহিদা সংখ্যার দ্বারা ভাগ করে দেওয়া শেষ দাবির পর থেকে পিরিয়ডস "" স্পার্স ডেটা - অব্যাহতভাবে ব্যবধানযুক্ত ডেটা "বা এটির মতো অনুসন্ধানগুলি অনুসরণ করা আরও অনেক কঠোর পদ্ধতির হতে পারে। ওএসইউর প্রফেসর রমেশ শারদা আমাকে একটি বরং উদ্ভাবনী সমাধানের পরামর্শ দিয়েছিলেন এবং আমি আমার পরামর্শ অনুশীলনে বেশ কয়েক বছর ধরে এটি ব্যবহার করে আসছি। যদি কোনও সিরিজের এমন সময় পয়েন্ট থাকে যেখানে বিক্রয় দেখা দেয় এবং দীর্ঘ সময় ধরে যেখানে কোনও বিক্রয় হয় না তখন পর্যবেক্ষণকৃত বিক্রয়কে কোনও বিক্রয়কালের সংখ্যা দ্বারা ভাগ করে এইভাবে কোনও হার প্রাপ্ত না করে পর্যায়ক্রমে বিক্রয়কে বিক্রয়ে রূপান্তর করা সম্ভব হয়। তারপরে একটি পূর্বাভাসের হার এবং পূর্বাভাসের ব্যবধানে শেষ হওয়া বিক্রয় এবং মধ্যবর্তী ব্যবধানের মধ্যে একটি মডেল সনাক্ত করা সম্ভব। আপনি অটোবক্স ডটকম এবং গুগল "অন্তর্বর্তী চাহিদা" এ এই সম্পর্কে আরও জানতে পারেন যদি কোনও সিরিজের এমন সময় পয়েন্ট থাকে যেখানে বিক্রয় দেখা দেয় এবং দীর্ঘ সময় ধরে যেখানে কোনও বিক্রয় হয় না তখন পর্যবেক্ষণকৃত বিক্রয়কে কোনও বিক্রয়কালের সংখ্যা দ্বারা ভাগ করে এইভাবে কোনও হার প্রাপ্ত না করে পর্যায়ক্রমে বিক্রয়কে বিক্রয়ে রূপান্তর করা সম্ভব হয়। তারপরে একটি পূর্বাভাসের হার এবং পূর্বাভাসের ব্যবধানে শেষ হওয়া বিক্রয় এবং মধ্যবর্তী ব্যবধানের মধ্যে একটি মডেল সনাক্ত করা সম্ভব। আপনি অটোবক্স ডটকম এবং গুগল "অন্তর্বর্তী চাহিদা" এ এই সম্পর্কে আরও জানতে পারেন যদি কোনও সিরিজের এমন সময় পয়েন্ট থাকে যেখানে বিক্রয় দেখা দেয় এবং দীর্ঘ সময় ধরে যেখানে কোনও বিক্রয় হয় না তখন পর্যবেক্ষণকৃত বিক্রয়কে কোনও বিক্রয়কালের সংখ্যা দ্বারা ভাগ করে এইভাবে কোনও হার প্রাপ্ত না করে পর্যায়ক্রমে বিক্রয়কে বিক্রয়ে রূপান্তর করা সম্ভব হয়। তারপরে একটি পূর্বাভাসের হার এবং পূর্বাভাসের ব্যবধানে শেষ হওয়া বিক্রয় এবং মধ্যবর্তী ব্যবধানের মধ্যে একটি মডেল সনাক্ত করা সম্ভব। আপনি অটোবক্স ডটকম এবং গুগল "অন্তর্বর্তী চাহিদা" এ এই সম্পর্কে আরও জানতে পারেন


1
মাঝে মাঝে দাবি নিয়ে আমার পূর্বাভাস দিতে সমস্যা হয়। আমাকে সমাধান করতে বলা হয়েছে। আমি জানি পূর্বাভাসের সময়টির জন্য নির্দিষ্ট কয়েকটি সফ্টওয়্যার রয়েছে তবে এটি নিখরচায় নয়। আপনি কি আমাকে দয়া করে বলতে পারেন যে এই সমস্যাটি সমাধানের জন্য আপনি ওপেন সোর্স সফ্টওয়্যার (যেমন, আর এর মতো) কোনও বিল্ট-ইন ফাংশন সম্পর্কে জানেন? আমি অনুসন্ধান করছি কিন্তু এখনও পর্যন্ত এটি খুঁজে পেল না ... ধন্যবাদ!
আসু

1
@ এসসু: আপনার প্রয়োজন মেটাতে এমন কোনও ফ্রি সফটওয়্যার সম্পর্কে আমি অসচেতন।
আইরিশস্ট্যাট

4
@assu। আর croston()-এর forecastপ্যাকেজের কার্যকারিতা আন্তঃসমাধ্যমে চাহিদা ডেটা পূর্বাভাসের জন্য ক্রস্টনের পদ্ধতিটি কার্যকর করবে।
রব হ্যান্ডম্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.