সম্পূর্ণ প্রকাশ: আমি কোনও পরিসংখ্যানবিদ নই, আমিও এক হওয়ার দাবি করি না। আমি একজন স্বল্প আইটি প্রশাসক। দয়া করে আমার সাথে সৌম্য খেলুন। :)
আমি আমাদের উদ্যোগের জন্য ডিস্ক স্টোরেজ ব্যবহার সংগ্রহ এবং পূর্বাভাসের জন্য দায়বদ্ধ। আমরা আমাদের স্টোরেজটি মাসিক ব্যবহার সংগ্রহ করি এবং পূর্বাভাসের জন্য একটি সহজ রোলিং বারো মাসের লিনিয়ার রিগ্রেশন ব্যবহার করি (অন্য কথায়, কোনও প্রক্ষেপণ করার সময় কেবল পূর্ববর্তী বারো মাসের ডেটা বিবেচনা করা হয়)। আমরা বরাদ্দ এবং মূলধন ব্যয় পরিকল্পনার জন্য এই তথ্যটি ব্যবহার করি, উদাহরণস্বরূপ "এই মডেলের উপর ভিত্তি করে, আমাদের চাহিদা পূরণের জন্য Y মাসে যদি স্টোরেজ থাকে তবে আমাদের x পরিমাণ ক্রয় করতে হবে।" এটি আমাদের প্রয়োজন অনুসারে যথেষ্ট কাজ করে।
পর্যায়ক্রমে, আমাদের সংখ্যায় বিশাল এক-সময় চলন রয়েছে যা পূর্বাভাস বন্ধ করে দেয়। উদাহরণস্বরূপ, কেউ 500 গিগাবাইট পুরানো ব্যাকআপ খুঁজে পান যা আর প্রয়োজন হয় না এবং সেগুলি মুছে দেয়। জায়গা পুনরায় দাবি করার জন্য তাদের পক্ষে ভাল! তবে আমাদের পূর্বাভাস এখন এক মাসের মধ্যে এই বিশাল ড্রপ দ্বারা বন্ধ হয়ে গেছে। আমরা সর্বদা সবেমাত্র গ্রহণ করেছি যে এর মতো একটি ড্রপ মডেলগুলি থেকে বেরিয়ে আসতে 9-10 মাস সময় লাগে, তবে আমরা যদি মূলধন ব্যয় পরিকল্পনার মরসুমে প্রবেশ করি তবে এটি সত্যই দীর্ঘ সময় হতে পারে।
আমি ভাবছি যে এই ওয়ান-টাইম বৈকল্পিকাগুলি পরিচালনা করার কোনও উপায় আছে যাতে পূর্বাভাসকৃত মানগুলি তেমন প্রভাবিত হয় না (উদাহরণস্বরূপ, লাইনের slাল নাটকীয়ভাবে পরিবর্তিত হয় না), তবে সেগুলিকে বিবেচনায় নেওয়া হয় (উদাঃ সময়ের সাথে নির্দিষ্ট পয়েন্টের সাথে যুক্ত ওয়-মানের এক-সময় পরিবর্তন)। এটি মোকাবেলায় আমাদের প্রথম প্রয়াসে কিছু কুরুচিপূর্ণ ফলাফল পাওয়া গেছে (উদাহরণস্বরূপ ক্ষতিকারক বৃদ্ধির বক্ররেখা)। যদি গুরুত্বপূর্ণ হয় তবে আমরা এসকিউএল সার্ভারে আমাদের সমস্ত প্রসেসিং করি।