আমি যে সমস্যাটি নিয়ে কাজ করছি তা হ'ল সময় সিরিজের মানগুলির পূর্বাভাস। আমি এক সময় এক সময় সিরিজ দেখছি এবং উদাহরণস্বরূপ ইনপুট ডেটার 15% এর উপর ভিত্তি করে, আমি এর ভবিষ্যতের মানগুলি পূর্বাভাস দিতে চাই। এখন পর্যন্ত আমি দুটি মডেল জুড়ে এসেছি:
- LSTM (দীর্ঘ স্বল্পমেয়াদী মেমরি; পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির একটি শ্রেণি)
- Arima
আমি উভয় চেষ্টা করে দেখেছি এবং সেগুলি সম্পর্কে কিছু নিবন্ধ পড়েছি। এখন আমি কীভাবে দুটির তুলনা করব সে সম্পর্কে আরও ভাল ধারণা পাওয়ার চেষ্টা করছি। আমি এ পর্যন্ত যা খুঁজে পেয়েছি:
- এলএসটিএম আরও ভাল কাজ করে যদি আমরা বিপুল পরিমাণে ডেটা নিয়ে কাজ করি এবং পর্যাপ্ত প্রশিক্ষণের ডেটা পাওয়া যায়, যখন অ্যারিএমএ আরও ছোট ডেটাসেটের জন্য ভাল (এটি কি সঠিক?)
- এআরআইএমএর একটি প্যারামিটারগুলির একটি সিরিজ প্রয়োজন
(p,q,d)
যা ডেটার উপর ভিত্তি করে গণনা করতে হবে, যখন এলএসটিএম এর জন্য এই জাতীয় পরামিতিগুলি সেট করার প্রয়োজন হয় না। তবে, এলএসটিএম-এর জন্য আমাদের কয়েকটি হাইপারপ্যারামিটার টিউন করতে হবে। - সম্পাদনা: এখানে একটি দুর্দান্ত নিবন্ধ পড়ার সময় আমি দুজনের মধ্যে একটি প্রধান পার্থক্য লক্ষ্য করেছি যে, আরিমা কেবল স্থায়ী সময় সিরিজে ভাল পারফরম্যান্স করতে পারে (যেখানে কোনও seasonতু, প্রবণতা ইত্যাদি নেই) এবং আপনার যদি সেই যত্ন নেওয়া দরকার তবে আরিমা ব্যবহার করতে চাই
উল্লিখিত বৈশিষ্ট্যগুলি বাদে আমি অন্য কোনও পয়েন্ট বা তথ্য খুঁজে পাইনি যা সেরা মডেলটি নির্বাচন করতে আমাকে সহায়তা করতে পারে। যদি কেউ আমাকে নিবন্ধ, কাগজপত্র বা অন্যান্য জিনিস সন্ধান করতে সহায়তা করতে পারে তবে (এখানে এখনও ভাগ্য ছিল না, কেবল এখানে এবং সেখানে কিছু সাধারণ মতামত রয়েছে এবং পরীক্ষার উপর ভিত্তি করে কিছুই নেই।)
আমার উল্লেখ করতে হবে যে মূলত আমি স্ট্রিমিং ডেটা নিয়ে কাজ করছি, তবে আপাতত আমি এনএবি ডেটাসেট ব্যবহার করছি যার মধ্যে 20k ডেটা পয়েন্টের সর্বাধিক আকারের 50 টি ডাটাসেট রয়েছে।