আমি যে সমস্যাটি নিয়ে কাজ করছি তা হ'ল সময় সিরিজের মানগুলির পূর্বাভাস। আমি এক সময় এক সময় সিরিজ দেখছি এবং উদাহরণস্বরূপ ইনপুট ডেটার 15% এর উপর ভিত্তি করে, আমি এর ভবিষ্যতের মানগুলি পূর্বাভাস দিতে চাই। এখন পর্যন্ত আমি দুটি মডেল জুড়ে এসেছি:
আমি উভয় চেষ্টা করে দেখেছি এবং সেগুলি সম্পর্কে কিছু নিবন্ধ পড়েছি। এখন আমি কীভাবে দুটির তুলনা করব সে সম্পর্কে আরও ভাল ধারণা পাওয়ার চেষ্টা করছি। আমি এ পর্যন্ত যা খুঁজে পেয়েছি:
- এলএসটিএম আরও ভাল কাজ করে যদি আমরা বিপুল পরিমাণে ডেটা নিয়ে কাজ করি এবং পর্যাপ্ত প্রশিক্ষণের ডেটা পাওয়া যায়, যখন অ্যারিএমএ আরও ছোট ডেটাসেটের জন্য ভাল (এটি কি সঠিক?)
- এআরআইএমএর একটি প্যারামিটারগুলির একটি সিরিজ প্রয়োজন
(p,q,d)
যা ডেটার উপর ভিত্তি করে গণনা করতে হবে, যখন এলএসটিএম এর জন্য এই জাতীয় পরামিতিগুলি সেট করার প্রয়োজন হয় না। তবে, এলএসটিএম-এর জন্য আমাদের কিছু হাইপারপ্যারামিটার টিউন করতে হবে।
উল্লিখিত বৈশিষ্ট্যগুলি বাদে আমি অন্য কোনও পয়েন্ট বা তথ্য খুঁজে পেলাম না যা আমাকে সেরা মডেলটি নির্বাচনের দিকে সহায়তা করতে পারে। কেউ যদি আমাকে নিবন্ধ, কাগজপত্র বা অন্যান্য জিনিসগুলি খুঁজে পেতে সহায়তা করতে পারে তবে (এখানে এখনও ভাগ্য হয়নি, কেবল এখানে এবং সেখানে কিছু সাধারণ মতামত রয়েছে এবং পরীক্ষার উপর ভিত্তি করে কিছুই নেই।)
আমাকে উল্লেখ করতে হবে যে মূলত আমি স্ট্রিমিং ডেটা নিয়ে কাজ করছি, তবে আপাতত আমি এনএবি ডেটাসেট ব্যবহার করছি যার মধ্যে 20k ডেটা পয়েন্টের সর্বাধিক আকারের 50 টি ডাটাসেট রয়েছে।