সময়-সিরিজের পূর্বাভাসের জন্য "ডেটা বৃদ্ধি" করার জন্য আমি দুটি কৌশল বিবেচনা করছি।
প্রথমত, কিছুটা পটভূমি। টাইম-সিরিজের পরবর্তী ধাপ পূর্বাভাস দেওয়ার জন্য একজন ভবিষ্যদ্বাণীকারী একটি ফাংশন যা সাধারণত দুটি বিষয়ের উপর নির্ভর করে, সময়-সিরিজের অতীতের রাজ্যগুলি, তবে ভবিষ্যদ্বাণীকের অতীতের রাষ্ট্রগুলি:
যদি আমরা একটি ভাল পেতে আমাদের সিস্টেমকে সামঞ্জস্য / প্রশিক্ষণ দিতে চাই তবে আমাদের পর্যাপ্ত ডেটা দরকার। কখনও কখনও উপলভ্য ডেটা যথেষ্ট হবে না, তাই আমরা ডেটা বৃদ্ধি করার বিষয়টি বিবেচনা করি।
প্রথম পন্থা
ধরুন আমাদের কাছে সহ টাইম-সিরিজ । এবং ধরুন যে আমাদের কাছে যা নিম্নলিখিত শর্তটি পূরণ করে: ।
আমরা একটি নতুন সময়ের সিরিজ , যেখানে হ'ল বিতরণ ।
তারপরে, ক্ষতির ক্রিয়াকলাপটি কেবল চেয়ে কম করার পরিবর্তে আমরা এটি do এরও বেশি করি । সুতরাং, যদি অপ্টিমাইজেশন প্রক্রিয়াটি পদক্ষেপ নেয় , আমাদের ভবিষ্যদ্বাণীটিকে বার বার "সূচনা" করতে হবে এবং আমরা প্রায় ভবিষ্যদ্বাণীকারী অভ্যন্তরীণ রাজ্যগুলি গণনা করব ।
দ্বিতীয় পন্থা
আমরা আগের মতো গণনা করি , তবে আমরা ব্যবহার করে পূর্বাভাসকারীটির অভ্যন্তরীণ অবস্থা আপডেট করি না , তবে । লোকসান ফাংশন গণনার সময় আমরা দুটি সিরিজই একসাথে ব্যবহার করি, সুতরাং আমরা প্রায় পূর্বাভাসকারী অভ্যন্তরীণ রাজ্যগুলি গণনা করব ।
অবশ্যই এখানে কম কম্পিউটেশনাল কাজ হচ্ছে (যদিও অ্যালগোরিদমটি খানিকটা কুৎসিত) তবে আপাতত এটি কোনও বিষয় নয়।
সন্দেহ
সমস্যাটি হল: একটি পরিসংখ্যানের দিক থেকে, "সেরা" বিকল্পটি কোনটি? এবং কেন?
আমার অন্তর্নিহিততা আমাকে বলেছে যে প্রথমটি আরও ভাল, কারণ এটি অভ্যন্তরীণ অবস্থার সাথে সম্পর্কিত ওজনগুলিকে "নিয়মিত" করতে সহায়তা করে, যখন দ্বিতীয়টি কেবল পর্যবেক্ষণের সময়-সিরিজের 'অতীতের সাথে সম্পর্কিত ওজনগুলি নিয়মিত করতে সহায়তা করে।
অতিরিক্ত:
- সময় সিরিজের পূর্বাভাসের জন্য ডেটা বর্ধনের জন্য অন্য কোনও ধারণা?
- ট্রেনিং সেটে সিন্থেটিক ডেটা কীভাবে ওজন করবেন?