লস টাইম সিরিজের মডেলটির জন্য বর্ধিত শিক্ষণ


9

আমি বর্তমানে কিছু সময়ের সিরিজের ডেটা নিয়ে কাজ করছি, আমি জানি আমি আলগা / আরিমা মডেলটি ব্যবহার করতে পারি।

ডেটা এমন কোনও ভেক্টরকে লেখা হয় যার দৈর্ঘ্য 1000, যা একটি সারি, প্রতি 15 মিনিটে আপডেট হয়,

সুতরাং পুরানো ডেটা পপ আউট হয়ে যাবে যখন নতুন ডেটা ভেক্টরে ঠেলে দেবে।

আমি একটি শিডিউলারে পুরো মডেলটি পুনরায় চালু করতে পারি, উদাহরণস্বরূপ প্রতি 15 মিনিটে মডেলটিকে পুনরায় প্রশিক্ষণ করুন, অর্থাত, লস মডেলটি প্রশিক্ষণের জন্য পুরো 1000 মানটি ব্যবহার করুন, তবে এটি খুব অদক্ষ, কারণ প্রতিবার কেবল একটি মান সন্নিবেশ করা হয় এবং অন্য 999 টি ভ্যালু গতবারের মতো এখনও

তাহলে আমি কীভাবে আরও ভাল পারফরম্যান্স অর্জন করতে পারি?

অনেক ধন্যবাদ


3
"লস / আরিমা মডেল" কী? আপনি কি আরিমা ত্রুটিযুক্ত একটি ননলাইনারের সময় প্রবণতা বোঝাতে চেয়েছেন যেখানে ননলাইনার প্রবণতাটি লোস ব্যবহার করে অনুমান করা হয়?
রব হ্যান্ডম্যান

দুঃখিত আমি লস বা আরিমা মডেল বলতে চাইছি। উদাহরণস্বরূপ, অবশিষ্টাংশগুলি যেমন খুঁজে পেতে আমি শিথিলতা ব্যবহার করি: অবশিষ্টাংশ (লোস (x ~ সময়))। কারণ এক্স এক্স 1000 মান সহ ভেক্টর যা প্রতি 15 মিনিটে আপডেট হয়। কীভাবে আমি দক্ষতার সাথে অবশিষ্টাংশগুলি পেতে পারি, তবে পুরো ডেটসেটটি প্রতিবার ইনপুট হিসাবে পুনরায় চালু করতে পারি না? প্রতিবার মাত্র 1 টি মান আপডেট হিসাবে, অন্যান্য 999 মানগুলি গতবারের মতো এখনও রয়েছে।
ঝং

একটি সম্ভাব্য পদ্ধতি, পরবর্তী 1000 মানগুলির পূর্বাভাস দেওয়ার জন্য প্রথম 1000 মানগুলি ব্যবহার করুন (যদিও LOESS কেবল 4 টি মানকে পূর্বাভাস দেয়) তবে অবশিষ্ট মূল্যকে যথাযথ মান এবং সংশ্লিষ্ট পূর্বাভাস মানের মধ্যে পার্থক্য হিসাবে গণনা করুন T তারপরে প্রতি 1000 মানগুলিকে পুনরায় প্রশিক্ষণ দিন, এটি আদৌ আমি চাই মূল লস মডেল নয় :-(
ঝ্যাং

উত্তর:


1

আমাকে আমার আরও পরিচিত কিছুতে এটি নতুন করে তৈরি করতে দিন। এআরআইএমএ হ'ল পিআইডি আনুমানিক একটি এনালগ। আমি অবিচ্ছেদ্য। এম এ পি। এআরটি পার্থক্য সমীকরণ হিসাবে প্রকাশ করা যেতে পারে যা ডি পদটি। লস হ'ল কমপক্ষে স্কোয়ের ফিটিংয়ের একটি এনালগ ((উচ্চ প্রযুক্তির বড় ভাই সত্যই)।

সুতরাং আমি যদি দ্বিতীয় অর্ডার মডেল (পিআইডি) উন্নত করতে চাইতাম তবে কী করা যায়?

  • প্রথমত, আমি একক টুকরো নতুন তথ্যের সাথে মডেলটি আপডেট করতে কলম্যান ফিল্টার ব্যবহার করতে পারি।
  • আমি "গ্রেডিয়েন্ট বুস্টেড ট্রি" নামে পরিচিত এমন কিছু বিষয়ও দেখতে পারি। সেগুলির একটি অ্যানালগ ব্যবহার করে, আমি একটি দ্বিতীয় আরিমা মডেল তৈরি করবো যার ইনপুটগুলি উভয়ই প্রথম খাওয়ানো কাঁচা ইনপুট, প্রথমটির ত্রুটিগুলি সংযোজন করে।
  • আমি একাধিক মোডের ত্রুটিগুলির পিডিএফ দেখে বিবেচনা করব। যদি আমি ত্রুটিগুলি ক্লাস্টার করতে পারি তবে আমি মডেলগুলি বিভক্ত করতে বা ইনপুটগুলিকে উপ-মডেলগুলিতে পৃথক করতে মিশ্রণ মডেল ব্যবহার করতে পারি। সাবমোডেলগুলি একক বৃহত আকারের মডেলের চেয়ে স্থানীয় ঘটনাবলি পরিচালনা করতে আরও ভাল হতে পারে।

আমি যে প্রশ্নগুলির মধ্যে জিজ্ঞাসা করতে ব্যর্থ হয়েছি তার একটি হ'ল "পারফরম্যান্স বলতে কী বোঝায়?" যদি আমাদের ধার্মিকতার জন্য পরিষ্কারভাবে বিবৃত ব্যবস্থা না থাকে তবে প্রার্থী পদ্ধতি "উন্নতি" হয়েছে কিনা তা জানানোর উপায় নেই। দেখে মনে হচ্ছে আপনি আরও ভাল মডেলিং, সংক্ষিপ্ত গণনার সময় এবং তথ্যের আরও দক্ষ ব্যবহার চান। আসল ডেটা সম্পর্কে ইফেমেরিস থাকাও এটি জানাতে পারে। আপনি যদি বায়ু মডেলিং করেন তবে আপনি জানতে পারবেন কোথায় বৃদ্ধির মডেলগুলি সন্ধান করতে হবে, বা আপনার ডেটাগুলির জন্য রূপান্তরগুলি দরকারী যা কার্যকর।


1

আপনি কোনও লোস বা একটি আরিমা মডেল ব্যবহার করছেন কিনা তার উপর নির্ভর করে এটি একটি আলাদা প্রশ্ন। আমি আপাতত নিচু প্রশ্নের জবাব দেব, কারণ আমার সন্দেহ আছে যে আরিমা মামলায় আরম্ভের মানগুলির একটি ভাল সেট ব্যতীত অন্য কিছু দক্ষতার সম্ভাবনা রয়েছে।

একটি লোস মডেল ডেটার বিভিন্ন উপধারায় একটি ভারী রিগ্রেশন ফিট করে কাজ করে। প্রতিটি ফিটের জন্য কেবলমাত্র একটি অনুপাতের ডেটা ব্যবহার করা হয়। সুতরাং প্রতিবার আপনি যখন মডেলটিকে এক প্রান্তে একটি ডেটা পয়েন্ট বাদ দিয়েছিলেন এবং বিপরীত প্রান্তে অন্যটি যুক্ত করেন তখন আপনি প্রযুক্তিগতভাবে কেবলমাত্র প্রথম এবং শেষ পয়েন্ট ব্যবহার করে এমন স্থানীয় রেজিস্ট্রেশনগুলিকে ফিট করতে পারেন। এর মধ্যে থাকা সমস্ত স্থানীয় সংবিধান একই হবে। ঠিক কতগুলি এই অ-প্রভাবিত স্থানীয় রেগ্রেশন রয়েছে তা আপনার ধনুকের স্মুথ প্যারামিটারের উপর নির্ভর করবে।

আপনি আপনার মডেলটি ফিট করার জন্য যা যা প্যাকেজ ব্যবহার করছেন তা হ্যাক করতে পারেন যাতে এটি আগের ফিট থেকে স্থানীয় স্থানীয় অঞ্চলগুলির বেশিরভাগ অংশ নিতে পারে এবং কেবলমাত্র তথ্যের শুরুতে এবং শেষে প্রয়োজনীয় জিনিসগুলি ফিট করে।

যাইহোক, আমার কাছে এটি করা কেবলমাত্র উপযুক্ত যদি মনে হয় যে অতিরিক্ত প্রোগ্রামিংয়ের সময় ব্যয়টি প্রতি 15 মিনিটের মধ্যে স্ক্র্যাচ থেকে মডেলটিকে ফিট করার জন্য কম্পিউটার সময়কালের তুলনায় বস্তুগতভাবে কম ছিল। শুধুমাত্র 1000 ডেটা পয়েন্ট সহ অবশ্যই প্রতিবার স্ক্র্যাচ থেকে মডেলটি ফিট করা এত বড় জিনিস নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.