আমার কাছে 3 মাসের ডেটা (প্রতিটি দিনের সাথে সীমাবদ্ধ প্রতিটি) উত্পন্ন হয়েছে এবং আমি এটির জন্য বহুবিধ সময় সিরিজ বিশ্লেষণ করতে চাই:
যে কলামগুলি উপলভ্য তা হ'ল -
Date Capacity_booked Total_Bookings Total_Searches %Variation
প্রতিটি তারিখের ডেটাসেটে 1 টি প্রবেশ থাকে এবং এতে 3 মাসের ডেটা থাকে এবং আমি অন্যান্য ভেরিয়েবলগুলির পূর্বাভাস দেওয়ার জন্য একটি মাল্টিভারিয়েট টাইম সিরিজের মডেলটি ফিট করতে চাই।
এখনও অবধি, এটি আমার চেষ্টা ছিল এবং আমি নিবন্ধগুলি পড়ে এটি অর্জন করার চেষ্টা করেছি।
আমিও তাই করেছি -
df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y')
data = df.drop(['Date'], axis=1)
data.index = df.Date
from statsmodels.tsa.vector_ar.vecm import coint_johansen
johan_test_temp = data
coint_johansen(johan_test_temp,-1,1).eig
#creating the train and validation set
train = data[:int(0.8*(len(data)))]
valid = data[int(0.8*(len(data))):]
freq=train.index.inferred_freq
from statsmodels.tsa.vector_ar.var_model import VAR
model = VAR(endog=train,freq=train.index.inferred_freq)
model_fit = model.fit()
# make prediction on validation
prediction = model_fit.forecast(model_fit.data, steps=len(valid))
cols = data.columns
pred = pd.DataFrame(index=range(0,len(prediction)),columns=[cols])
for j in range(0,4):
for i in range(0, len(prediction)):
pred.iloc[i][j] = prediction[i][j]
আমার একটি বৈধতা সেট এবং পূর্বাভাস সেট আছে। তবে ভবিষ্যদ্বাণীগুলি প্রত্যাশার চেয়ে অনেক খারাপ।
ডেটাসেটের প্লটগুলি হ'ল - ১% পার্থক্য
আমি যে আউটপুটটি পাচ্ছি তা হ'ল -
পূর্বাভাস ডেটা ফ্রেম -
বৈধতা ডেটাফ্রেম -
আপনি দেখতে পাচ্ছেন যে পূর্বাভাসগুলি প্রত্যাশিত হয় তা বন্ধ হয়ে যায়। নির্ভুলতার উন্নতি করার জন্য যে কেউ কোনও উপায়ে পরামর্শ দিতে পারে। এছাড়াও, আমি যদি পুরো ডেটাতে মডেলটি ফিট করি এবং তারপরে পূর্বাভাসগুলি মুদ্রণ করি তবে নতুন মাস শুরু হয়েছে এবং তাই এর পূর্বাভাস দেওয়ার জন্য এটি বিবেচনায় নেবে না। এটি এখানে কীভাবে সংহত করা যায়। কোন সাহায্য প্রশংসা করা হয়।
সম্পাদনা
ডেটাসেটের সাথে লিঙ্ক - ডেটাসেট
ধন্যবাদ