প্রতিদিনের ডেটার জন্য একাধিক রিগ্রেশনে seasonতু ক্যাপচার করা


13

আমার কাছে এমন একটি পণ্যের দৈনিক বিক্রয় ডেটা রয়েছে যা অত্যন্ত মৌসুমী। আমি রিগ্রেশন মডেলটিতে seasonতুকে ক্যাপচার করতে চাই। আমি পড়েছি যে আপনার যদি ত্রৈমাসিক বা মাসিক ডেটা থাকে তবে সেই ক্ষেত্রে আপনি যথাক্রমে 3 এবং 11 টি ডামি ভেরিয়েবল তৈরি করতে পারেন - তবে আমি কি প্রতিদিনের ডেটা নিয়ে ডিল করতে পারি?

আমার কাছে তিন বছরের দৈনিক ডেটা রয়েছে। স্বাধীন ভেরিয়েবলগুলি হ'ল মূল্য পয়েন্ট, প্রচারমূলক পতাকা (হ্যাঁ / না) এবং তাপমাত্রা। নির্ভরশীল পরিবর্তনশীল হ'ল সেই পণ্যটির বিক্রয়। আমি একাধিক রিগ্রেশন মডেল ব্যবহার করায় আমি সময় সিরিজের মডেলটি খুঁজছি না।


আপনি কত তথ্য পেয়েছেন? কত বছরের মূল্য? আপনার কাছে তাপমাত্রার মতো কোনও কিছুর ডেটা রয়েছে? আপনার মডেল বাকি মত কি? আপনার ডিভি এবং আইভি কি কি?
পিটার ফ্লুম - মনিকা পুনরায়

পিটার ফ্লোম যা জিজ্ঞাসা করেছিল তা ছাড়াও, আপনি কি আপনার ডেটাটিকে অবিচ্ছিন্ন সময় সিরিজ বা মাল্টিভারিয়েট টাইম সিরিজ হিসাবে মডেলিং করছেন? যদি এটি মাল্টিভারিয়েট হয় তবে আপনার অন্যান্য ভেরিয়েবলগুলি রয়েছে? সেই পরিবর্তনশীলগুলি কি মৌসুমী আচরণ প্রদর্শন করে? যদি তাই ডামি ভেরিয়েবল যুক্ত করা অপ্রয়োজনীয় হবে। আপনি এই অতিরিক্ত তথ্য সরবরাহ করতে পারেন?
পূর্বাভাসকারী

আমি আমার প্রশ্ন সম্পাদনা করেছি। আপনি কি কোনও সমাধান দিতে পারেন দয়া করে। ধন্যবাদ
আরুশি


আমি ইরিশস্ট্যাট এর সাথে সম্পূর্ণরূপে একমত, আমরা সময় সিরিজের মডেলগুলিকে উপেক্ষা করার মতো ধারণা করব না, একাধিক মৌসুমীতা ধরে রাখার জন্য এটি বেশ ভাল মডেল I প্রবণতা, একযোগে.আর একচেটিয়াভাবে। আপনি পূর্বাভাস () প্যাকেজ ব্যবহার করতে পারেন।
কারথি ভি

উত্তর:


10

@ ইরিশস্তাত আমি যা বলার ছিল তা অনেকটা কভার করেছিল, তবে আমি টাইম সিরিজ রিগ্রেশন এবং ওএলএস রিগ্রেশন সহ এই ডেটাগুলিকে মডেলিংয়ের নিজস্ব ব্যক্তিগত অভিজ্ঞতার সাথে প্রতিক্রিয়া জানাব।

এটি যদি প্রতিদিনের ডেটা হয় তবে আমি নিম্নলিখিতগুলি করবো:

বিভিন্ন মরসুমের জন্য একটি ডামি ভেরিয়েবল তৈরি করুন:

  • সপ্তাহের seasonতুতে দিনটি ধরতে 6 টি ডামি ভেরিয়েবল তৈরি করুন।
  • মাসের seasonতুর দিনটি ক্যাপচার করতে 30 টি ডামি ভেরিয়েবল তৈরি করুন
  • বছরের মাস ক্যাপচার করতে 11 টি ডামি ভেরিয়েবল তৈরি করুন।

ট্রেন্ড ভেরিয়েবলের জন্য ডামি ভেরিয়েবল তৈরি করুন:

  • যদি সময় সিরিজ লিনিয়ার প্রবণতা প্রদর্শন করে, তবে একটি সময়ের ট্রেন্ড ভেরিয়েবল যুক্ত করুন।

  • যদি সময় সিরিজটি অলৈখিক প্রবণতা প্রদর্শন করে তবে চতুর্ভুজ / ঘনক / লগের মতো একটি ননলাইনারের টাইম ট্রেন্ড ভেরিয়েবল যুক্ত করুন

স্বতন্ত্র ভেরিয়েবল ভেরিয়েবল যুক্ত করুন

  • এটি একটি টাইম সিরিজের ডেটা, তাই স্বাধীন ভেরিয়েবলের সীসা এবং পিছনের প্রভাবগুলি সম্পর্কে যত্ন নেওয়া উচিত। উদাহরণস্বরূপ, উদাহরণস্বরূপ, আপনি মূল্যবোধের প্রচারমূলক পতাকা উল্লেখ করেছেন, তারা আপনার প্রতিক্রিয়াতে তাত্ক্ষণিকভাবে প্রভাব ফেলবে না, অর্থাত্ পিছিয়ে থাকতে পারে এবং ক্ষয়িষ্ণু / স্থায়ী প্রভাব থাকতে পারে । সুতরাং উদাহরণস্বরূপ, আজ যদি কোনও প্রচার চালায় তবে আজ আপনার বিক্রি বাড়তে পারে তবে কিছু দিনের পরে পদোন্নতির প্রভাব হ্রাস পায়। একাধিক রিগ্রেশন ব্যবহার করে এটির মডেল করার সহজ উপায় নেই, আপনি ট্রান্সফার ফাংশন মডেলিংটি ব্যবহার করতে চান যা পার্সিমোনয়েস এবং কোনও ধরণের সীসা এবং পিছনে প্রভাবগুলি পরিচালনা করতে পারে। এই উদাহরণটি আমি আগে পোস্ট করেছি, যেখানে একটি হস্তক্ষেপ আছে (আপনার ক্ষেত্রে দামের পয়েন্টে) এবং হঠাৎ বৃদ্ধি ঘটে, এর পরে ক্ষয়কারী প্রভাব দেখা যায়। বলার পরে যদি আপনার হয়সীসা এবং পিছনে প্রভাব সম্পর্কে অগ্রাধিকার জ্ঞান, দাম পয়েন্টের আগে এবং পরে আপনার ক্ষেত্রে ডামি ভেরিয়েবল এবং (হ্যাঁ / না) প্রচার পরিবর্তনের জন্য অতিরিক্ত ভেরিয়েবল তৈরি করুন।

  • আপনার চলমান ছুটির দিনগুলির সূচক ভেরিয়েবলগুলিও যুক্ত করতে হবে, উদাহরণস্বরূপ আইরিশস্ট্যাট উল্লেখ করেছেন যে আপনি ইস্টার / থ্যাঙ্কসগিভিং (মার্কিন যুক্তরাষ্ট্রে) যোগ করতে চান যা ছুটির দিনগুলিতে চলেছে। ছুটির নির্দিষ্ট তারিখগুলি স্বয়ংক্রিয়ভাবে যত্ন নেওয়া হবে যদি আপনি মরসুমতা ক্যাপচারের জন্য ডমি কোডিং স্কিম ব্যবহার করেন।

  • এছাড়াও, আপনাকে অ্যাডিটিভ / পালস (এক সময়ের ইভেন্ট) বা লেভেল শিফ্ট (স্থায়ী শিফট) এর মতো আউটলিয়ারগুলি সনাক্ত করতে হবে এবং এগুলিকে নিবন্ধক হিসাবে যুক্ত করতে হবে। সময় সিরিজের ডেটার জন্য একাধিক রিগ্রেশনে আউটলিয়ারদের সনাক্ত করা প্রায় অসম্ভব; আপনার দরকার হবে টাইম সিরিজের আউটিলার সনাক্তকরণ পদ্ধতি যেমন সয়ের পদ্ধতি বা চেন এবং লিউর পদ্ধতি যা অটোবক্স, এসপিএসএস, এসএএস বা আর এর tsoutlierপ্যাকেজ হিসাবে সফ্টওয়্যারটিতে অন্তর্ভুক্ত করা হয়েছে need

সম্ভাব্য সমস্যার:

আপনি ওএলএস একাধিক রিগ্রেশন ব্যবহার করে সময় সিরিজের ডেটা মডেল করলে আপনি যে সমস্যার মুখোমুখি হোন সেগুলি নিম্নলিখিত।

  • ত্রুটিগুলি স্বতঃসংশ্লিষ্ট হতে পারে। এই সমস্যাটি ব্যাখ্যা করে এই সুন্দর ওয়েবসাইট এবং এই ওয়েবসাইটটি দেখুন । এটি এড়ানোর এক উপায় হ'ল জেনারেলাইজড ন্যূনতম স্কোয়ার্স (জিএলএস) বা এরিম্যাক্স অ্যাপ্রোচ বনাম ওএলএস একাধিক রিগ্রেশন ব্যবহার করা, যেখানে আপনি স্বতঃসংযোগের জন্য সংশোধন করতে পারেন।
  • ওএলএস মডেল পার্সিমোনয়াস হবে না। আপনার কাছে ডামি ভেরিয়েবল রয়েছে seasonতুরতার জন্য।6+30+11=47
  • ডামি ভেরিয়েবলগুলি ব্যবহার করে, আপনি ধরে নিচ্ছেন যে আপনার seasonতুটি নির্বিচারবাদী অর্থাৎ সময়ের সাথে এটি পরিবর্তন হয় না। যেহেতু আপনার কাছে মাত্র 3 বছরের ডেটা রয়েছে আমি এটি সম্পর্কে চিন্তা করব না তবে তবুও সিরিজটি প্লট করা এবং theতু পরিবর্তন হয় না কিনা তা দেখার জন্য এটি সার্থক।

এবং একাধিক রিগ্রেশন ব্যবহারের আরও অনেক অসুবিধা রয়েছে। যদি ভবিষ্যদ্বাণী আপনার কাছে আরও গুরুত্বপূর্ণ হয় তবে আমি কমপক্ষে 6 মাসের ডেটা ধরে রাখব এবং আপনার একাধিক রিগ্রেশনটির ভবিষ্যদ্বাণীমূলক দক্ষতা পরীক্ষা করব। যদি আপনার মূল লক্ষ্যটি স্বাধীন ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ককে ব্যাখ্যা করা হয়, তবে আমি একাধিক রিগ্রেশন ব্যবহার করে সতর্ক থাকব এবং এর পরিবর্তে আমি আরিম্যাক্স / জিএলএসের মতো সময় সিরিজের পদ্ধতির ব্যবহার করব।

আপনি যদি আগ্রহী হন তবে স্থানান্তর ফাংশন এবং ডায়নামিক রিগ্রেশন মডেলিংয়ের জন্য আপনি পঙ্ক্রাটজের দুর্দান্ত পাঠ্যটি উল্লেখ করতে পারেন । সাধারণ সময়ের সিরিজ পূর্বাভাসের জন্য দয়া করে ম্যাক্রিডাকিস এট আল দেখুন । এছাড়াও, রিগ্রেশন এবং সময় সিরিজ ভিত্তিক পূর্বাভাসের জন্য ডায়াবোল্ডের দ্বারা একটি ভাল রেফারেন্স পাঠ্য হবে ।


খুব সুন্দর সংক্ষিপ্তসার তবে আমি যোগ করতে চাই যে আপনি সপ্তাহান্তিক প্রভাবগুলির সম্ভাব্য সপ্তাহের প্রভাব ছাড়াও মাসের নির্দিষ্ট সপ্তাহের বিশেষ মাসের বিশেষ প্রভাবগুলি উপেক্ষা করেছেন যা আমি খুব গুরুত্বপূর্ণ বলে মনে করেছি found তদ্ব্যতীত প্রাক ইভেন্ট এবং পোস্ট-পরবর্তী প্রভাবগুলি এড়ানো হবে না। ইস্টার এবং অন্যান্য বড় ছুটির দিন / অনুষ্ঠানের আশেপাশের ক্রিয়াকলাপটি বিবেচনা করুন often প্রায়শই একটি পৃথক প্রতিক্রিয়া প্যাটার্ন থাকে যার জন্য নেতৃত্বের নির্দিষ্টকরণের অন্তর্ভুক্তি প্রয়োজন। আপনার এও লক্ষ্য করা উচিত যে প্যারামিটারগুলি সময়ের সাথে সাথে প্রায়শই পরিবর্তিত হতে পারে এবং প্যারামিটারগুলির স্থায়িত্বের ধারণাটি বৈধ হওয়া দরকার।
আইরিশস্ট্যাট

ধন্যবাদ @ আইরিশটাত। তুমি ঠিক. আমি চলন্ত ছুটির দিনগুলি এবং তাদের সীসা এবং পিছনে প্রভাবগুলি ভুলে গেছি।
পূর্বাভাসকারী

2

আপনার যা দরকার তা হ'ল এমন একটি মডেল যা প্রতিদিনের প্রভাবগুলি, সাপ্তাহিক প্রভাবগুলি, মাসিক প্রভাবগুলি, মাসের প্রভাবগুলির সপ্তাহের, মাসের দিনগুলির প্রভাবগুলি, ছুটির দিনগুলির সীসা এবং পিছনে প্রভাবগুলি, অনির্ধারিত তবে পরীক্ষামূলকভাবে চিহ্নিতকরণের স্তর / পদক্ষেপে স্থান পরিবর্তন করবে, স্থানীয় সময়ের প্রবণতা, মৌসুমী ডাল এবং ডালের পরিবর্তন যখন এআরআইএমএ কাঠামোকে সংমিশ্রণ করে এবং সম্ভবত সময়ের সাথে সাথে পরামিতিগুলির পরিবর্তন এবং ত্রুটির প্রকরণের সাথে ডিল করে। একে ট্রান্সফার ফাংশন বলা হয় এবং একাধিক লিনিয়ার রিগ্রেশন হিসাবে সহজেই পুনঃস্থাপন করা যায় (তবে পার্সোনিমিও নয়) rest

নির্দিষ্টভাবে একটি দৈনিক সূচক 6 ভবিষ্যদ্বাণী নেবে। সাধারণত কোনটি ভবিষ্যদ্বাণীকারীদের প্রয়োজন তা সাবধানতার সাথে অর্কেস্টেট করতে হবে (সনাক্ত করতে হবে)। আপনার হাতে যদি আপনার হাতে প্রচুর সময় থাকে তবে আপনি উল্লেখ করেছেন এমন কয়েকটি কাঠামোর সাথে আপনি পরীক্ষা করতে পারেন। বিকল্পভাবে আপনার জীবদ্দশায় আপনার সমস্যার সমাধান করতে আপনাকে কিছু উন্নত সফ্টওয়্যার / পরামর্শ প্রয়োজন হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.