সময় সিরিজ পূর্বাভাস স্বয়ংক্রিয় করা সম্ভব?


17

আমি একটি অ্যালগরিদম তৈরি করতে চাই যা যে কোনও সময় সিরিজ বিশ্লেষণ করতে সক্ষম হবে এবং বিশ্লেষিত সময় সিরিজের ডেটার জন্য "স্বয়ংক্রিয়ভাবে" সেরা traditionalতিহ্যবাহী / স্টেটিসিকাল পূর্বাভাস পদ্ধতি (এবং এর পরামিতি) চয়ন করতে পারে।

এরকম কিছু করা কি সম্ভব? যদি হ্যাঁ, তবে আপনি কীভাবে এটির কাছে যেতে পারেন সে সম্পর্কে আমাকে কিছু টিপস দিতে পারেন?


3
না, এটি যুক্তিসঙ্গতভাবে অর্জন করা যায় না। প্রায়শই, দুটি যুক্তিসঙ্গত মডেলের মধ্যে পার্থক্য করার জন্য পর্যাপ্ত পরিমাণে ডেটা নেই, সমস্ত সম্ভাব্য মডেলের কিছু মনে করবেন না। একটি সেরা মডেল অর্জনের জন্য পদার্থবিজ্ঞানের পরম পদে পরিচিত হওয়া প্রয়োজন এবং খুব ঘন ঘন মডেলিং অনুমানগুলি এমনকি জানা যায় না, এবং / অথবা অনির্ধারিত / অচিরাচরিত হয় না।
কার্ল

3
কোন মডেল সেরা তা নির্ধারণ করার কোনও উপায় নেই। পাইথন এই আলোচনায় প্রাসঙ্গিক নয়। তবুও ভাল ফলাফল সহ চেষ্টা আছে। উদাহরণস্বরূপ github.com/facebook/prophet প্রকল্প। এটিতে পাইথন বাইন্ডিং রয়েছে।
ক্যাগডাস ওজজেঙ্ক

3
আমি খোলা ছেড়ে ভোট দিচ্ছি কারণ আমি মনে করি এটি একটি যুক্তিসঙ্গত প্রশ্ন - যদিও উত্তর "না" হলেও। আমি শিরোনাম থেকে পাইথনটি সরিয়ে দেওয়ার পরামর্শ দেব, কারণ এটি প্রাসঙ্গিক নয় বা বিশেষত এখানে বিষয় সম্পর্কিত নয়।
এমকেটি - মনিকা

1
প্রস্তাবিত হিসাবে আমি পাইথনটি শিরোনাম থেকে সরিয়েছি। আপনার উত্তরের জন্য ধন্যবাদ।
StatsNewbie123

2
"নিখরচায় দুপুরের খাবার" উপপাদ্যটি দেখুন।
অ্যাডামো

উত্তর:


19

প্রথমে আপনাকে লক্ষ্য রাখতে হবে যে আইরিশস্ট্যাট দ্বারা বর্ণিত পদ্ধতিটি আরিমা মডেলগুলির জন্য নির্দিষ্ট, কোনও মডেলগুলির জেনেরিক সেট নয়।

আপনার মূল প্রশ্নের উত্তর দিতে "সময় সিরিজের পূর্বাভাসটি স্বয়ংক্রিয় করা সম্ভব?":

হ্যাঁ তাই হয়। আমার চাহিদা পূর্বাভাসের ক্ষেত্রে, বেশিরভাগ বাণিজ্যিক পূর্বাভাস প্যাকেজগুলি তাই করে। বেশ কয়েকটি ওপেন সোর্স প্যাকেজগুলি পাশাপাশি এটি করে, বিশেষত রব হ্যান্ডম্যানের অটো.রিমা () স্বয়ংক্রিয়ভাবে এআরএমএ পূর্বাভাস) এবং ইটিএস () স্বয়ংক্রিয় সূচক পূর্বাভাস প্যাকেজ থেকে ফাংশন এই দুটি ফাংশনের বিশদ জানতে এখানে দেখুনপিরামিড নামে অটো.রিমার একটি পাইথন বাস্তবায়ন রয়েছে , যদিও আমার অভিজ্ঞতায় এটি আর প্যাকেজগুলির মতো পরিপক্ক নয়।

আমি যে বাণিজ্যিক পণ্যগুলি উল্লেখ করেছি এবং ওপেন সোর্স প্যাকেজগুলি উভয়ই সেরা পূর্বাভাস চয়ন করার জন্য তথ্যের মানদণ্ড ব্যবহার করার ধারণার ভিত্তিতে কাজ করে: আপনি একগুচ্ছ মডেল ফিট করেন এবং তারপরে সর্বনিম্ন এআইসি, বিআইসিসি, এআইসিসি, এবং মডেল নির্বাচন করুন, ইত্যাদি .... (সাধারণত এটি নমুনা বৈধতার পরিবর্তে করা হয়)।

তবে একটি বড় সাবধানবাণী রয়েছে: এই সমস্ত পদ্ধতির মডেলগুলির একক পরিবারের মধ্যে কাজ করে। তারা আরিমা মডেলগুলির একটি সেটগুলির মধ্যে সেরা সম্ভাব্য মডেল বা তাত্পর্যপূর্ণ স্মুথিং মডেলের একটি সেটগুলির মধ্যে সেরা সম্ভাব্য মডেল চয়ন করে।

মডেলগুলির বিভিন্ন পরিবার থেকে আপনি যদি চয়ন করতে চান তবে এটি করা আরও চ্যালেঞ্জিং, উদাহরণস্বরূপ, আপনি যদি এআরআইএমএ, এক্সপেনশিয়াল স্মুথিং এবং থিতা পদ্ধতি থেকে সেরা মডেলটি বেছে নিতে চান। তত্ত্বগতভাবে, আপনি মডেলগুলির একক পরিবারের মধ্যে যেমন করেন তেমনভাবে করতে পারেন, তথ্যের মানদণ্ড ব্যবহার করে। তবে অনুশীলনে, আপনাকে বিবেচিত সমস্ত মডেলের জন্য ঠিক একইভাবে AIC বা BIC গণনা করতে হবে, এবং এটি একটি গুরুত্বপূর্ণ চ্যালেঞ্জ। সময় সিরিজ ক্রস-বৈধকরণ , বা তথ্যের মানদণ্ডের পরিবর্তে নমুনা বৈধতার বাইরে ব্যবহার করা ভাল তবে এটি আরও বেশি গণনামূলকভাবে নিবিড় (এবং কোডের জন্য ক্লান্তিকর) হবে।

ফেসবুকের নবী প্যাকেজটি জেনারেল অ্যাডিটিভ মডেলগুলির উপর ভিত্তি করে পূর্বাভাস উত্সকে স্বয়ংক্রিয় করে দেয় বিশদের জন্য এখানে দেখুন । তবে নবী শুধুমাত্র একটি একক মডেল ফিট করেছেন, যদিও অনেক পরামিতি সহ খুব নমনীয় মডেল। নবীর অন্তর্নিহিত ধারণাটি হ'ল একটি জিএএম হ'ল "এই সকলকে শাসন করার জন্য এক মডেল", যা তাত্ত্বিকভাবে ন্যায়সঙ্গত হতে পারে না তবে বাস্তব বিশ্বের পরিস্থিতিগুলির জন্য অত্যন্ত বাস্তববাদী এবং দরকারী।

উপরে বর্ণিত সমস্ত পদ্ধতির জন্য প্রযোজ্য আরেকটি সতর্কতামূলক ধারণা: সম্ভবত আপনি স্বয়ংক্রিয় সময় সিরিজের পূর্বাভাসটি করতে চান কারণ আপনি একাধিক সময় সিরিজ পূর্বাভাস করতে চান, ম্যানুয়ালি বিশ্লেষণ করার জন্য অনেক বেশি। অন্যথায় আপনি কেবল নিজের পরীক্ষা-নিরীক্ষা করতে পারেন এবং নিজেরাই সেরা মডেলটি খুঁজে পেতে পারেন। আপনার মনে রাখতে হবে যে একটি স্বয়ংক্রিয় পূর্বাভাসের পদ্ধতিটি প্রতিটি সময় সিরিজের জন্য সেরা মডেলটি কখনই খুঁজে পাবে না - এটি সমস্ত সময়ের সিরিজে গড়ে যথাযথভাবে একটি ভাল মডেল দিতে চলেছে, তবে এটি এখনও সম্ভব যে কিছু সেই সময় সিরিজের স্বয়ংক্রিয় পদ্ধতি দ্বারা নির্বাচিত মডেলের চেয়ে ভাল মডেল থাকবে। এই পোস্টটি দেখুনএর উদাহরণের জন্য এটিকে সহজভাবে বলতে গেলে, আপনি যদি স্বয়ংক্রিয় পূর্বাভাস নিয়ে যাচ্ছেন - প্রতিটি সময় সিরিজের জন্য সেরা সম্ভাব্য পূর্বাভাসের পরিবর্তে আপনাকে "যথেষ্ট যথেষ্ট" পূর্বাভাস সহ্য করতে হবে।


এমন অন্তর্দৃষ্টিপূর্ণ উত্তরের জন্য আপনাকে ধন্যবাদ। এই প্রশ্নটি জিজ্ঞাসা করার সময় সত্যই আমার প্রাথমিক ধারণাটি ছিল মডেলগুলির বিভিন্ন পরিবার থেকে চয়ন করতে সক্ষম।
StatsNewbie123

অ্যালগরিদম যদি ব্যবসায়ের পূর্বাভাস (উদাহরণস্বরূপ উত্পাদন পরিকল্পনা এবং তালিকা পরিচালনার জন্য) মতো আরও নির্দিষ্ট ডোমেনে প্রয়োগ করা হয়? আপনি কি মনে করেন যে এটি আরও ভাল ফলাফল অর্জন করতে পারে?
StatsNewbie123

2
@ জোনাক্লাডিনো হ্যাঁ এটি আরও সহজ হবে - এটিই বাণিজ্যিক চাহিদা পূর্বাভাসের প্যাকেজগুলি যা করে তার সংক্ষিপ্তসার। তবে এটি আরও সহজ কারণ সাধারণত যখন আপনি নিজেকে একটি নির্দিষ্ট ব্যবসায়িক ডোমেনে সীমাবদ্ধ করেন তখন আপনি নিজেকে মডেলগুলির একটি নির্দিষ্ট পরিবারে সীমাবদ্ধ করতে পারেন (একই ব্যবসার ডোমেন থেকে আসা সময় সিরিজের similarতুরতা, ডেটা ঘনত্ব ইত্যাদির ক্ষেত্রে একই বৈশিষ্ট্য থাকবে ... .তখন এটি অনুমান করা নিরাপদ যে একটি পরিবার তাদের সকলের জন্য উপযুক্ত হবে)
স্ক্যান্ডার এইচ।

ঠিক আছে, আমি এখন এটি পেয়েছি। এত বড় সহায়তার জন্য আপনাকে আবারও ধন্যবাদ।
StatsNewbie123

10

আমার প্রস্তাবিত পদ্ধতির মধ্যে এমন মডেল রয়েছে যা এআরআইএমএর তুলনায় অনেক বেশি সাধারণ, কারণ তারা মৌসুমী ডমিগুলি যে সময়ের সাথে সাথে পরিবর্তিত হতে পারে, একাধিক স্তর, একাধিক প্রবণতা, সময়ের সাথে পরিবর্তিত হতে পারে এমন পরামিতি এবং সময়ের সাথে পরিবর্তিত হতে পারে এমন ত্রুটি বৈকল্পগুলিও অন্তর্ভুক্ত করে। এই পরিবারটিকে আরও স্পষ্টভাবে এআরএমএক্স মডেল বলা হয় তবে সম্পূর্ণ স্বচ্ছতার জন্য একটি (বিরল) বৈকল্পিক বাদ দেয় যা গুণগত কাঠামোযুক্ত has

আপনি টিপস চেয়েছিলেন এবং আমি বিশ্বাস করি যে এটি শুরু করার জন্য এটি ভাল this

আমি আপনাকে পরামর্শ দেব যে আপনি এই ফ্লোচার্ট / ওয়ার্কফ্লো অনুসরণ / অনুকরণ করতে কোড লিখুন। আপনার নির্দিষ্ট করা মানদণ্ডটি মূল্যায়নের মাধ্যমে "সেরা মডেল" সন্ধান করা যেতে পারে ... এটি লাগানো ডেটার এমএসই / এআইসি হতে পারে বা এটি রেকর্ড করা ডেটার এমএপিই / এসএমএপি বা আপনার পছন্দের কোনও মানদণ্ড হতে পারে।

এই প্রতিটি পদক্ষেপের বিশদ বিবরণ যেমন আপনি কিছু নির্দিষ্ট প্রয়োজনীয়তা / উদ্দেশ্য / সময় সিরিজ বিশ্লেষণের সীমাবদ্ধতা সম্পর্কে অবগত না হন তবে তা বেশ সহজ হতে পারে তবে সচেতন হন আপনি যদি আরও গভীর বোঝাপড়া / হন তবে এটি আরও জটিল হতে পারে / সম্পূর্ণ সময় সিরিজ বিশ্লেষণে উপস্থিত জটিলতা / সুযোগগুলি শেখা / প্রশংসা করা।

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

টাইম সিরিজ মডেলিং (বা সাধারণভাবে মডেলিং) সম্পর্কে কীভাবে একজনকে যেতে হবে সে সম্পর্কে আমাকে আরও দিকনির্দেশনা দিতে বলা হয়েছে /stats//search?q=peeling+++ ইউনিয়নতে আমার গাইডেন্সের কিছু রয়েছে "খোসা পেঁয়াজ" এবং সম্পর্কিত কাজগুলি।

অটোবক্স আসলে অন্তর্বর্তীকালীন পদক্ষেপগুলি বিশদ করে এবং দেখায় যেহেতু এটি একটি দরকারী মডেল তৈরি করে এবং এই ক্ষেত্রে একটি দরকারী শিক্ষক হতে পারে। পুরো বৈজ্ঞানিক ধারণাটি হ'ল "যা প্রয়োজন বলে মনে হয় তা যুক্ত করা" এবং "দরকারী থেকে কম বলে মনে হয় যা মুছে ফেলা"। এটি পূর্ববর্তী সময়ে বক্স এবং বেকন দ্বারা প্রস্তাবিত পুনরাবৃত্তি প্রক্রিয়া।

মডেলগুলিকে যথেষ্ট জটিল হওয়া দরকার (অভিনব পর্যাপ্ত) তবে খুব জটিল নয় (অভিনব)। ধরে নেওয়া যাক যে সহজ পদ্ধতিগুলি জটিল সমস্যাগুলির সাথে কাজ করে তা রজার বেকন এবং বেকনের অনুসারীদের অনেকগুলি অনুসরণ করে বৈজ্ঞানিক পদ্ধতির সাথে সামঞ্জস্য নয়। যেমন রজার বেকন একবার বলেছিলেন এবং আমি প্রায়শই প্যারাফ্রেস করেছি: বিজ্ঞানটি করা হল বারবার নিদর্শনগুলি অনুসন্ধান করা। অসঙ্গতিগুলি সনাক্ত করা হল এমন মানগুলি সনাক্ত করা যা বারবারের নিদর্শনগুলি অনুসরণ করে না। যেহেতু প্রকৃতির উপায়গুলি জানে সে আরও সহজেই তার বিচ্যুতিগুলি লক্ষ্য করবে এবং অন্যদিকে, যে ব্যক্তি তার বিচ্যুতিগুলি জানে তাকে আরও সঠিকভাবে তার উপায়গুলি বর্ণনা করবে। কেউ যখন বর্তমান বিধিগুলি ব্যর্থ হয় তা পর্যবেক্ষণ করে নিয়মগুলি শিখতে পারে currently

আমার কথায় "টুকি প্রস্তাবিত এক্সপ্লোরারি ডেটা অ্যানালাইসিস (ইডিএ) যা ডেটা দ্বারা প্রস্তাবিত প্রমাণিত মডেলের ঘাটতির উপর ভিত্তি করে মডেল পরিশোধন প্রকল্পের পরামর্শ দিয়েছে"। এটি আউটবক্স এবং বিজ্ঞানের হৃদয়। EDA হ'ল ফর্মাল মডেলিং বা হাইপোথিসিস টেস্টিং কার্যের বাইরে ডেটা আমাদের কী বলতে পারে তা দেখার জন্য।

একটি স্বয়ংক্রিয় মডেলিং প্রোগ্রামের লিটমাস পরীক্ষাটি বেশ সহজ। এটি অতিরিক্ত-ফিটনেস ছাড়াই সংকেত এবং শব্দ পৃথক করে? অভিজ্ঞতা অভিজ্ঞতা প্রমাণ দেয় যে এটি করতে পারে এবং হয়ে গেছে। পূর্বাভাসের যথাযথতাগুলি প্রায়শই বিভ্রান্তিকর হয় কারণ ভবিষ্যতের ভবিষ্যতের জন্য দায়বদ্ধ নয় এবং আপনি কোন উত্সের ফলাফল বেছে নিতে পারেন এবং তার উপর নির্ভর করে তার উপর নির্ভর করে।


তোমাকে অনেক ধন্যবাদ. আপনার উত্তর অত্যন্ত সহায়ক!
StatsNewbie123

ধন্যবাদ, আইরিশস্ট্যাট এটি অন্তর্দৃষ্টিপূর্ণ। প্যারামিটারটি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ না হওয়া সত্ত্বেও আমরা কি "প্যারামিটার মুছুন" এর বিপরীতে কোনও পরামিতি রাখার ন্যায়সঙ্গত?
কালার স্ট্যাটিসটিক্স

1
হ্যাঁ. যদি এটি আপনাকে আরও "আনন্দদায়ক উত্তর" দেয়। ০.০ এর চেয়ে আলাদা নয় এমন slাল সহগটি আরও বাস্তবসম্মত (যদি পরিসংখ্যানগত দিক থেকে তাৎপর্যপূর্ণ নয়) পূর্বাভাস দিতে পারে, অন্যথায় অতিরিক্ত সহগগুলি বহন করা অযৌক্তিক এবং বৈকল্পিক পূর্বাভাসে অনিশ্চয়তার কারণ বাড়িয়ে তোলে। কিছু লেখক প্রয়োজনীয়তা এবং পর্যাপ্ততার পরীক্ষা অন্ধভাবে / নির্লজ্জভাবে ধরে নিতে পারেন যে মডেল সনাক্তকরণটি 1 ধাপের প্রক্রিয়া এবং বাক্স এবং জেনকিনস (এবং অন্য সবাই!) মডেলটিকে প্রয়োজনীয় হিসাবে জটিল হিসাবে তৈরি করার সাথে সম্পর্কিত তবে অতিরিক্ত জটিল নয় .. এ সম্পর্কে আরও জানতে অ্যালবার্ট ই।, জেডাব্লু টুকি এট আল।
আইরিশস্ট্যাট

3
"এটি প্রস্তাবিত স্বয়ংক্রিয় পূর্বাভাস পদ্ধতির মডেলটির ফর্মটি সিলেক্ট করে প্রতিটি কাস্টমাইজড স্যুটটির মতো একে একে কাস্টমাইজ করে সেরা সিরিজের জন্য সেরা মডেলটি সন্ধান করছে।" এটি একটি দুর্দান্ত দৃ statement় বিবৃতি - যদি সঠিক হয় তবে এর অর্থ এই পদ্ধতির এম 3, এম 4 প্রতিযোগিতা জিতবে hands এটা আছে কি?
স্ক্যান্ডার এইচ।

1
@ জোনা-ক্লাউডিনো আমি আপনার আইএসইজি প্রকল্পে বিশেষত আগ্রহী কারণ আমি আমার প্রস্তাবিত পদ্ধতির পাইথন সংস্করণটি বিকশিত করতে আগ্রহী। এই অবশ্যই এসই থেকে সাইট বন্ধ হবে।
আইরিশস্ট্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.