সময় সিরিজে এআইসি বনাম ক্রস বৈধতা: ছোট নমুনা কেস


23

আমি টাইম সিরিজ সেটিংয়ে মডেল নির্বাচনের বিষয়ে আগ্রহী। সংক্ষিপ্ততার জন্য, ধরুন আমি বিভিন্ন ল্যাগ অর্ডার সহ এআরএমএ মডেলের একটি পুল থেকে একটি এআরএমএ মডেল নির্বাচন করতে চাই। চূড়ান্ত অভিপ্রায় পূর্বাভাস

মডেল নির্বাচন দ্বারা সম্পন্ন করা যেতে পারে

  1. ক্রস বৈধতা,
  2. তথ্যের মানদণ্ডের ব্যবহার (এআইসি, বিআইসি),

অন্যান্য পদ্ধতির মধ্যে।

রব জে হ্যান্ডম্যান সময় সিরিজের ক্রস বৈধকরণের জন্য একটি উপায় সরবরাহ করে । তুলনামূলকভাবে ছোট নমুনার জন্য, ক্রস বৈধকরণে ব্যবহৃত নমুনার আকারটি মূল নমুনার আকারের চেয়ে গুণগতভাবে পৃথক হতে পারে । উদাহরণস্বরূপ, যদি আসল নমুনার আকার 200 টি পর্যবেক্ষণ হয় তবে 100 ক্রস-বৈধকরণের ফলাফলগুলি পাওয়ার জন্য প্রথম 101 টি পর্যবেক্ষণ গ্রহণ করে উইন্ডোটি 102, 103, ..., 200-এ প্রসারিত করে ক্রস বৈধকরণের কথা চিন্তা করতে পারে। স্পষ্টতই, 200 টি পর্যবেক্ষণের জন্য যুক্তিসঙ্গতভাবে পার্সোনামিয়াস এমন একটি মডেল 100 টি পর্যবেক্ষণের জন্য খুব বড় হতে পারে এবং সুতরাং এর বৈধতা ত্রুটিটি বড় হবে। সুতরাং ক্রস বৈধকরণ খুব পার্সিমোনিয়াস মডেলকে নিয়মিতভাবে পছন্দ করতে পারে favor নমুনা আকারে মিল না পাওয়ার কারণে এটি একটি অনাকাঙ্ক্ষিত প্রভাব

ক্রস বৈধকরণের একটি বিকল্প মডেল নির্বাচনের জন্য তথ্যের মানদণ্ড ব্যবহার করে। যেহেতু আমি পূর্বাভাস দেওয়ার বিষয়ে যত্নশীল তাই আমি এআইসি ব্যবহার করব। যদিও এআইসি অসম্পূর্ণভাবে সময়ের সিরিজের মডেলগুলির জন্য এক-পদক্ষেপের পূর্বাভাস এমএসই কমিয়ে আনার সমতুল্য ( রব জে হ্যান্ডম্যানের এই পোস্ট অনুসারে ), আমি সন্দেহ করি যে এটি নমুনার পরে এখানে প্রাসঙ্গিক আমি যে আকারগুলির জন্য যত্নশীল সেগুলি বড় নয় ...

প্রশ্ন: ছোট / মাঝারি নমুনাগুলির জন্য কি টাইম সিরিজ ক্রস বৈধকরণের জন্য আমি এআইসি নির্বাচন করব?

কয়েকটি সম্পর্কিত প্রশ্ন এখানে , এখানে এবং এখানে পাওয়া যাবে


1
আমিও ভাবব যে বিআইসিকেও "দীর্ঘ" পূর্বাভাসের সমান (মি-স্টেপ সামনে), কে তার ক্রস বৈধতা ছাড়ার লিঙ্কটি দিয়ে। যদিও 200 টি পর্যবেক্ষণের জন্য, সম্ভবত খুব বেশি পার্থক্য নেই (2p এর পরিবর্তে 5p এর জরিমানা)।
সম্ভাব্যতাব্লোগিক

1
@ ক্যাগডাস ওজেনসিঙ্ক, আমি রব জে হিনডম্যানকে জিজ্ঞাসা করেছি যে ক্রমের বৈধতা ওপিতে প্রদত্ত প্রেক্ষাপটে পদ্ধতিগতভাবে খুব পার্সিমোনিয়াস মডেলদের পক্ষে যেতে পারে এবং একটি নিশ্চয়তা পেয়েছে কিনা, এটি যথেষ্ট উত্সাহজনক। আমি বলতে চাইছি, আড্ডায় আমি যে ধারণাটি ব্যাখ্যা করার চেষ্টা করছিলাম সেটি বৈধ বলে মনে হচ্ছে।
রিচার্ড হার্ডি

এআইসি বা বিআইসিকে সমর্থন করার তাত্ত্বিক কারণ রয়েছে যেহেতু যদি কেউ সম্ভাবনা এবং তথ্য তত্ত্ব দিয়ে শুরু করে, তবে মেট্রিক যা তাদের উপর ভিত্তি করে সুসংখ্যাতাত্ত্বিক বৈশিষ্ট্যযুক্ত। তবে প্রায়শই এটি এমন যে ডেটা সেট নিয়ে কাজ করছেন যা এত বড় নয়।
বিশ্লেষক

3
আমি এআইসি বোঝার চেষ্টা করার জন্য যথেষ্ট সময় ব্যয় করেছি। বিবৃতিটির সাম্যতা সিএলটি-র সংস্করণগুলির মতো অসংখ্য আনুমানিকের উপর ভিত্তি করে। আমি ব্যক্তিগতভাবে মনে করি এটি এআইসিকে ছোট নমুনাগুলির জন্য খুব প্রশ্নবিদ্ধ করে তোলে।
meh

1
@ ইসাবেলা গেমেন্ট, কেন এটি করা উচিত? ক্রস বৈধকরণের এই বিশেষ ব্যবহারের মধ্যে নিজেকে সীমাবদ্ধ করার কোনও কারণ নেই। এটি অবশ্য বলার অপেক্ষা রাখে না যে অবশ্যই ক্রস বৈধতা মডেল মূল্যায়নের জন্য ব্যবহার করা যাবে না।
রিচার্ড হার্ডি

উত্তর:


2

তাত্ত্বিক বিবেচনাগুলি একপাশে রেখে, আকাইকে তথ্য মানদণ্ডটি কেবল স্বাধীনতার ডিগ্রি দ্বারা দণ্ডিত হওয়ার সম্ভাবনা। এরপরে , এআইসি ডেটাতে অনিশ্চয়তার জন্য অ্যাকাউন্ট দেয় ( -২ এলএল ) এবং এই ধারণাটি তৈরি করে যে আরও পরামিতিগুলি অত্যধিক মানসিক চাপের উচ্চ ঝুঁকিতে নিয়ে যায় ( 2 কে ) এর । ক্রস-বৈধতা কেবলমাত্র কোনও অনুমান ছাড়াই মডেলের পরীক্ষার সেট কার্য সম্পাদন দেখায়।

আপনি যদি ভবিষ্যদ্বাণীগুলি সম্পর্কে বেশিরভাগ ক্ষেত্রেই চিন্তা করেন এবং আপনি ধরে নিতে পারেন যে পরীক্ষা সেট (গুলি) যথাযথভাবে বাস্তব-বিশ্বের ডেটার সাথে সমান হবে, আপনার ক্রস-বৈধতার জন্য যেতে হবে। সম্ভাব্য সমস্যাটি হ'ল যখন আপনার ডেটা ছোট হয়, তারপরে এটি বিভাজন করে আপনি ছোট প্রশিক্ষণ এবং পরীক্ষার সেটগুলি সমাপ্ত করেন। প্রশিক্ষণের জন্য কম ডেটা খারাপ, এবং পরীক্ষার সেটের জন্য কম ডেটা ক্রস-বৈধকরণের ফলাফলগুলিকে আরও অনিশ্চিত করে তোলে (দেখুন ভারোকোক্স, 2018 )। যদি আপনার পরীক্ষার নমুনা অপর্যাপ্ত হয় তবে আপনি এআইসি ব্যবহার করতে বাধ্য হতে পারেন তবে এটি কী কী ব্যবস্থা নেয় তা মাথায় রেখে এবং এর দ্বারা কী অনুমান করা যায়।

অন্যদিকে, ইতিমধ্যে মন্তব্যে উল্লিখিত হিসাবে, এআইসি আপনাকে অসম্পূর্ণ গ্যারান্টি দেয়, এবং এটি ছোট নমুনাগুলির ক্ষেত্রে নয়। ছোট নমুনাগুলি পাশাপাশি তথ্যের অনিশ্চয়তা সম্পর্কে বিভ্রান্তিকর হতে পারে।


আপনার উত্তর দেওয়ার জন্য ধন্যবাদ! সময় সিরিজের তথ্যের প্রকৃতির কারণে ক্রস বৈধকরণের ক্ষেত্রে আরও ছোট নমুনার আকারের অনাকাঙ্ক্ষিত প্রভাব সম্পর্কে আপনার কোনও নির্দিষ্ট মন্তব্য থাকবে?
রিচার্ড হার্ডি

1

এইচএম - যদি আপনার চূড়ান্ত লক্ষ্যটি ভবিষ্যদ্বাণী করা হয় তবে আপনি কেন আদৌ মডেল নির্বাচন করতে চান? যতদূর আমি জানি, এটি "traditionalতিহ্যবাহী" পরিসংখ্যানমূলক সাহিত্যে এবং মেশিন লার্নিং সাহিত্যে উভয়ই সুপ্রতিষ্ঠিত রয়েছে যে পূর্বাভাসের ক্ষেত্রে মডেল গড় গড় উন্নত হয় । সহজ কথায় বলতে গেলে, মডেল গড়ের অর্থ হল যে আপনি সমস্ত কলুষিত মডেলটি অনুমান করেন, তাদের সকলের ভবিষ্যদ্বাণী করা এবং তাদের আপেক্ষিক মডেল প্রমাণ দ্বারা ওজনিত তাদের ভবিষ্যদ্বাণী গড়তে দিন।

শুরু করার জন্য একটি দরকারী উল্লেখটি হ'ল https://journals.sagepub.com/doi/10.1177/0049124104268644

তারা এটি বেশ সহজভাবে ব্যাখ্যা করে এবং প্রাসঙ্গিক সাহিত্যের উল্লেখ করে।

আশাকরি এটা সাহায্য করবে.


-1

আমার ধারণা, উভয়ই করুন এবং দেখুন। এটি এআইসি ব্যবহারের জন্য সরাসরি। ছোট এআইসি, আরও ভাল মডেল। তবে কেউ এআইসির উপর নির্ভর করতে পারে না এবং বলে যে এই জাতীয় মডেল সবচেয়ে ভাল। সুতরাং, আপনার কাছে যদি আরিমা মডেলগুলির একটি পুল রয়েছে, প্রতিটি নিন এবং বিদ্যমান মানগুলির পূর্বাভাস পরীক্ষা করুন এবং দেখুন কোন মডেলটি বিদ্যমান সময় সিরিজের ডেটার নিকটতম ভবিষ্যদ্বাণী করে। দ্বিতীয়ত এআইসির জন্যও পরীক্ষা করে দেখুন এবং উভয় বিবেচনা করেই, একটি ভাল পছন্দে আসুন। কোন ধরাবাঁধা নিয়ম আছে। কেবল সেরা মডেলটির সন্ধান করুন।


আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ! মডেল নির্বাচনের বিভিন্ন পদ্ধতির মধ্যে নির্বাচন করার জন্য আমি একটি মূলত উপায় খুঁজছি। আপনি ঠিক বলেছেন যে কোনও কঠোর এবং দ্রুত নিয়ম নেই , আমাদের অগোছালো বাস্তব-বিশ্ব পরিস্থিতিতে আমাদের সহায়তা করার জন্য অনুমানমূলক আদর্শ অবস্থার অধীনে আমাদের সুস্পষ্ট নির্দেশিকা প্রয়োজন। সুতরাং আমি সাধারণত আপনার অবস্থানের সাথে একমত হওয়ার পরেও আমি আপনার উত্তরটি বিশেষভাবে সহায়ক বলে মনে করি না।
রিচার্ড হার্ডি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.