এআইসিকে হ্রাস করে মডেলগুলি নির্বাচন করা কখন উপযুক্ত?


12

এটি সুপ্রতিষ্ঠিত, কমপক্ষে কিছু উচ্চতর ক্যালিবারের পরিসংখ্যানবিদদের মধ্যে যে, ন্যূনতম মানের একটি নির্দিষ্ট প্রান্তিকের মধ্যে এআইসি পরিসংখ্যানের মানগুলির সাথে মডেলগুলিকে এআইসি পরিসংখ্যানকে হ্রাস করার মডেল হিসাবে উপযুক্ত হিসাবে বিবেচনা করা উচিত। উদাহরণস্বরূপ, [1, p.221] এ আমরা খুঁজে পাই

তারপরে ছোট ছোট জিসিভি বা এআইসি সহ মডেলগুলি সেরা হিসাবে বিবেচিত হবে। অবশ্যই একজনকে কেবল অন্ধভাবে জিসিভি বা এআইসি হ্রাস করা উচিত নয়। বরং, যুক্তিসঙ্গতভাবে ছোট GCV বা AIC মান সহ সমস্ত মডেলগুলি তাদের সরলতা এবং বৈজ্ঞানিক প্রাসঙ্গিকতা অনুসারে সম্ভাব্যভাবে উপযুক্ত এবং মূল্যায়ন করা উচিত।

একইভাবে, [2, p.144] এ আমাদের রয়েছে

এটি প্রস্তাবিত হয়েছে (ডুং, ১৯৮৪) যে ন্যূনতম মানের গ এর মধ্যে এআইসির মানগুলির সাথে মডেলগুলি প্রতিযোগিতামূলক হিসাবে বিবেচিত হওয়া উচিত (সি = ২ সহ একটি আদর্শ মান হিসাবে)। প্রতিযোগিতামূলক মডেলগুলির মধ্যে থেকে বাছাইয়ের পরে অবশিষ্টাংশের শুভ্রতা (বিভাগ 5.3) এবং মডেলের সরলতার মতো বিষয়গুলির উপর ভিত্তি করে তৈরি করা যেতে পারে।

তথ্যসূত্র:

  1. রুপার্ট, ডি ;; ওয়ান্ড, এমপি এবং ক্যারল, আরজে সেমিপ্রেমেট্রিক রিগ্রেশন , কেমব্রিজ ইউনিভার্সিটি প্রেস, 2003
  2. ব্রোকওয়েল, পিজে ও ডেভিস, আরএ সময়-সিরিজের পরিচয় এবং পূর্বাভাস , জন উইলি অ্যান্ড সন্স, ১৯৯ 1996

সুতরাং উপরেরটি দেওয়া, নীচের দুটি মডেলের মধ্যে কোনটি পছন্দ করা উচিত?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

আরও সাধারণভাবে, কখন এআইসি বা সম্পর্কিত পরিসংখ্যান অন্ধভাবে কমিয়ে মডেলগুলি নির্বাচন করা উপযুক্ত?


আপনি কোনও মডেলের জন্য এআইসি দেন নি।
পিটার ফ্লুম - মনিকা

এটি কীভাবে আর এর সাথে পাবেন তা আমি দেখিয়েছি
হাইবারনেটিং

1
আরিমা মডেলগুলিতে +1 সমস্যাগুলি নীচে উল্লিখিত হয়েছে। তবে অন্যথায়: "একটি প্রাগনস্টিক মডেলকে সরলকরণ: ক্লিনিকাল ডেটার উপর ভিত্তি করে একটি সিমুলেশন অধ্যয়ন।" এম্বিলার 2002 এটির মধ্যে সর্বাধিক উদ্ধৃত রেফারেন্স।
চার্চ

উত্তর:


4

উপর Cosma Shalizi এর বক্তৃতা নোট থেকে paraphrasing লিনিয়ার রিগ্রেশন সম্পর্কে সত্য , তুমি একটি মডেল নির্বাচন করুন করব মাত্র কারণ এটি এআইসি মত একটি পরিসংখ্যাত কমান ঘটেছে , জন্য

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.

1
যেমনটি একজন বিখ্যাত ইহুদি বলেছিলেন: "জ্ঞানের চেয়ে কল্পনাশক্তি ভাল" :)
হাইবারনেটিং

এবং একজন বিখ্যাত অ-ইহুদী বলেছিলেন যে "আপনি অনেক কিছু দেখতে পেয়ে দেখতে পারেন" (যোগী বেরেরা)।
পিটার ফ্লুম - মনিকা পুনরায়

আমরা যা দেখি তা অবশ্যই নির্ভর করে যা আমরা খুঁজি তার উপর।
হাইবারনেটিং

12

আমি বলব মডেল নির্বাচনের ক্ষেত্রে এআইসি ব্যবহার করা প্রায়শই উপযুক্ত তবে মডেল নির্বাচনের একমাত্র ভিত্তি হিসাবে এটি ব্যবহার করা খুব কমই সঠিক। আমাদের অবশ্যই অবশ্যই জ্ঞান ব্যবহার করতে হবে।

আপনার বিশেষ ক্ষেত্রে, আপনি একটি তৃতীয় ক্রম এআর বনাম একটি 1 ম অর্ডার আর এর সাথে একটি মডেল তুলনা করছেন। এআইসি (বা অনুরূপ কিছু) ছাড়াও আমি স্বতঃসংশোধন এবং আংশিক স্বতঃসংশোধন প্লটগুলির দিকে নজর দেব। আমি তৃতীয় অর্ডার মডেলটির অর্থ কী তাও বিবেচনা করব । এটা বোঝা যায় না? এটি কি বাস্তব জ্ঞান যুক্ত করে? (বা আপনি যদি পূর্বাভাসের প্রতি সম্পূর্ণ আগ্রহী হন তবে এটি কী পূর্বাভাস দিতে সহায়তা করে?)

আরও সাধারণভাবে, কখনও কখনও এটি ক্ষেত্রে খুব ছোট প্রভাবের আকার খুঁজে পাওয়া আকর্ষণীয় finding


আপনি কি কেবল বলেছেন যে অরিমা মডেল বাছাই করার জন্য কোনও ভাল অ্যালগরিদম সম্পূর্ণভাবে এআইসির (বা এর মতো) মাপদণ্ডের উপর ভিত্তি করে করা উচিত নয়?
হাইবারনেটিং

হ্যাঁ আমি এটা বলেছিলাম।
পিটার ফ্লুম - মনিকা পুনরায়

এবং এই শেষে আমি এটি বিদায় অটো.রিমা হিসাবে শুনেছি। আমার পছন্দ হ'ল বিসগার্ড, এস। ও কুলাহকি, এম। সময় সিরিজের বিশ্লেষণ এবং পূর্বাভাসের উদাহরণ হিসাবে জন উইলে অ্যান্ড সন্স, ইনক।, ২০১১, বিভাগের আরও ise.৫ অংশে স্টাডির কার্যনির্বাহী ফাংশন মডেলগুলিতে বিবিধ পরিবর্তনগুলি
হাইবারনেটিং

1
@Hibernating: লেখক auto.arima, Hyndman & খন্দকার (2008) , বলতে: -। "Univariate সময় সিরিজের বৃহৎ সংখ্যক স্বয়ংক্রিয় পূর্বাভাস প্রায়ই ব্যবসায় প্রয়োজন হয় এটা প্রয়োজন পূর্বাভাস অন্তত মাসিক এক হাজার পণ্যসমূহের উপর আছে সাধারণ। এমনকি যখন একটি ছোট সংখ্যার পূর্বাভাসের প্রয়োজন হয়, তাদের সময় উত্পন্ন করার জন্য টাইম সিরিজের মডেল ব্যবহারের জন্য উপযুক্ত প্রশিক্ষণ পাওয়া যায় না these এই পরিস্থিতিতে, একটি স্বয়ংক্রিয় পূর্বাভাস অ্যালগরিদম একটি প্রয়োজনীয় সরঞ্জাম "" এই পরিস্থিতিতে নোট করুন ।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
ধন্যবাদ তবে আমি আগে এটি পড়েছিলাম। এমনকি যদি আমরা আপাতত "অটো" অংশটি দিয়ে সুস্পষ্ট সমস্যাগুলি উপেক্ষা করি তবে "অরিমা" অংশটি নিয়ে সমস্যা রয়েছে, বিশেষত যখন এটি মৌসুমী মডেলগুলি অন্তর্ভুক্ত করার জন্য প্রসারিত হয়। মৌসুমী আরিমা মডেলগুলি পি জে হ্যারিসন, সি চ্যাটফিল্ড এবং আমার কাছ থেকে শিখতে উপভোগ করার জন্য ঘটেছে এমন আরও কিছু ব্যক্তিত্বের তীব্র সমালোচনা করেছে। আমি স্বয়ংক্রিয় পূর্বাভাসের বিরুদ্ধে কিছুই নেই যখন এটি i) একেবারে প্রয়োজনীয় এবং ii) অ্যালগরিদমের ভিত্তিতে আমি শব্দটি খুঁজে পেতে পারি - নইলে আমি কয়েক বছর আগে স্ট্যাট সায়েন্সে লিও ব্রেম্যানের "দুটি সংস্কৃতি" পত্রিকায় তাঁর মন্তব্যে ডিআর কক্সের পরামর্শ অনুসরণ করি।
হাইবারনেট করা

8

পিপি


2
আপনার শেষ বাক্যটি আকর্ষণীয়। আমার মনে আছে আমি পড়েছি যে চূড়ান্ত উদ্দেশ্যটি যদি ভবিষ্যদ্বাণী হয় তবে রিগ্রেশনটিতে এমনকি তুচ্ছ ভাববাণীদের যুক্ত করাও ন্যায়সঙ্গত হতে পারে। আমি তখন এটিতে খুব বেশি মনোযোগ দিইনি তবে এখন আমি চেষ্টা করব এবং সেই রেফারেন্সটি খুঁজে পাব।
হাইবারনেটিং :21

3
যোগ করার পরিবর্তে আমি বলব অপসারণ এড়ান । এবং এটি কেবল পূর্বাভাস নয়, পরিবর্তনশীল নির্বাচনের নির্দেশিকাতে পরিসংখ্যান সম্পর্কিত অ্যাসেসমেন্টগুলি ব্যবহার করা পক্ষপাতমূলক এবং অবৈধ স্ট্যান্ডার্ড ত্রুটি এবং আত্মবিশ্বাসের সীমাবদ্ধতার কারণ হয়ে দাঁড়ায়।
ফ্রাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.