ধাপে ধাপে এআইসি - এই বিষয়টিকে ঘিরে কি বিতর্ক আছে?


17

আমি এই সাইটে অগণিত পোস্ট পড়েছি যা পি-ভ্যালু ভিত্তিক, এআইসিসি, বিআইসি ইত্যাদির কোনও ধরণের মানদণ্ড ব্যবহার করে ভেরিয়েবলের ধাপে ধাপে ব্যবহারের বিপরীতে অবিশ্বাস্যরূপে are

আমি বুঝতে পারি কেন এই পদ্ধতিগুলি সাধারণ হয়, ভেরিয়েবল নির্বাচনের জন্য যথেষ্ট দুর্বল। gung এর সম্ভবত বিখ্যাত পোস্টে এখানে পরিষ্কারভাবে কেন প্রকাশ করে; শেষ পর্যন্ত আমরা সেই একই ডেটাসেটে একটি হাইপোথিসিস যাচাই করছি যা আমরা হাইপোথিসিসের সাথে উপস্থিত হয়েছি, যা কেবল তথ্য ড্রেজিং। তদ্ব্যতীত, পি-মানগুলি কোলাইনারিটি এবং বহিরাগতদের মতো পরিমাণে প্রভাবিত হয়, যা ফলাফলগুলি প্রচুর পরিমাণে আঁকায় etc.

যাইহোক, আমি সময় সিরিজের পূর্বাভাসটি বেশ কিছুটা ইদানীং অধ্যয়ন করেছি এবং হিন্ডম্যানের সম্মানিত পাঠ্যপুস্তক জুড়ে এসেছি যেখানে তিনি এখানে বিশেষত আরিমা মডেলগুলির সর্বোত্তম ক্রম সন্ধানের জন্য ধাপে ধাপে নির্বাচন ব্যবহারের উল্লেখ করেছেন । আসলে, forecastআর এর প্যাকেজে auto.arimaডিফল্ট হিসাবে পরিচিত সুপরিচিত অ্যালগরিদম স্টেপওয়াইজ সিলেকশন ব্যবহার করে (এআইসি সহ, পি-ভ্যালু নয়)। তিনি পি-ভ্যালু ভিত্তিক বৈশিষ্ট্য নির্বাচনের সমালোচনাও করেন যা এই ওয়েবসাইটে একাধিক পোস্টের সাথে ভালভাবে সাজায়।

চূড়ান্তভাবে, যদি আমাদের পূর্বাভাস / পূর্বাভাসের জন্য ভাল মডেলগুলি বিকাশ করা হয় তবে আমাদের সর্বদা কিছু উপায়ে বৈধতা অতিক্রম করতে হবে। যাইহোক, পি-ভ্যালু ব্যতীত মূল্যায়ন মেট্রিকের পদ্ধতিটি নিজেই আসে তখন অবশ্যই এখানে কিছুটা দ্বিমত রয়েছে।

এই প্রসঙ্গে স্টেওয়াইজ এআইসির ব্যবহার সম্পর্কে কারও কি কোনও মতামত রয়েছে, তবে সাধারণভাবেও এই প্রসঙ্গে? আমাকে কোনও ধাপের দিকের নির্বাচনটি খারাপ বলে বিশ্বাস করতে শেখানো হয়েছে, তবে সত্যি কথা বলতে, auto.arima(stepwise = TRUE)নমুনা ফলাফলের চেয়ে আমাকে আরও ভাল ফল দেওয়া হচ্ছে auto.arima(stepwise = FALSE)তবে সম্ভবত এটি কাকতালীয় ঘটনা।


পূর্বাভাসীরা যে কয়েকটি বিষয়ে একমত হতে পারে তার মধ্যে একটি হ'ল একটি "সেরা" মডেল নির্বাচন করা একাধিক বিভিন্ন মডেলের সংমিশ্রণের চেয়ে সাধারণত কম ভাল কাজ করে।
এস। কোলাসা - মনিকা

উত্তর:


20

এখানে কয়েকটি ভিন্ন সমস্যা রয়েছে।

  • সম্ভবত প্রধান সমস্যাটি যে মডেল নির্বাচন (কিনা P-মান বা AICs, ধাপে ধাপে বা অল-সাব-সেট নির্বাচন বা অন্য কিছু ব্যবহার করে) প্রাথমিকভাবে জন্য সমস্যা হয় অনুমান (যেমন উপযুক্ত টাইপ আমি ভুল উপযুক্ত কভারেজ আস্থা অন্তর দিয়ে পেয়ে P-মান)। জন্য ভবিষ্যদ্বাণী , মডেল নির্বাচন প্রকৃতপক্ষে পক্ষপাত-ভ্যারিয়েন্স ট্রেড বন্ধ অক্ষের উপর একটি উন্নততর স্পট বাছাই এবং আউট-অফ-নমুনা উন্নত ত্রুটি পারবেন না।
  • কিছু শ্রেণির মডেলগুলির জন্য, এআইসি হ'ল ছাড়ার বাইরে থাকা সিভি ত্রুটির সমতুল্য [যেমন দেখুন http://www.petrkeil.com/?p=836 ], সুতরাং সিভির জন্য কম্পিউটেশনাল দক্ষ প্রক্সি হিসাবে এআইসি ব্যবহার করা যুক্তিযুক্ত।
  • ধাপে ধাপে নির্বাচন প্রায়শই অন্যান্য মডেল নির্বাচন (বা গড় ) পদ্ধতি দ্বারা প্রভাবিত হয় (গণনাগতভাবে সম্ভব হলে সমস্ত-সাবসেটগুলি বা সঙ্কুচিত পদ্ধতি)। তবে এটি কার্যকর এবং কার্যকর করা সহজ এবং যদি উত্তরটি যথেষ্ট পরিস্কার হয় (শক্তিশালী সংকেতগুলির সাথে কিছু পরামিতি, অন্যরা দুর্বল, কয়েকটি মধ্যবর্তী), তবে এটি যুক্তিসঙ্গত ফলাফল দেবে। আবার অনুমান এবং পূর্বাভাসের মধ্যে একটি বড় পার্থক্য রয়েছে। উদাহরণস্বরূপ, যদি আপনার বেশ কয়েকটি দৃ strongly়ভাবে সম্পর্কিত পূর্বাভাসকারী থাকে তবে ভুলটিকে বাছাই করা ("সত্য" / কার্যক্ষেত্রের দিক থেকে) অনুমানের জন্য একটি বড় সমস্যা, তবে আপনাকে সেরা এআইসি দেওয়ার জন্য ঘটে যাওয়া বাছাই করা যুক্তিসঙ্গত পূর্বাভাসের কৌশল (যদিও আপনি যদি এমন কোনও পরিস্থিতির পূর্বাভাস দেওয়ার চেষ্টা করেন যেখানে ভবিষ্যদ্বাণীকারীদের পারস্পরিক সম্পর্ক পরিবর্তিত হয় ... তবে ব্যর্থ হবে)

নীচের লাইন: একটি যুক্তিসঙ্গত সংকেত-থেকে-শব্দ অনুপাত সহ মাঝারি আকারের ডেটাগুলির জন্য, এআইসি-ভিত্তিক ধাপে ধাপে নির্বাচন সত্যই একটি ডিফেন্সেবল ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করতে পারে ; উদাহরণ হিসাবে মুর্টফ (২০০৯) দেখুন।

মুর্তোফ, পল এ। "বেশ কয়েকটি পরিবর্তনশীল ‐ নির্বাচন পদ্ধতির পারফরম্যান্স বাস্তব বাস্তুসংস্থার ডেটাতে প্রয়োগ করা হয়েছে।" বাস্তুশাস্ত্রের চিঠিগুলি 12, নং। 10 (2009): 1061-1068।


(+1) খুব তথ্যপূর্ণ। এআইসি / বিআইসি বা অন্যান্য তথ্যের মানদণ্ড ব্যবহার করে এমন পদ্ধতির ব্যবহারকে অনুমানমূলক পরিসংখ্যানগুলির সাথে মিশ্রিত করা উচিত নয়পি- বার্নহ্যাম অ্যান্ডারসনের বই "মডেল নির্বাচন এবং মাল্টিমোডেল অনুমান: একটি ব্যবহারিক তথ্য-তাত্ত্বিক পদ্ধতির" অনুসারে যে কোনও ক্ষেত্রে মূল্যায়ন।
COOLSerdash

আমাকে বার্নহ্যাম এবং অ্যান্ডারসন শুরু করবেন না দয়া করে। github.com/bbolker/discretiization
বেন বলকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.