আমি এই সাইটে অগণিত পোস্ট পড়েছি যা পি-ভ্যালু ভিত্তিক, এআইসিসি, বিআইসি ইত্যাদির কোনও ধরণের মানদণ্ড ব্যবহার করে ভেরিয়েবলের ধাপে ধাপে ব্যবহারের বিপরীতে অবিশ্বাস্যরূপে are
আমি বুঝতে পারি কেন এই পদ্ধতিগুলি সাধারণ হয়, ভেরিয়েবল নির্বাচনের জন্য যথেষ্ট দুর্বল। gung এর সম্ভবত বিখ্যাত পোস্টে এখানে পরিষ্কারভাবে কেন প্রকাশ করে; শেষ পর্যন্ত আমরা সেই একই ডেটাসেটে একটি হাইপোথিসিস যাচাই করছি যা আমরা হাইপোথিসিসের সাথে উপস্থিত হয়েছি, যা কেবল তথ্য ড্রেজিং। তদ্ব্যতীত, পি-মানগুলি কোলাইনারিটি এবং বহিরাগতদের মতো পরিমাণে প্রভাবিত হয়, যা ফলাফলগুলি প্রচুর পরিমাণে আঁকায় etc.
যাইহোক, আমি সময় সিরিজের পূর্বাভাসটি বেশ কিছুটা ইদানীং অধ্যয়ন করেছি এবং হিন্ডম্যানের সম্মানিত পাঠ্যপুস্তক জুড়ে এসেছি যেখানে তিনি এখানে বিশেষত আরিমা মডেলগুলির সর্বোত্তম ক্রম সন্ধানের জন্য ধাপে ধাপে নির্বাচন ব্যবহারের উল্লেখ করেছেন । আসলে, forecast
আর এর প্যাকেজে auto.arima
ডিফল্ট হিসাবে পরিচিত সুপরিচিত অ্যালগরিদম স্টেপওয়াইজ সিলেকশন ব্যবহার করে (এআইসি সহ, পি-ভ্যালু নয়)। তিনি পি-ভ্যালু ভিত্তিক বৈশিষ্ট্য নির্বাচনের সমালোচনাও করেন যা এই ওয়েবসাইটে একাধিক পোস্টের সাথে ভালভাবে সাজায়।
চূড়ান্তভাবে, যদি আমাদের পূর্বাভাস / পূর্বাভাসের জন্য ভাল মডেলগুলি বিকাশ করা হয় তবে আমাদের সর্বদা কিছু উপায়ে বৈধতা অতিক্রম করতে হবে। যাইহোক, পি-ভ্যালু ব্যতীত মূল্যায়ন মেট্রিকের পদ্ধতিটি নিজেই আসে তখন অবশ্যই এখানে কিছুটা দ্বিমত রয়েছে।
এই প্রসঙ্গে স্টেওয়াইজ এআইসির ব্যবহার সম্পর্কে কারও কি কোনও মতামত রয়েছে, তবে সাধারণভাবেও এই প্রসঙ্গে? আমাকে কোনও ধাপের দিকের নির্বাচনটি খারাপ বলে বিশ্বাস করতে শেখানো হয়েছে, তবে সত্যি কথা বলতে, auto.arima(stepwise = TRUE)
নমুনা ফলাফলের চেয়ে আমাকে আরও ভাল ফল দেওয়া হচ্ছে auto.arima(stepwise = FALSE)
তবে সম্ভবত এটি কাকতালীয় ঘটনা।