কেন তথ্য মাপদণ্ড (সামঞ্জস্য করা হয়নি)


9

টাইম সিরিজের মডেলগুলিতে, এআরএমএ-জিআরচের মতো মডেলগুলির যথাযথ ল্যাগ বা ক্রম নির্বাচন করতে বিভিন্ন তথ্য মানদণ্ড, যেমন এআইসি, বিআইসি, এসআইসি ইত্যাদি ব্যবহার করা হয়।

আমার প্রশ্ন খুব সহজ, আমরা কেন উপযুক্ত মডেল চয়ন করতে সমন্বিত ব্যবহার করি না ? আমরা এমন মডেল নির্বাচন করতে পারি যা সমন্বিত । উচ্চতর মানের দিকে পরিচালিত করে । কারণ সমন্বিত এবং তথ্য মানদণ্ড উভয়ই মডেলটিতে অতিরিক্ত সংখ্যক রেজিস্ট্রারদের জন্য শাস্তি দেয়, যেখানে প্রাক্তন দন্ডিত করে এবং পরে সম্ভাবনার মানটিকে দন্ড দেয়। R2R2R2R2


আমি উত্তরে (নীচে) কিছু অনুপস্থিত হতে পারি তবে আর-স্কোয়ারের পাশাপাশি অ্যাডজাস্টেড আর-স্কোয়ারগুলি ওএলএস অনুমিত মডেলের তুলনামূলকভাবে সীমিত শ্রেণির জন্য উপযুক্ত যেখানে এআইসিসি, বিআইসিসি, ইত্যাদি সাধারণীকরণের বিস্তৃত শ্রেণির জন্য উপযুক্ত মডেলগুলি অনুমান করা যায়, সম্ভবত, এমএল বা কোনও বৈকল্পিক সহ।
মাইক হান্টার

উত্তর:


12

আমি যুক্তি দিয়ে বলব যে অন্তত লিনিয়ার মডেলগুলি (এআর মডেলের মতো) নিয়ে আলোচনা করার সময়, সামঞ্জস্য করা R2 এবং এআইসি এর চেয়ে আলাদা নয়।

কিনা তা বিবেচনা করুন X2 অন্তর্ভুক্ত করা উচিত

y=X1(n×K1)β1+X2(n×K2)β2+ϵ
এটি মডেলগুলির সাথে তুলনা করার সমতুল্য
M1:y=X1β1+uM2:y=X1β1+X2β2+u,
কোথায় E(u|X1,X2)=0। আমরা বলি যেM2যদি সত্য মডেল হয়β20। লক্ষ্য করুনM1M2। মডেলগুলি এভাবে বাসা বাঁধে । একটি মডেল নির্বাচন পদ্ধতিM^ একটি ডেটা-নির্ভর নিয়ম যা বেশ কয়েকটি মডেলের মধ্যে সবচেয়ে প্রশংসনীয় নির্বাচন করে।

আমরা বলি M^হয় সামঞ্জস্যপূর্ণ যদি

limnP(M^=M1|M1)=1limnP(M^=M2|M2)=1

সামঞ্জস্য বিবেচনা করুন R2। যে, নির্বাচন করুনM1 যদি R¯12>R¯22। যেমনR¯2 একঘেয়েমি হ্রাস হয় s2এই পদ্ধতিটি হ্রাস করার সমতুল্য s2। পরিবর্তে, এটি হ্রাস করার সমতুল্যlog(s2)। যথেষ্ট পরিমাণে বড়n, পরবর্তী হিসাবে লেখা যেতে পারে

log(s2)=log(σ^2nnK)=log(σ^2)+log(1+KnK)log(σ^2)+KnKlog(σ^2)+Kn,
কোথায় σ^2ত্রুটি বৈকল্পিকের এমএল অনুমানকারী। মডেল নির্বাচন উপর ভিত্তি করেR¯2 অতএব ক্ষুদ্রতমের সাথে মডেলটি বেছে নেওয়ার মতো অসম্মানীয় equivalent log(σ^2)+K/n। এই পদ্ধতিটি বেমানান।

প্রস্তাব :

limnP(R¯12>R¯22|M1)<1

প্রুফ :

P(R¯12>R¯22|M1)P(log(s12)<log(s22)|M1)=P(nlog(s12)<nlog(s22)|M1)P(nlog(σ^12)+K1<nlog(σ^22)+K1+K2|M1)=P(n[log(σ^12)log(σ^22)]<K2|M1)P(χK22<K2)<1,
যেখানে দ্বিতীয় থেকে শেষ লাইন অনুসরণ করে কারণ পরিসংখ্যানগুলি লিনিয়ার রিগ্রেশন ক্ষেত্রে এলআর পরিসংখ্যান যা একটি অ্যাসিম্পটোটিক অনুসরণ করে χK22নাল বিতরণ। Qed

এখন আকাইকের মানদণ্ড বিবেচনা করুন,

AIC=log(σ^2)+2Kn
সুতরাং, এআইসি "পেনাল্টি শর্ত," এর বিপরীতে অতিরিক্ত রেজিস্ট্রারদের দ্বারা আরোপিত এসএসআর হ্রাসও বন্ধ করে দেয়, যা বিপরীত দিকে নির্দেশ করে। সুতরাং, চয়ন করুনM1 যদি AIC1<AIC2অন্যথায় নির্বাচন করুন M2

এটি দেখা যায় যে AIC তিনটি উপরের প্রমাণটি লাইন দিয়ে চালিয়ে যাওয়ার সাথেও বেমানান P(nlog(σ^12)+2K1<nlog(σ^22)+2(K1+K2)|M1)। সমন্বিতR2 এবং AIC এইভাবে "বৃহত" মডেলটি চয়ন করুন M2 ইতিবাচক সম্ভাবনা সহ, এমনকি যদি M1 সত্য মডেল।

এআইসিতে জটিলতার জন্য জরিমানা অ্যাডজাস্ট করার চেয়ে কিছুটা বড় R2যদিও এটি তদারকি করার ক্ষেত্রে কম প্রবণ হতে পারে। এবং এটিতে অন্যান্য দুর্দান্ত বৈশিষ্ট্য রয়েছে (কেএল ডাইভার্জেন হ্রাস করে সত্য মডেলটিকে যদি বিবেচিত মডেলগুলির সেটে না হয়) যা আমার পোস্টে সম্বোধন করা হয়নি।


1
দুর্দান্ত উত্তর: খুব ভারী নয় তবুও সঠিক! এটি যদি গতকাল থাকত তবে আমি আমার পোস্ট করতাম না।
রিচার্ড হার্ডি

এআরএমএ-জিআরচ মামলার বিষয়ে কী? কেমন করেRadj2আমাং এমএ এবং জিআরচ পদগুলি নির্বাচন করতে চান?
জাচারি ব্লুমেনফিল্ড

আমি বলার সাহস করব না। আপনি যেমন ব্যাখ্যা করেছেন এটি এমন কোনও মডেলের ফিটের জন্য আর 2 অর্থ কী তাও পরিষ্কার নয়।
ক্রিস্টোফ হ্যাঙ্ক

5

জরিমানা Radj2মডেল নির্বাচনের ক্ষেত্রে এআইসি বা বিআইসির দ্বারা উত্থাপিত হিসাবে দুর্দান্ত বৈশিষ্ট্য পাওয়া যায় না। জরিমানাRadj2 করতে যথেষ্ট Radj2 জনসংখ্যার একটি নিরপেক্ষ অনুমানক R2যখন রেজিস্ট্রারগুলির মধ্যে কেউই আসলে মডেলের অন্তর্ভুক্ত না (ডেভ গিলসের ব্লগ পোস্ট অনুসারে "কী সংবেদনের মধ্যে" অ্যাডজাস্টেড "আর-স্কোয়ার নিরপেক্ষ?" এবং "অ্যাডজাস্টেড" কোপিলিটি অব ডিটারিমেশন "এর বৈশিষ্ট্যগুলি সম্পর্কে আরও কিছু রয়েছে ); যাহোক,Radj2 কোনও অনুকূল মডেল নির্বাচনকারী নয়।

(দ্বন্দ্বের দ্বারা প্রমাণ থাকতে পারে: যদি এআইসি এক অর্থে অনুকূল হয় এবং অন্যদিকে বিআইসি অনুকূল হয়, এবং Radj2 তবে তাদের উভয়ের সমতুল্য নয় Radj2 এই দুটি ইন্দ্রিয়ের মধ্যে কোনওটিই অনুকূল নয়))


এর আগে আমাকে কতগুলি জিআরচ প্যারামিটার যুক্ত করতে হবে R2বৃদ্ধির? :) .... আমি বিশ্বাস করি পারস্পরিক সম্পর্কযুক্ত ত্রুটিগুলি (এমএ মডেলের মতো) ধরে নেওয়ার জন্যও একই রকম যুক্তি দেওয়া যেতে পারে, একটি জিএলএস মডেল সাধারণ ন্যূনতম স্কোয়ারের তুলনায় স্কোয়ার অবশিষ্টাংশের যোগফল হ্রাস করে না। এমএ এবং জিআরচ উভয় ক্ষেত্রে প্যারামিটারগুলি (ব্যাখ্যাযোগ্য ভেরিয়েবল নয়, যাR2adjজন্য সমন্বয় করা হয়) মডেল যোগ করা হয়। এমএ এবং জিআরচ প্যারামিটারগুলি হ্রাস করার জন্য যুক্ত করা হয় নাSSRপরিবর্তে তারা সম্ভাবনা বাড়াতে এবং / অথবা আইডি ত্রুটির শর্তগুলির অভাব প্রতিফলিত করতে স্কোয়ার অবশিষ্টাংশগুলির একটি ওজনযুক্ত পরিমাণ হ্রাস করে ।
জাচারি ব্লুমেনফিল্ড

এটি কি প্রকৃতপক্ষে মূল পোস্টটিকে সম্বোধন করবে বা আমার উত্তরটি? যাই হোক না কেন, আমি আপনার বিষয়গুলির সাথে একমত
রিচার্ড হার্ডি

আমি যে বিষয়টি উল্লেখ করার চেষ্টা করছিলাম সেটি হ'ল Radj2 জিআরচ উপাদানগুলি (এবং সম্ভবত এমএ উপাদানগুলিও) বেছে নিতে সত্যই ব্যবহৃত হতে পারে না কারণ এটি এর ভগ্নাংশের উপর ভিত্তি করে SSTSSR উপর SSTযখন ত্রুটির শর্তাদি iid না হয় তখন যা বৈকল্পিক পক্ষের অনুমানকারী। (আপনি যে পক্ষপাতিত্বের কথা বলছেন সেখানে এটি কেবল একটি নির্দিষ্ট ক্ষেত্রে)। এআরএমএ-জিআরচের ক্ষেত্রে, আপনি কখনই জিআরচ উপাদানগুলির সাথে কোনও মডেল নির্বাচন করবেন না, এমনকি যদি ডেটাতে স্টকস্টিক অস্থিরতা ছিল, কারণ এটি বৃদ্ধি পায় নাR2। মূলত, আমি নির্দিষ্ট উদাহরণ দেওয়ার চেষ্টা করে আপনার সাথে একমত হই।
জ্যাচারি ব্লুমেনফিল্ড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.