আপনি দুটি মডেল তুলনা করতে পারবেন না কারণ তারা একই ভেরিয়েবলকে মডেল না করে (যেমন আপনি নিজেকে সঠিকভাবে চিনেন)। তবুও এআইসির কাজ করা উচিত যখন নেস্টেড এবং নননেস্টেড উভয়ই মডেলের তুলনা করা যায়।
আমাদের চালিয়ে যাওয়ার আগে কেবল একটি অনুস্মারক: একটি গাউসিয়ান লগ-সম্ভাবনা দেওয়া হয়েছে
log(L(θ))=−|D|2log(2π)−12log(|K|)−12(x−μ)TK−1(x−μ),
আপনার মডেল এর covariance গঠন হচ্ছে, | ডি | আপনার ডেটাসেটে পয়েন্ট সংখ্যা,K|D| গড় প্রতিক্রিয়া এবং x আপনার নির্ভরশীল পরিবর্তনশীল।μx
আরও সুনির্দিষ্টভাবে এআইসি সমান গণনা করা হয় , যেখানে কে আপনার মডেল এবং এল আপনার সম্ভাবনা ফাংশন [1] এর স্থির প্রভাবগুলির সংখ্যা । এটি কার্যত ব্যবসায়িক বন্ধকে বৈকল্পিক ( 2 কে ) এবং পক্ষপাত ( 2 লগ ( এল ) এর মধ্যে তুলনা করে2k−2log(L)kL2k2log(L) আপনার মডেলিং অনুমানগুলিতে ) এর মধ্যে করে। আপনার ক্ষেত্রে যেমন এটি পক্ষপাতিত্বের শব্দটি আসে তখন এটি দুটি ভিন্ন লগ-সম্ভাবনা কাঠামোর সাথে তুলনা করবে। এটা এ কারণেও যে যখন আপনি আপনার লগ-সম্ভাবনা কার্যত নিরূপণ আপনি দুটি পদ তাকান: একটি হইয়া শব্দ, দ্বারা প্রকাশ , এবং একটি জটিলতা শাস্তি শর্ত,-1দ্বারা চিহ্নিত−12(x−μ)TK−1(x−μ)। সুতরাং আপনি দেখতে পাচ্ছেন যে আপনার ফিটের মেয়াদ দুটি মডেলের মধ্যে সম্পূর্ণ আলাদা; প্রথম ক্ষেত্রে আপনি কাঁচা ডেটা থেকে অবশিষ্টাংশের তুলনা করুন এবং অন্য ক্ষেত্রে লগ করা তথ্যের অবশিষ্টাংশগুলি।−12log(|K|)
উইকিপিডিয়া পাশাপাশি, এআইসিও সমান সংজ্ঞায়িত: [3]; বিভিন্ন নির্ভরশীল ভেরিয়েবল সহ বিভিন্ন মডেল তুলনীয় নয় কেন এই ফর্মটি আরও প্রকট করে তোলে। আরএসএস হ'ল দুটি মামলা দুজনের মধ্যে অতুলনীয়।|D|log(RSS|D|)+2k
আকাইকের মূল কাগজ [4] আসলে বুঝতে খুব শক্ত (আমার মনে হয়)। এটি কেএল ডাইভার্জেন্সের ভিত্তিতে (মোটামুটিভাবে দুটি বিতরণের মধ্যে পার্থক্য) তৈরি করে এবং আপনি কীভাবে আপনার ডেটাটির অজানা সত্য বিতরণটি আনুমানিক করতে পারেন এবং এটির তুলনা করতে পারেন যা আপনার মডেল ধরেছে এমন ডেটার বিতরণের সাথে। যে কারণে "ছোট এআইসির স্কোর আরও ভাল" ; আপনি আপনার ডেটা আনুমানিক সত্য বিতরণ কাছাকাছি।
সুতরাং এআইসি ব্যবহার করার সময় এগুলিকে একত্রে স্পষ্ট করে মনে রাখা উচিত [২,৫]:
আপনি বিভিন্ন ডেটা সেটগুলির মডেলগুলির তুলনা করতে এটি ব্যবহার করতে পারবেন না।
সমস্ত প্রার্থী মডেলগুলির জন্য আপনার একই প্রতিক্রিয়া ভেরিয়েবলগুলি ব্যবহার করা উচিত।
আপনার থাকা উচিত |D|>>k , কারণ অন্যথায় আপনি ভাল মধ্যে asymptotic দৃঢ়তা পাবেন না।
আপনার কাছে খারাপ খবর ভাঙার জন্য দুঃখিত তবে আপনি অন্যের উপর নির্ভরশীল ভেরিয়েবল বেছে নিচ্ছেন তা দেখানোর জন্য এআইসি ব্যবহার করা কোনও পরিসংখ্যানগত দিক থেকে উপযুক্ত বিষয় নয়। উভয় মডেলটিতে আপনার অবশিষ্টাংশের বিতরণ পরীক্ষা করুন, যদি লগ করা ডেটা কেসটি সাধারণত অবশিষ্টাংশ বিতরণ করে এবং কাঁচা ডেটা কেস না করে তবে আপনার যা প্রয়োজন তার যথাযথ যুক্তি আপনার কাছে প্রয়োজন। আপনার কাঁচা ডেটা কোনও লগন্যরমালের সাথে মিল রয়েছে কিনা তাও আপনি দেখতে চাইতে পারেন, এটিও ন্যায়সঙ্গত হওয়ার পক্ষে যথেষ্ট।
কঠোর গাণিতিক অনুমানের জন্য গেমটি হ'ল কেএল ডাইভারজেনশন এবং তথ্য তত্ত্ব ...
আহ, এবং কিছু উল্লেখ:
- http://en.wikipedia.org/wiki/Akaike_information_criterion
- আকাইকে তথ্যের মানদণ্ড, শুহুয়া হু, (উপস্থাপনা পৃষ্ঠা 17-18)
- ফলিত মাল্টিভিয়ারিয়েট স্ট্যাটিস্টিকাল অ্যানালাইসিস, জনসন এবং উইচারন, 6th ষ্ঠ এড। (পৃষ্ঠা 386-387)
- পরিসংখ্যানগত মডেল সনাক্তকরণের নতুন চেহারা, এইচ। আকাইকে, স্বয়ংক্রিয় নিয়ন্ত্রণের আইইইই লেনদেন 19 (6): 716–723 (1974)
- মডেল সিলেকশন টিউটোরিয়াল # 1: আকাইকের তথ্য মানদণ্ড, ডি শ্মিট এবং ই মাকালিক, (উপস্থাপনা পৃষ্ঠা 39)