এআইসির মডেল তুলনার জন্য পূর্বশর্ত


26

কাজের তুলনায় এআইসির মডেলটির জন্য পূর্বশর্তগুলি ঠিক কী কী প্রয়োজন?

আমি ঠিক এই প্রশ্নটি ঘিরে এসেছি যখন আমি এইরকম তুলনা করেছি:

> uu0 = lm(log(usili) ~ rok)
> uu1 = lm(usili ~ rok)
> AIC(uu0)
[1] 3192.14
> AIC(uu1)
[1] 14277.29

এইভাবে আমি logভেরিয়েবলের রূপান্তরকে ন্যায়সঙ্গত করেছি usili। তবে আমি জানি না যে আমি মডেলগুলিকে এআইসি-তুলনা করতে পারি যখন উদাহরণস্বরূপ নির্ভরশীল পরিবর্তনশীলটি আলাদা হয়?

আদর্শ উত্তরের মধ্যে পূর্বশর্তগুলির তালিকা (গাণিতিক অনুমান) অন্তর্ভুক্ত থাকবে।

উত্তর:


29

আপনি দুটি মডেল তুলনা করতে পারবেন না কারণ তারা একই ভেরিয়েবলকে মডেল না করে (যেমন আপনি নিজেকে সঠিকভাবে চিনেন)। তবুও এআইসির কাজ করা উচিত যখন নেস্টেড এবং নননেস্টেড উভয়ই মডেলের তুলনা করা যায়।

আমাদের চালিয়ে যাওয়ার আগে কেবল একটি অনুস্মারক: একটি গাউসিয়ান লগ-সম্ভাবনা দেওয়া হয়েছে

log(L(θ))=|D|2log(2π)12log(|K|)12(xμ)TK1(xμ),

আপনার মডেল এর covariance গঠন হচ্ছে, | ডি | আপনার ডেটাসেটে পয়েন্ট সংখ্যা,K|D| গড় প্রতিক্রিয়া এবং x আপনার নির্ভরশীল পরিবর্তনশীল।μx

আরও সুনির্দিষ্টভাবে এআইসি সমান গণনা করা হয় , যেখানে কে আপনার মডেল এবং এল আপনার সম্ভাবনা ফাংশন [1] এর স্থির প্রভাবগুলির সংখ্যা । এটি কার্যত ব্যবসায়িক বন্ধকে বৈকল্পিক ( 2 কে ) এবং পক্ষপাত ( 2 লগ ( এল ) এর মধ্যে তুলনা করে2k2log(L)kL2k2log(L) আপনার মডেলিং অনুমানগুলিতে ) এর মধ্যে করে। আপনার ক্ষেত্রে যেমন এটি পক্ষপাতিত্বের শব্দটি আসে তখন এটি দুটি ভিন্ন লগ-সম্ভাবনা কাঠামোর সাথে তুলনা করবে। এটা এ কারণেও যে যখন আপনি আপনার লগ-সম্ভাবনা কার্যত নিরূপণ আপনি দুটি পদ তাকান: একটি হইয়া শব্দ, দ্বারা প্রকাশ , এবং একটি জটিলতা শাস্তি শর্ত,-1দ্বারা চিহ্নিত12(xμ)TK1(xμ)। সুতরাং আপনি দেখতে পাচ্ছেন যে আপনার ফিটের মেয়াদ দুটি মডেলের মধ্যে সম্পূর্ণ আলাদা; প্রথম ক্ষেত্রে আপনি কাঁচা ডেটা থেকে অবশিষ্টাংশের তুলনা করুন এবং অন্য ক্ষেত্রে লগ করা তথ্যের অবশিষ্টাংশগুলি।12log(|K|)

উইকিপিডিয়া পাশাপাশি, এআইসিও সমান সংজ্ঞায়িত: [3]; বিভিন্ন নির্ভরশীল ভেরিয়েবল সহ বিভিন্ন মডেল তুলনীয় নয় কেন এই ফর্মটি আরও প্রকট করে তোলে। আরএসএস হ'ল দুটি মামলা দুজনের মধ্যে অতুলনীয়।|D|log(RSS|D|)+2k

আকাইকের মূল কাগজ [4] আসলে বুঝতে খুব শক্ত (আমার মনে হয়)। এটি কেএল ডাইভার্জেন্সের ভিত্তিতে (মোটামুটিভাবে দুটি বিতরণের মধ্যে পার্থক্য) তৈরি করে এবং আপনি কীভাবে আপনার ডেটাটির অজানা সত্য বিতরণটি আনুমানিক করতে পারেন এবং এটির তুলনা করতে পারেন যা আপনার মডেল ধরেছে এমন ডেটার বিতরণের সাথে। যে কারণে "ছোট এআইসির স্কোর আরও ভাল" ; আপনি আপনার ডেটা আনুমানিক সত্য বিতরণ কাছাকাছি।

সুতরাং এআইসি ব্যবহার করার সময় এগুলিকে একত্রে স্পষ্ট করে মনে রাখা উচিত [২,৫]:

  1. আপনি বিভিন্ন ডেটা সেটগুলির মডেলগুলির তুলনা করতে এটি ব্যবহার করতে পারবেন না।

  2. সমস্ত প্রার্থী মডেলগুলির জন্য আপনার একই প্রতিক্রিয়া ভেরিয়েবলগুলি ব্যবহার করা উচিত।

  3. আপনার থাকা উচিত |D|>>k , কারণ অন্যথায় আপনি ভাল মধ্যে asymptotic দৃঢ়তা পাবেন না।

আপনার কাছে খারাপ খবর ভাঙার জন্য দুঃখিত তবে আপনি অন্যের উপর নির্ভরশীল ভেরিয়েবল বেছে নিচ্ছেন তা দেখানোর জন্য এআইসি ব্যবহার করা কোনও পরিসংখ্যানগত দিক থেকে উপযুক্ত বিষয় নয়। উভয় মডেলটিতে আপনার অবশিষ্টাংশের বিতরণ পরীক্ষা করুন, যদি লগ করা ডেটা কেসটি সাধারণত অবশিষ্টাংশ বিতরণ করে এবং কাঁচা ডেটা কেস না করে তবে আপনার যা প্রয়োজন তার যথাযথ যুক্তি আপনার কাছে প্রয়োজন। আপনার কাঁচা ডেটা কোনও লগন্যরমালের সাথে মিল রয়েছে কিনা তাও আপনি দেখতে চাইতে পারেন, এটিও ন্যায়সঙ্গত হওয়ার পক্ষে যথেষ্ট।

কঠোর গাণিতিক অনুমানের জন্য গেমটি হ'ল কেএল ডাইভারজেনশন এবং তথ্য তত্ত্ব ...

আহ, এবং কিছু উল্লেখ:

  1. http://en.wikipedia.org/wiki/Akaike_information_criterion
  2. আকাইকে তথ্যের মানদণ্ড, শুহুয়া হু, (উপস্থাপনা পৃষ্ঠা 17-18)
  3. ফলিত মাল্টিভিয়ারিয়েট স্ট্যাটিস্টিকাল অ্যানালাইসিস, জনসন এবং উইচারন, 6th ষ্ঠ এড। (পৃষ্ঠা 386-387)
  4. পরিসংখ্যানগত মডেল সনাক্তকরণের নতুন চেহারা, এইচ। আকাইকে, স্বয়ংক্রিয় নিয়ন্ত্রণের আইইইই লেনদেন 19 (6): 716–723 (1974)
  5. মডেল সিলেকশন টিউটোরিয়াল # 1: আকাইকের তথ্য মানদণ্ড, ডি শ্মিট এবং ই মাকালিক, (উপস্থাপনা পৃষ্ঠা 39)

ধন্যবাদ! আমি গণিত বুঝতে পারি নি তবে বার্তার মূলটি পেয়েছি। তবে, আপনি কি এআইসির মডেল তুলনার জন্য প্রয়োজনীয় সমস্ত পূর্বশর্তগুলি তালিকাভুক্ত করতে পারেন? শুধু নিশ্চিত হওয়ার জন্য আমি পরের বার আর কোনও ভুল করব না। আমি এক এক করে তাদের যাচ্ছি।
কৌতুহল

1
|D|pL(θ)θp(x|θ)
usεr11852 বলছেন 22 মে 45 এ পুনরায় ইনস্টল মনিক

1
উত্তরে সেই 3 অনুমানের তালিকা যুক্ত করার জন্য আপনাকে ধন্যবাদ! এটাই আমার দরকার ছিল।
কৌতুহল

1
আপনার উত্তরটি আবার দেখছেন: আপনার পয়েন্ট 1. "আপনি বিভিন্ন ডেটা সেটগুলির মডেলগুলির তুলনা করতে এটি ব্যবহার করতে পারবেন না" । "ডেটা সেট" বলতে কী বোঝ? আমি যদি নির্ভরশীল ভেরিয়েবলের সেট পরিবর্তন করি? আমার ধারণা, এআইসির ক্ষেত্রে এখনও তুলনীয় হওয়া উচিত? আপনি কি এই উত্তরটি পরিষ্কার করতে আপনার উত্তর আপডেট করতে পারেন?
কৌতুহল

1
RSSμএক্স

11

uu0iyi12ilog(yi)uu0AIC (uu0)+2*sum (log (usili))AIC (uu1)


কোনওভাবেই এআইসিকে "সংশোধন" করার আপনার প্রয়াসের সাথে আপনি কী অনুসরণ করেন তা আমি বুঝতে পারি না এবং এটির দ্বারা আপনি আসলে কী পেলেন (কীভাবে আপনার ফলাফলটি ব্যাখ্যা করবেন)। যাইহোক, এটি খনন করবেন না, এটি কোনও ব্যাপার নয় কারণ আমার প্রশ্নটি সম্পূর্ণ আলাদা কিছু সম্পর্কে ছিল: এআইসি (প্রকৃত, অবিকৃত) সংবেদনশীলভাবে তুলনীয় হওয়ার জন্য সাধারণ পূর্বশর্তগুলি কী কী । এই নির্দিষ্ট উদাহরণের দিকে মনোনিবেশ করবেন না, এটি সাধারণ জিনিসের উদাহরণ মাত্র।
কৌতূহলী

1
2log(p(y|θ))x=(Y) (যেমন,এক্স=(Y))। এআইসি ব্যবহার করার সময় আপনাকে এই পরিবর্তনটির জ্যাকোবিয়ান হিসাবে অ্যাকাউন্ট করতে হবে। আপনি যে AIC()ফাংশনটি ব্যবহার করছেন এটি এর জন্য অ্যাকাউন্ট করে না।
সম্ভাব্যতাব্লোগিক

@ প্রোব্যাবিলিটিস্লোগিক: আপনার পরামর্শ (এআইসি (ইউইউ) + ২ * যোগ (লগ (ইউএসিলি)) এর জন্য আপনার কাছে কি কোনও একাডেমিক রেফারেন্স রয়েছে যাতে আমি তাদের একাডেমিক লেখায় উদ্ধৃত করতে পারি? ধন্যবাদ।
কুজে

3

Taken from Akaike 1978

আকাইকে 1978-এর এই সংক্ষিপ্তসারটি @ প্রব্যাবিলিসিস্লিক দ্বারা সমাধানটির সমর্থনে একটি উদ্ধৃতি প্রদান করে।

আকাইকে, এইচ। 1978. একটি টাইম সিরিজ মডেলের সম্ভাবনার উপর। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল। সিরিজ ডি (পরিসংখ্যানবিদ) 27: 217-235।


1
দুঃখিত আমি বুঝতে পারি না, "ভেরিয়েবলের রূপান্তর" কী এবং এটি আমার প্রশ্নের সাথে কীভাবে সম্পর্কিত। দয়া করে ব্যাখ্যা করুন, ধন্যবাদ
কৌতূহলী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.