কীভাবে এআইসির ভিত্তিতে মডেলগুলি তুলনা করবেন?


15

আমাদের দুটি মডেল রয়েছে যা লগের সম্ভাবনা গণনা করতে একই পদ্ধতি ব্যবহার করে এবং একজনের জন্য এআইসি অপরটির চেয়ে কম থাকে। তবে নীচের এআইসির সাথে যার ব্যাখ্যা দেওয়া আরও অনেক কঠিন।

আমাদের যদি সমস্যাটি প্রবর্তন করা উপযুক্ত তবে এটি সিদ্ধান্ত নিতে আমরা সমস্যায় পড়ছি এবং এটিআইসির শতাংশের পার্থক্য ব্যবহার করে আমরা এটি বিচার করেছি। আমরা দেখতে পেলাম যে দুটি এআইসির মধ্যে পার্থক্যটি কেবল ০. was% ছিল, আরও জটিল মডেলের সাথে ০.7% কম এআইসি রয়েছে।

  1. দু'জনের মধ্যে স্বল্প শতাংশের পার্থক্য কি নিম্ন এআইসির সাথে মডেলটি ব্যবহার এড়াতে ভাল কারণ?

  2. পার্থক্যের শতাংশ কী ব্যাখ্যা করে যে কম জটিল মডেলটিতে 0.7% আরও তথ্য হারিয়ে গেছে?

  3. দুটি মডেলের কি খুব আলাদা ফলাফল হতে পারে?



2
অরুনজোজ, এটি একটি সদৃশ বলে মনে হচ্ছে না। এখানে প্রশ্নগুলি বেশ আলাদা।
রিচার্ড হার্ডি

1
না। এই প্রশ্নটি মডেলগুলির তুলনার বিষয়ে নয়। আমরা ইতিমধ্যে জানি মডেলগুলি তুলনীয়। এই প্রশ্নটি এআইসির একটি উল্লেখযোগ্য পার্থক্য হিসাবে বিবেচিত এবং জটিলতা বনাম মডেল ফিটের মধ্যে বাণিজ্য বন্ধ হিসাবে বিবেচিত to
আলী তুরব লোটিয়া

উত্তর:


27

এক তুলনা নেই পরম মান দুই AICs এর (যা মত হতে পারে কিন্তু ), কিন্তু বিবেচনায় তাদের পার্থক্য : যেখানে এর এআইসি হয় -তম মডেল এবং examined হ'ল পরীক্ষিত মডেলগুলির (যেমন, পছন্দসই মডেল) সেটগুলির মধ্যে প্রাপ্ত সবচেয়ে কম এআইসি। বার্নহ্যাম এবং অ্যান্ডারসন 2004 এ যেমন আঙুলের নিয়মটি বর্ণিত , তা হল:1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. যদি , তবে তম মডেলটির পক্ষে যথেষ্ট সমর্থন রয়েছে (বা এর বিপরীতে প্রমাণগুলি কেবল একটি উল্লেখযোগ্য মূল্য হিসাবে উল্লেখযোগ্য), এবং এটি যে সঠিক বর্ণনা হিসাবে দেওয়া হয়েছে তা অত্যন্ত সম্ভাবনাময়;Δi<2i
  2. যদি , তবে তম মডেলের পক্ষে সমর্থন রয়েছে ;2<Δi<4i
  3. যদি হয় তবে তম মডেলের পক্ষে যথেষ্ট কম সমর্থন রয়েছে ;4<Δi<7i
  4. সহ মডেলগুলির মূলত কোনও সমর্থন নেই।Δi>10

এখন, প্রশ্নের মধ্যে উল্লেখ করা 0.7% সম্পর্কে, দুটি পরিস্থিতি বিবেচনা করুন:

  1. AIC1=AICmin=100 এবং 0.7% দ্বারা বড়: । তারপরে সুতরাং মডেলগুলির মধ্যে কোনও উল্লেখযোগ্য পার্থক্য নেই।AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000 এবং 0.7% দ্বারা বড়: । তারপরে তাই 2-এনডি মডেলের কোনও সমর্থন নেই।AIC2AIC2=100700Δ2=70010

অতএব, এআইসি-র মধ্যে পার্থক্য 0.7% বলে কোনও তথ্য সরবরাহ করে না ।

এআইসির লগ-সম্ভাবনা থেকে আসা স্কেলিং ধ্রুবক রয়েছে এবং তাই এই ধরণের ধ্রুবক থেকে মুক্ত। কেউ একটি পুনরুদ্ধারকারী রূপান্তর বিবেচনা করতে পারেন যা সেরা মডেলকে have ।Δ i Δ i = A I C i - A I C m i n A I C m i n : = 0LΔiΔi=AICiAICminAICmin:=0

এআইসির গঠনের ফলে অতিরিক্ত সংখ্যক পরামিতি ব্যবহারকে দন্ড দেওয়া হয়, তাই অতিরিক্ত চাপ দেওয়াকে নিরুৎসাহিত করে। এটি কম পরামিতি সহ মডেলগুলিকে পছন্দ করে, যতক্ষণ না অন্যরা যথেষ্ট পরিমাণে আরও ভাল ফিট করে। এআইসি এমন একটি মডেল (পরীক্ষিতদের মধ্যে) বাছাই করার চেষ্টা করে যা যথাযথভাবে বাস্তবতার বর্ণনা দেয় (পরীক্ষার অধীনে থাকা ডেটার আকারে)। এর অর্থ হ'ল প্রকৃতপক্ষে মডেলের ডেটাগুলির প্রকৃত বিবরণ হিসাবে বিবেচনা করা হয় না। নোট করুন যে এআইসি আপনাকে তথ্য দেয় যে কোনও মডেল ডেটার আরও ভালভাবে বর্ণনা করে, এটি কোনও ব্যাখ্যা দেয় না ।

ব্যক্তিগতভাবে , আমি বলব যে আপনার যদি একটি সাধারণ মডেল এবং জটিল একটি রয়েছে যার অনেক কম এআইসি রয়েছে, তবে সাধারণ মডেলটি যথেষ্ট ভাল নয়। আরো জটিল মডেল সত্যিই হয়, তাহলে অনেক বেশি জটিল কিন্তু বিশাল নয় (হয়তো , হয়তো - বিশেষ পরিস্থিতির উপর নির্ভর করে) যদি এটা সত্যিই সঙ্গে কাজ করা আরো সহজ আমি সহজ মডেল বিদ্ধ হবে ।Δ i < 2 Δ i < 5ΔiΔi<2Δi<5

এরপরে, আপনি তম মডেলটির মাধ্যমে কোনও সম্ভাবনা স্বীকার করতে পারেনi

pi=exp(Δi2),

AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

পরিশেষে, এআইসির সূত্রটি সম্পর্কে:

AIC=2k2L,

LΔi2kΔi2Δk<1

টি এল; ডিআর

  1. এটি একটি খারাপ কারণ; এআইসির পরম মানগুলির মধ্যে পার্থক্যটি ব্যবহার করুন।
  2. শতকরা কিছু বলে না।
  3. মডেল, ডেটা এবং বিভিন্ন ফলাফলের অর্থ কী তা সম্পর্কে কোনও তথ্য না থাকার কারণে এই প্রশ্নের উত্তর দেওয়া সম্ভব নয় ।

2
আমি এই রহস্যময় বিষয়টি এর আগে সবচেয়ে স্পষ্ট ব্যাখ্যা পেয়েছি। আপনি উল্লেখ করা নিবন্ধটি আমি দেখলাম (পৃষ্ঠা 270-272) এবং এখানে আপনার ব্যাখ্যা নিবন্ধটি কী ব্যাখ্যা করে তার একটি সাধারণ এবং স্পষ্ট তবে খুব নির্ভুল উপস্থাপনা।
ত্রিপার্তিও

আপনি সম্ভবত এই ফলোআপ প্রশ্নে সাহায্য করতে পারেন? stats.stackexchange.com/questions/349883/...
Tripartio
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.