দুটি অ-নেস্টেড মডেলের এআইসির পার্থক্য পরীক্ষা করে


12

এআইসির সম্পূর্ণ বিষয় বা অন্য কোনও তথ্যের মানদণ্ডটি এটিই কম ভাল। সুতরাং আমার যদি দুটি মডেল M1 থাকে: y = a0 + XA + e এবং M2: y = b0 + ZB + u, এবং যদি প্রথম (A1) এর AIC দ্বিতীয় (A2) এর চেয়ে কম হয়, তবে এম 1 আছে তথ্য তত্ত্বের দিক থেকে আরও ভাল ফিট। তবে এ 1-এ 2 পার্থক্যের জন্য কি কোনও কাটঅফ বেঞ্চমার্ক রয়েছে? আসলে কত কম? অন্য কথায়, (আই 1-এ 2) জন্য কেবল চক্ষুদান ছাড়া অন্য কোনও পরীক্ষা আছে কি?

সম্পাদনা করুন: পিটার / দিমিত্রিজ ... সাড়া দেওয়ার জন্য ধন্যবাদ আসলে, এটি এমন একটি ক্ষেত্রে যেখানে আমার পরিসংখ্যানগত দক্ষতা আমার পরিসংখ্যানগত দক্ষতার সাথে সাংঘর্ষিক। মূলত, সমস্যাটি দুটি মডেলের মধ্যে নির্বাচন করা নয়, তবে দুটি ভেরিয়েবল যা আমি মূলত সমতুল্য জানি তা সমমানের পরিমাণের তথ্য যোগ করে (আসলে, প্রথম মডেলের একটি ভেরিয়েবল এবং দ্বিতীয়টিতে একটি ভেক্টর। এর ক্ষেত্রে চিন্তা করুন) তাদের সূচকের বিপরীতে ভেরিয়েবলগুলির একগুচ্ছ।)। দিমিত্রিজ যেমন উল্লেখ করেছেন, সেরা বাজি মনে হচ্ছে কক্স টেস্ট। তবে দুটি মডেলের তথ্যের বিষয়বস্তুর মধ্যে পার্থক্যটি পরীক্ষা করার কোনও উপায় আছে কি?


আপনি ওয়াগন প্রস্তুতকারক এবং অন্যান্য পরীক্ষা করতে আগ্রহীও হতে পারেন। (2004)। প্যারামেট্রিক বুটস্ট্র্যাপ ব্যবহার করে মডেল নকলকরণের মূল্যায়ন করা। গাণিতিক মনোবিজ্ঞান জার্নাল, 48 , 28-50। ( পিডিএফ )
গং - মনিকা পুনরায়

উত্তর:


13

কৌতূহল প্রশ্নটি, মানে আপনি এখানে আমার উত্তর দ্বারা সন্তুষ্ট না ? যদি না...

এই জটিল প্রশ্নটির আরও তদন্তে দেখা গেছে যে একটি নিয়মিত-থাম্ব-র থাম্ব বিদ্যমান রয়েছে, এতে বলা হয়েছে যে পার্থক্য থাকলে দুটি মডেল মাপদণ্ডের দ্বারা পৃথক করা যায় | আই সি 1 - আই সি 2 | < 2 । আপনি একইভাবে উইকিপিডিয়াতে আই সি তে নিবন্ধটি পড়বেন (নোটটি ক্লিকযোগ্য!)। যারা লিঙ্কগুলি ক্লিক করেন না কেবল তাদের জন্য:AIC|AIC1AIC2|<2AIC

একটি মডেলের জন্য আপেক্ষিক সমর্থন অনুমান করে। বাস্তবে এটি প্রয়োগ করতে, আমরা পরীক্ষার্থী মডেলগুলির একটি সেট দিয়ে শুরু করি এবং তারপরে মডেলগুলির সংশ্লিষ্ট A I C মান খুঁজে পাই । এর পরে, সর্বনিম্ন A I C মানটি সনাক্ত করুন। তারপরে একটি মডেল নির্বাচন নীচে করা যেতে পারে।AICAICAIC

থাম্বের মোটামুটি নিয়ম হিসাবে, ন্যূনতমের এর মধ্যে তাদের থাকার মডেলগুলির যথেষ্ট সমর্থন রয়েছে এবং এফেরেন্সগুলি তৈরি করতে বিবেচনা করা উচিত। ন্যূনতমের প্রায় এর মধ্যে তাদের থাকা মডেলগুলির যথেষ্ট কম সমর্থন রয়েছে, যখন তাদের ন্যূনতম সাথে থাকা মডেলগুলির মূলত কোনও সমর্থন নেই এবং আরও বিবেচনা থেকে বাদ দেওয়া যেতে পারে বা কমপক্ষে কিছু উল্লেখযোগ্য কাঠামোগত প্রকরণ ব্যাখ্যা করতে ব্যর্থ হন তথ্যটি.AIC12AIC47AIC>10

আরও সাধারণ পন্থাটি নিম্নরূপ ...

বোঝাতে দ্বারা প্রার্থী মডেলের মান , । আসুন সেই মানগুলির সর্বনিম্নকে চিহ্নিত করে। তারপরে কে মডেল (অপ্রত্যাশিত আনুমানিক) তথ্য ক্ষতি হ্রাস করতে পারে এমন আপেক্ষিক সম্ভাবনা হিসাবে ব্যাখ্যা করা যেতে পারে ।AICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2i

উদাহরণস্বরূপ, ধরুন, প্রার্থীর সেটে তিনটি মডেল ছিলেন, যার সাথে মান , এবং । তারপরে দ্বিতীয় মডেলটি তথ্য ক্ষয় হ্রাস করতে প্রথম মডেল হিসাবে সম্ভাব্য হিসাবে গুণ এবং তৃতীয় মডেলটি বার তথ্য ক্ষয় হ্রাস করতে প্রথম মডেল হিসাবে সম্ভাব্য। এই ক্ষেত্রে, আমরা আরও বিবেচনা থেকে তৃতীয় মডেলটি বাদ দিতে পারি এবং যথাক্রমে এবং ওজন সহ প্রথম দুটি মডেলের ওয়েট গড় নিতে । পরিসংখ্যানগত অনুমিতি তখন ভারযুক্ত মাল্টিমোডেলের উপর ভিত্তি করে তৈরি করা হবে।AIC100102110e(100102)/2=0.368e(100110)/2=0.00710.368

আমার মতামত, সুন্দর ব্যাখ্যা এবং দরকারী পরামর্শ। ক্লিকযোগ্য কি তা পড়তে কেবল ভয় পাবেন না!

ইন উপরন্তু , নোট আরো একবার বড় মাপের ডেটা সেটের জন্য কম বাঞ্ছনীয়। ছাড়াও আপনি মানদণ্ড পক্ষপাতিত্ব-সংশোধিত সংস্করণ প্রয়োগ করতে দরকারী হতে পারেন (আপনি এই কোডটি ব্যবহার করতে পারেন বা the সূত্রটি ব্যবহার করতে পারেন , যেখানে আনুমানিক পরামিতিগুলির সংখ্যা)। থাম্বের নিয়ম একই হবে। AICBICAICAICcR AICc=AIC+2p(p+1)np1p


হাই দিমিত্রিজ ... আমি জানতাম আপনি এটি খুঁজে পেয়েছেন। আসলে, আসল প্রশ্নের আপনার প্রতিক্রিয়া এই ট্রেনটির ঘূর্ণায়মান সেট করে। আমি ভেবেছিলাম এটি একটি মজাদার একাকী প্রশ্ন তৈরি করবে। আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল স্ট্যাটিস্টিকাল টেস্টগুলি (কক্সের টেস্ট সহ) ঘন ঘন ist তবে এআইসি / বিআইসি সম্ভাবনা ভিত্তিক, এবং আমার কাছে মনে হয় যে থাম্বের বিধি দ্বারা আপনি উল্লেখ করেছেন, সংখ্যাগুলি ছাড়া সরাসরি তুলনা করা যায় না। যেহেতু আইসি ব্যবস্থা স্কেল-নির্ভর, তাই একটি পরম মান (2) সমস্যাযুক্ত হতে পারে, না?
user3671

@ ব্যবহারকারী, নিখুঁত মান সমস্যাযুক্ত নয়। আপনি আপেক্ষিক সম্ভাব্যতার পরামর্শের জন্য যেতে পারেন, সুতরাং আপনি এটির ভাল মানের চেয়ে বেশি আত্মবিশ্বাসী হবেন । দ্বারা স্কেল প্রভাব যখন আপনি নির্ণায়ক কম ছোট নমুনা পক্ষপাতদুষ্ট এবং বৃহৎ মধ্যে সামঞ্জস্যপূর্ণ মানে? সামঞ্জস্যপূর্ণ করার চেষ্টা করুন পরিবর্তে এবং জন্য ছোট নমুনা একটি ভালো বিকল্প হতে হবে। থাম্বগুলির বিধি এখনও ব্যবহারযোগ্য। 22BICAICc
দিমিত্রিজ চেলভ

1
@ দিমিত্রিজকেলভ (কিছু সময় আগে +1) চমৎকার উত্তর - পাঠ্যটি আটকানোর জন্য ধন্যবাদ, কারণ উইকিপিডিয়ায় আর প্রথম দুটি অনুচ্ছেদে পয়েন্ট নেই। সরানো অনুচ্ছেদটি পি হিসাবে উল্লেখ করা হয়েছিল। 446: Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. এবং পূর্ব-সংশোধন উইকি পৃষ্ঠাটি এখানে রয়েছে
জেমস স্ট্যানলি

আমার মনে রাখা উচিত যে আমি বার্নহ্যাম বইটি পড়িনি, এবং পুরাতন উইকি রেফারেন্সটি উদ্ধৃত হিসাবে পাঠ্যটি একটি প্যারাফ্রেজ বলে প্রস্তাব করেছিল। এফওয়াইআই, উইকি পৃষ্ঠাটি 16:52, 15 এপ্রিল 2011
জেমস স্ট্যানলি

আপনি সম্ভবত এই ফলোআপ প্রশ্নে সাহায্য করতে পারেন? stats.stackexchange.com/questions/349883/...
Tripartio

8

আমি মনে করি এটি আপনি যা চান না তা পাওয়ার চেষ্টা হতে পারে।

মডেল নির্বাচন কোনও বিজ্ঞান নয়। বিরল পরিস্থিতিতে ব্যতীত, কোনও একটি নিখুঁত মডেল বা এমনকি একটি "সত্য" মডেল নেই; খুব কমই একটি "সেরা" মডেল আছে। এআইসি বনাম এআইসিসি বনাম বিআইস বনাম এসবিসি বনাম আলোচনা যাই হোক না কেন আমাকে কিছুটা ছাড়িয়ে যায়। আমি মনে করি ধারণাটি কিছু ভাল মডেল পেতে হয়। তারপরে আপনি তাদের মধ্যে স্থিতিশীল দক্ষতা এবং পরিসংখ্যানগত ধারণার সংমিশ্রণের ভিত্তিতে চয়ন করুন। আপনার যদি কোনও দক্ষ দক্ষতা না থাকে (খুব কম ক্ষেত্রেই হয়; বেশিরভাগ লোকের ধারণা থেকে অনেক কমই) তবে সর্বনিম্ন এআইসি (বা এআইসিসি বা যাই হোক না কেন) বেছে নিন। তবে আপনার সাধারণত কিছু দক্ষতা আছে - অন্যথায় আপনি কেন এই নির্দিষ্ট ভেরিয়েবলগুলি তদন্ত করছেন?


2
উভয় পরিসংখ্যানগত এবং তাত্পর্যপূর্ণ বিশেষজ্ঞের প্রয়োজনের উপর জোর দেওয়ার জন্য +1।
chl
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.