মডেল নির্বাচনের প্যারাডক্স (এআইসি, বিআইসি, ব্যাখ্যা বা ভবিষ্যদ্বাণী করতে?)

গ্যালিট শমুয়েলের "ব্যাখ্যা করতে বা ভবিষ্যদ্বাণী করার জন্য" (২০১০) পড়ে আমি একটি স্পষ্ট দ্বন্দ্ব দেখে আশ্চর্য হয়েছি। তিনটি প্রাঙ্গণ রয়েছে,

এআইসি - বনাম বিআইসি-ভিত্তিক মডেল পছন্দ (পৃষ্ঠা 300 এর শেষ - পি 301 এর শুরু): সহজ কথায় বলতে গেলে, এআইসিকে ভবিষ্যদ্বাণী করার উদ্দেশ্যে তৈরি একটি মডেল বাছাই করার জন্য ব্যবহার করা উচিত এবং বিআইসিকে ব্যাখ্যার জন্য কোনও মডেল নির্বাচনের জন্য ব্যবহার করা উচিত । অতিরিক্তভাবে (উপরের কাগজটিতে নয়), আমরা জানি যে কিছু শর্তে বিআইসি প্রার্থী মডেলগুলির সেটগুলির মধ্যে প্রকৃত মডেলটি নির্বাচন করে ; আসল মডেল হ'ল আমরা ব্যাখ্যামূলক মডেলিংয়ে যা চাইছি (পৃষ্ঠা 293-এর শেষ)।
সরল পাটিগণিত: এআইসি বনাম বিআইসিতে বিভিন্ন জটিলতার জরিমানার কারণে 8 বা ততোধিক আকারের (সন্তোষজনক নমুনাগুলির জন্য বিআইসির চেয়ে বৃহত্তর মডেল নির্বাচন করবে । $\text{ln}(n)>2$
"সত্য" মডেল (অর্থাত সঠিক regressors এবং সঠিক কার্মিক ফর্ম কিন্তু ত্রুটিপূর্ণভাবে আনুমানিক কোফিসিয়েন্টস সঙ্গে মডেল) ভবিষ্যদ্বাণী জন্য শ্রেষ্ঠ মডেল নাও হতে পারে (P 307।): একটি অনুপস্থিত predictor সঙ্গে একটি রিগ্রেশন মডেল একটি ভাল পূর্বাভাস মডেল হতে পারে - অনুমানের পূর্বাভাসককের কারণে পক্ষপাতিত্বের সূচনা অনুমানের অনর্থকতার কারণে বৈকল্পিকতা হ্রাস দ্বারা আকাঙ্ক্ষিত হতে পারে।

পয়েন্ট 1. এবং 2. পরামর্শ দেয় যে বৃহত্তর মডেলগুলি আরও পার্সিমোনিয়াস মডেলের চেয়ে পূর্বাভাসের জন্য ভাল হতে পারে। এদিকে, পয়েন্ট 3 বিপরীত উদাহরণ দেয় যেখানে আরও বেশি পার্সিমোনিয়াস মডেল একটি বৃহত্তর মডেলের চেয়ে পূর্বাভাসের জন্য ভাল। আমি এই বিস্ময়কর খুঁজে।

প্রশ্নাবলী:

Points 1 পয়েন্টের মধ্যে আপাত দ্বন্দ্ব কীভাবে হতে পারে। এবং 2.} এবং 3. ব্যাখ্যা / সমাধান করা হবে?
৩. পয়েন্টের আলোকে, আপনি কী করে এবং কীভাবে এআইসি দ্বারা নির্বাচিত একটি বৃহত্তর মডেল বিআইসি দ্বারা নির্বাচিত আরও পার্সিমোনিয়াস মডেলের চেয়ে পূর্বাভাসের জন্য প্রকৃত পক্ষে ভাল তা ব্যাখ্যা করতে পারেন?

— রিচার্ড হার্ডি
সূত্র

আমি প্যারাডক্স / বৈপরীত্য পাই না। এআইসি দক্ষ (অসম্পূর্ণভাবে প্রত্যাশিত ভবিষ্যদ্বাণী ত্রুটি হ্রাস করে) এবং বিআইসি সামঞ্জস্যপূর্ণ (asympototically সত্য ক্রম নির্বাচন করে)। পয়েন্ট 3) বলে যে পক্ষপাতটি বৈষম্যের দ্বারা আউটাইটাইটেড হতে পারে। একটি নির্দিষ্ট নমুনায় অন্যটির চেয়ে ভাল যে নিশ্চয়ই কোনও গ্যারান্টি নেই। সুতরাং আপনার "প্যারাডক্স" মনে হয় কোনও প্রদত্ত নমুনার জন্য, এআইসি পূর্বাভাসের জন্য সেরা নাও হতে পারে, এতে অবাক হওয়ার কিছু নেই। আপনার কিউ 2 এর জন্য: যদি বিআইসির ছোট মডেল দ্বারা প্রবর্তিত পক্ষপাতটি এআইসির বৃহত্তর পরিবর্তনের চেয়ে বড় হয় তবে এআইসি আরও ভাল।

— হিজਸੇব

আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি নীল জজোর্ট এবং জর্দা ক্লেস্কেনসের "মডেল নির্বাচন ও মডেল গড়" এর প্রথম অধ্যায়গুলি দেখুন, সম্ভবত এটি বিষয়গুলি পরিষ্কার করে দেবে।

— হিজਸੇব

তাদের একই প্রসঙ্গে নেওয়া হবে না; পয়েন্ট 1 এবং 2 এর বিভিন্ন প্রসঙ্গ রয়েছে। এআইসি এবং বিআইসি উভয়ের জন্যই প্রথমে কোন কোন পরামিতিগুলির সংমিশ্রণে সেরা সূচকগুলি পাওয়া যায় তা অনুসন্ধান করে (কিছু লেখক মৃগী বাছাই করে থাকে যখন আমি শব্দটি সূচকটি ব্যবহার করিএই প্রসঙ্গে. সেগুলি উপেক্ষা করুন বা অভিধানটিতে সূচকটি দেখুন) নির্বাচন. এটি হ'ল, যদি এআইসি এবং বিআইসি যদি প্যারামিতির একই সংখ্যার মডেলগুলি নির্বাচন করে তবে দাবি করা হচ্ছে যে বিআইসির তুলনায় এআইসি পূর্বাভাসের চেয়ে ভাল। তবে, বিআইসি যদি কয়েকটি কম পরামিতি মডেল নির্বাচিত (তবে কোনও গ্যারান্টি নেই) সরিয়ে নিয়ে যায় তবে বিপরীতটি ঘটতে পারে। সোবার (২০০২) এ সিদ্ধান্ত নিয়েছে যে এআইসি ভবিষ্যদ্বাণীপূর্ণ নির্ভুলতা পরিমাপ করে বিআইসি ফিটের সচ্ছলতা পরিমাপ করে, যেখানে ভবিষ্যদ্বাণীমূলক নির্ভুলতার অর্থ এক্স এর চূড়ান্ত মান পরিসীমাটির বাইরে Y এর পূর্বাভাস দেওয়া যেতে পারে। বাইরে যখন, প্রায়শই একটি কম অনুকূল এআইসি দুর্বলভাবে ভবিষ্যদ্বাণীপূর্ণ পরামিতিগুলি হ্রাস পেলে তার নির্বাচিত মডেলের আরও পরামিতিগুলির থেকে একটি অনুকূল এআইসি সূচকের চেয়ে এক্সট্রপোলেটেড মানগুলি আরও ভালভাবে অনুমান করা যায়। আমি উত্তীর্ণ করে নোট করছি যে এআইসি এবং এমএল এক্সট্রা পোলেশন ত্রুটি পরীক্ষার প্রয়োজনকে প্রশ্রয় দেয় না, যা মডেলদের জন্য পৃথক পরীক্ষা। এটি "প্রশিক্ষণ" সেট থেকে চূড়ান্ত মানগুলি আটকে রেখে এবং এক্সট্রাপোলেটেড "পোস্ট-ট্রেনিং" মডেল এবং রেকর্ড করা ডেটার মধ্যে ত্রুটি গণনা করে করা যেতে পারে।

$f(x)-y$ অবশিষ্টাংশ (একদিকে আরও নেতিবাচক অবশিষ্টাংশের কথা ভাবেন এবং অন্যদিকে আরও ইতিবাচক অবশিষ্টাংশগুলি) যার ফলে মোট ত্রুটি হ্রাস পায়। সুতরাং এক্ষেত্রে আমরা একটি এক্স মান প্রদত্ত সেরা y মানের জন্য জিজ্ঞাসা করছি, এবং এআইসির জন্য আমরা আরও ঘনিষ্ঠভাবে এক্স এবং y এর মধ্যে সেরা কার্যকরী সম্পর্কের জন্য জিজ্ঞাসা করছি। এর মধ্যে একটি পার্থক্য হ'ল উদাহরণস্বরূপ, বিআইসি, অন্যান্য পরামিতি পছন্দগুলি সমান হওয়ায় মডেল এবং ডেটাগুলির মধ্যে আরও ভাল পারস্পরিক সম্পর্ক সহগ থাকবে এবং প্রদত্ত এক্সট্রোপোলেটেড এক্স-মানটির জন্য ওয়াইভ্যালু ত্রুটি হিসাবে পরিমাপ করা আরও ভাল এক্সট্রোপোলেশন ত্রুটি থাকবে।

পয়েন্ট 3 কোনও শর্তে কখনও কখনও বিবৃতি হয়

$σ$
$β_2$
যখন ভবিষ্যদ্বাণীকারীরা খুব বেশি সংযুক্ত থাকে; এবং
যখন নমুনার আকার ছোট হয় বা বাম-আউট ভেরিয়েবলগুলির পরিসর ছোট হয়।

$^2$ $^2$ $^2$ $^2$

আমি তাৎক্ষণিকভাবে উল্লেখ করতে চাই যে এই বিবৃতিগুলি আশাবাদী। সাধারণত, মডেলগুলি ভুল, এবং প্রায়শই একটি ভাল মডেল এমন একটি আদর্শ প্রয়োগ করে যা এআইসি বা বিআইসির সাথে ব্যবহার করা যায় না, বা তাদের আবেদনের জন্য ভুল অবশিষ্ট অবকাঠামোগত কাঠামো ধরে নেওয়া হয় এবং বিকল্প ব্যবস্থা নেওয়া দরকার। আমার কাজের ক্ষেত্রে, এটি সর্বদা ক্ষেত্রে হয়।

— কার্ল
সূত্র

আমি নিশ্চিত না যে আপনি প্রশ্নের উত্তর দিচ্ছেন। আমি তথ্যের মানদণ্ডের সাধারণ সীমাবদ্ধতা সম্পর্কে সচেতন, তবে আমি এটি সম্পর্কে জিজ্ঞাসা করছি না। তদুপরি, আমি আপনার বক্তব্যটি বুঝতে পারি না যদি এআইসি এবং বিআইসির একই সংখ্যার প্যারামিটার থাকে তবে দাবিটি হ'ল বিআইসির চেয়ে এআইসির পূর্বাভাসের চেয়ে ভাল হবে । যখন বিকল্প মডেলগুলিতে একই সংখ্যার প্যারামিটার থাকে, তখন সম্ভাবনাগুলির তুলনা করতে এআইসি এবং বিআইসি তুলনা ফোটে এবং এআইসি এবং বিআইসি উভয়ই একই বিকল্পটি নির্বাচন করবেন। আপনি কী আরও ভাল মডেল দ্বারা বোঝাতে চেয়েছেন তা এআইসি বা বিআইসির সাথে ব্যবহার করা যায় না এমন একটি আদর্শ প্রয়োগ করবে ?

— রিচার্ড হার্ডি

অবিরত: যতক্ষণ আমাদের সম্ভাবনা এবং স্বাধীনতার ডিগ্রি থাকে, আমরা এআইসি এবং বিআইসি গণনা করতে পারি।

— রিচার্ড হার্ডি

@ রিচার্ড হার্দি সত্য: যতক্ষণ আমাদের সম্ভাবনা এবং স্বাধীনতার ডিগ্রি রয়েছে ততক্ষণ আমরা এআইসি এবং বিআইসি গণনা করতে পারি। তবে, গণনাটি সাব-অনুকূল এবং বিভ্রান্তিমূলক হবে যদি অবশিষ্টাংশগুলি স্টুডেন্ট-টি হয় এবং আমরা ছাত্র-টি এর জন্য এআইসি এবং বিআইসি ব্যবহার করি না। Student's-টি ভিন্ন, সেখানে অবশিষ্টাংশ এর ডিস্ট্রিবিউশন যার জন্য এমএল অপ্রকাশিত হতে পারে, উদাহরণস্বরূপ গামা, বিটা ইত্যাদি জন্য

— কার্ল

সুস্পষ্ট করার জন্য ধন্যবাদ! আমি বিশ্বাস করি উপরের প্রশ্নগুলির একটি উত্তর থাকা উচিত যা বেশ সহজ এবং সাধারণ। আরও সুনির্দিষ্টভাবে, আমি মনে করি না যে এটিতে "কুশ্রী" মামলা এবং এআইসি এবং বিআইসির ব্যর্থতা জড়িত হওয়া দরকার। বিপরীতে, আমি অনুভব করি যে এখানে একটি বরং মৌলিক কেস থাকতে হবে যা চিত্রিত করতে পারে যে কেন প্যারাডক্সটি বাস্তবের চেয়ে কেবল স্পষ্ট। একই সময়ে, আপনার দ্বিতীয় অনুচ্ছেদটি বিপরীত দিকে যেতে বলে মনে হচ্ছে। এটি নিজের পক্ষে মূল্যবান হবে না এমন নয়, তবে আমি আশঙ্কা করছি যে এটি আমাদের এখানে আসল অন্তর্নিহিত প্রশ্নগুলি থেকে বিভ্রান্ত করতে পারে।

— রিচার্ড হার্ডি

@ রিচার্ড হার্ডি প্রায়শই ব্যবহারিক প্রশ্নটি এআইসির কাছে জটিল। উদাহরণস্বরূপ, ভিন্ন ভিন্ন মানদণ্ড এবং / অথবা ডেটা ট্রান্সফর্মেশন বা জটিল নিয়মের বিশ্লেষণের সাথে একই বা বিভিন্ন মডেলের তুলনা, উদাহরণস্বরূপ, একটি উত্পন্ন পরামিতি, সাধারণ বিপরীতগুলি ইত্যাদি নিয়ন্ত্রণ করে তিখোনভকে হ্রাস করার ক্ষেত্রে এটি উল্লেখ করার দরকার নেই যাতে কেউ এআইসি ব্যবহার না করে be , বিআইসি ভুলভাবে।

— কার্ল