অপরটির চেয়ে এআইসি বা বিআইসি পছন্দ করার কোনও কারণ আছে কি?


222

আনুমানিক পরামিতিগুলির সংখ্যার জন্য দন্ডিত মডেল ফিট করার জন্য এআইসি এবং বিআইসি উভয় পদ্ধতি। আমি যেমন এটি বুঝতে পারি, বিআইসি এআইসির চেয়ে ফ্রি প্যারামিটারের জন্য আরও বেশি মডেলগুলিকে শাস্তি দেয়। মানদণ্ডের দৃin়তার উপর ভিত্তি করে একটি অগ্রাধিকারের বাইরে, বিআইসির তুলনায় এআইসিকে পছন্দ করার অন্য কোনও কারণ বা তদ্বিপরীত কি আছে?


1
আমি মনে করি এই আলোচনাকে "বৈশিষ্ট্য" নির্বাচন বা "কোভারিয়েট" নির্বাচন হিসাবে বলা আরও উপযুক্ত। আমার কাছে, মডেল নির্বাচন ত্রুটিগুলির বিতরণ, লিঙ্ক ফাংশনের ফর্ম এবং কোভেরিয়েটগুলির ফর্মের বিবরণ সম্পর্কিত অনেক বিস্তৃত। যখন আমরা এআইসি / বিআইসির বিষয়ে কথা বলি, আমরা সাধারণত এমন পরিস্থিতিতে থাকি যেখানে মডেল বিল্ডিংয়ের সমস্ত দিকগুলি সংশোধন করা হয়, কোভেরিয়েট নির্বাচন বাদে।

6
কোনও মডেলকে অন্তর্ভুক্ত করার জন্য নির্দিষ্ট কোভেরিয়েটগুলি সিদ্ধান্ত নেওয়া সাধারণত শব্দটি মডেল নির্বাচনের দ্বারা যায় এবং শিরোনামে মডেল নির্বাচনের সাথে প্রচুর বই রয়েছে যা মূলত সিদ্ধান্ত নিচ্ছে মডেলটিতে কোন মডেলকে কোভারিয়েট / প্যারামিটার অন্তর্ভুক্ত করা উচিত।
মাইকেল চেরনিক

আপনার প্রশ্নটি ফিলোজিনি (বায়োইনফরম্যাটিকস) এর ক্ষেত্রে বিশেষভাবে প্রযোজ্য কিনা তা আমি জানি না, তবে যদি হয় তবে এই গবেষণাটি এই দিকটি সম্পর্কে কিছু ধারণা সরবরাহ করতে পারে: ncbi.nlm.nih.gov/pmc/articles/PMC2925852
tlorin

মার্জ করা প্রশ্নটি কেআইসি সম্পর্কেও জিজ্ঞাসা করে, দয়া করে প্রশ্নের পাঠ্য আপডেট করুন এবং লিঙ্কের সাথে প্রিফিকেস কেইসি-র একটি সংজ্ঞা দিন।
স্মি

1
@smci আমি আগ্রহী হলে কেআইসির সাথে সম্পর্কিত প্রশ্নগুলি লোকদের খনন করতে অনুমতি দেওয়ার জন্য আমি stats.stackexchange.com/questions/383923/… যুক্ত করেছি ।
রাসেলপিয়ার্স

উত্তর:


179

আপনার প্রশ্নের ইঙ্গিত দেয় যে এআইসি এবং বিআইসি একই প্রশ্নের উত্তর দেওয়ার চেষ্টা করে, যা সত্য নয়। এআইসি সেই মডেলটি নির্বাচন করার চেষ্টা করে যা একটি অজানা, উচ্চ মাত্রিক বাস্তবতাকে যথাযথভাবে বর্ণনা করে। এর অর্থ হ'ল বাস্তবতা কখনই প্রার্থী মডেলগুলির সেটে নেই যা বিবেচনা করা হচ্ছে। বিপরীতে, বিআইসি পরীক্ষার্থীদের সেটগুলির মধ্যে সত্য মডেলটি সন্ধান করার চেষ্টা করে। গবেষকরা সেই পথে যে মডেলগুলি তৈরি করেছিলেন তার মধ্যে একটিতে বাস্তবতা তাত্পর্যপূর্ণ হয় বলে আমি মনে করি এটি বেশ অদ্ভুত ধারণা। এটি বিআইসির পক্ষে বাস্তব সমস্যা।

তবুও, অনেক গবেষক রয়েছেন যারা বিআইসি এআইসির চেয়ে ভাল, যুক্তি হিসাবে মডেল পুনরুদ্ধারের সিমুলেশনগুলি ব্যবহার করে। এই সিমুলেশনগুলিতে A এবং B মডেলগুলি থেকে ডেটা উত্পন্ন করা এবং তারপরে দুটি মডেলের সাথে উভয় ডেটাসেটের ফিট করা। ওভারফিটিং ঘটে যখন ভুল মডেল উত্পাদনের চেয়ে ডেটা ফিট করে। এই সিমুলেশনগুলির মূল বিষয়টি হ'ল এআইসি এবং বিআইসি এই ওভারফিটগুলি কতটা সংশোধন করে। সাধারণত, ফলাফলগুলি এই সত্যটি নির্দেশ করে যে এআইসি খুব উদার এবং এখনও প্রায়শই একটি সহজ, সত্য মডেলের চেয়ে আরও জটিল, ভুল মডেল পছন্দ করে। প্রথম নজরে এই সিমুলেশনগুলি সত্যই ভাল যুক্তিযুক্ত বলে মনে হয়, তবে তাদের সাথে সমস্যা হ'ল এআইসির পক্ষে এগুলি অর্থহীন। আমি আগেই বলেছি, এআইসি বিবেচ্য নয় যে পরীক্ষার্থী মডেলগুলির কোনও পরীক্ষাই আসলে সত্য। এআইসির মতে, সমস্ত মডেল বাস্তবের সান্নিধ্য, এবং বাস্তবতার কখনও কম মাত্রা হওয়া উচিত নয়। প্রার্থীদের কয়েকটি মডেলের তুলনায় কমপক্ষে কম।

আমার সুপারিশটি হ'ল এআইসি এবং বিআইসি উভয়ই ব্যবহার করা। বেশিরভাগ সময় তারা পছন্দসই মডেলটিতে সম্মতি জানায়, যখন তারা না করে, কেবল এটি রিপোর্ট করুন।

আপনি যদি এআইসি এবং বিআইসি উভয়কেই অসন্তুষ্ট হন এবং বিনিয়োগের জন্য অল্প সময় পান, তবে ন্যূনতম বিবরণ দৈর্ঘ্য (এমডিএল) দেখুন, এটি সম্পূর্ণ আলাদা পদ্ধতি যা এআইসি এবং বিআইসির সীমাবদ্ধতাগুলি অতিক্রম করে। এমডিএল থেকে উদ্ভূত বিভিন্ন পদক্ষেপ রয়েছে, যেমন নরমালাইজড সর্বাধিক সম্ভাবনা বা ফিশার ইনফরমেশন আনুমানিকের মতো। এমডিএল সমস্যাটি হ'ল এর গাণিতিকভাবে দাবি করা এবং / অথবা কম্পিউটেশনালি নিবিড়।

তবুও, আপনি যদি সহজ সমাধানগুলিতে আটকে থাকতে চান, মডেল নমনীয়তার মূল্যায়ন করার জন্য একটি দুর্দান্ত উপায় (বিশেষত যখন প্যারামিটারের সংখ্যা সমান হয়, এআইসি এবং বিআইসির অকেজো উপস্থাপন করা হয়) প্যারামেট্রিক বুটস্ট্র্যাপ করছে যা কার্যকর করা সহজ। এটিতে একটি কাগজের লিঙ্ক এখানে

কিছু লোক এখানে ক্রস-বৈধতা ব্যবহারের পক্ষে পরামর্শ দেয়। আমি ব্যক্তিগতভাবে এটি ব্যবহার করেছি এবং এর বিপরীতে কিছুই নেই, তবে এটির সাথে সমস্যাটি হ'ল নমুনা কাটার নিয়মের মধ্যে পছন্দ (ছুটি-ওয়ান-আউট, কে-ফোল্ড, ইত্যাদি) একটি অ-নীতিবিরোধী।


7
পার্থক্যটিকে গাণিতিক দিক থেকে নিখুঁতভাবে দেখা যেতে পারে - বিআইসিকে লগ পি (ডেটা) এর একটি অ্যাসিম্পটোটিক সম্প্রসারণ হিসাবে উদ্ভূত হয়েছিল যেখানে প্রকৃত মডেল প্যারামিটারগুলি নির্বিচারে কোথাও অদৃশ্য হওয়ার আগে নমুনা দেওয়া হয়, এআইসি একইভাবে সঠিক প্যারামিটারগুলি স্থির করে রাখা হয়েছিল
ইয়ারোস্লাভ বুলাটোভ

4
আপনি বলেছিলেন যে "এমন অনেক গবেষক আছেন যারা বলেছিলেন যে আইআইসির চেয়ে বিআইসির চেয়ে ভাল, এটি যুক্তি হিসাবে মডেল রিকভারি সিমুলেশনগুলি ব্যবহার করে These এই সিমুলেশনগুলিতে A এবং B মডেলগুলি থেকে ডেটা উত্পন্ন করা এবং তারপরে দুটি মডেলের সাথে উভয় ডেটাসেটের সমন্বয় করা।" আপনি কিছু রেফারেন্স উল্লেখ হিসাবে এত দয়াবান হতে হবে? আমি তাদের সম্পর্কে কৌতূহলী! :)
Deps_stats

2
আমি এই পোস্টে বিবৃতি বিশ্বাস করি না।
ব্যবহারকারী 9352

16
(-1) দুর্দান্ত ব্যাখ্যা, তবে আমি একটি দাবি চ্যালেঞ্জ করতে চাই। @ ডেভ কেলেন আপনি কি দয়া করে একটি রেফারেন্স দিতে পারেন যেখানে সত্য যে মডেলটি বিআইসির জন্য সেটটিতে থাকতে হবে? আমি এটি নিয়ে তদন্ত করতে চাই, যেহেতু এই বইটিতে লেখকরা দৃ conv়প্রত্যয়ী প্রমাণ দিয়েছেন যে এটি কেস নয়।
gui11aume

2
দুর্দান্ত উত্তর কিন্তু আমি "বাস্তবতার কখনও কম মাত্রা থাকতে হবে না" এই উক্তিটির সাথে দৃ strongly়ভাবে একমত নই। আপনি কি "বিজ্ঞান" এর উপর নির্ভর করে আপনি ইওরু মডেলগুলিতে কী প্রয়োগ করছেন
ডেভিড

76

যদিও এআইসি এবং বিআইসি উভয়ই সর্বাধিক সম্ভাবনার প্রাক্কলন বহন করে এবং অতিমাত্রায় লড়াইয়ের চেষ্টায় ফ্রি প্যারামিটারগুলিকে দণ্ডিত করে, তারা এমন উপায়ে এটি করে যাতে উল্লেখযোগ্যভাবে ভিন্ন আচরণের ফলাফল হয়। পদ্ধতিগুলির একটি সাধারণত উপস্থাপিত সংস্করণটি দেখে নেওয়া যাক (ফলাফলগুলি সাধারণত বিতরণ করা ত্রুটিগুলি এবং অন্যান্য ভাল আচরণ অনুমানগুলি স্থির করে):

  • এআইসি = -2 * এলএন (সম্ভাবনা) + 2 * কে,

এবং

  • বিআইসি = -2 * এলএন (সম্ভাবনা) + এলএন (এন) * কে,

কোথায়:

  • k = স্বাধীনতার মডেল ডিগ্রি
  • এন = পর্যবেক্ষণ সংখ্যা

গ্রুপের তুলনায় সেরা মডেল হ'ল উভয় ক্ষেত্রেই এই স্কোরগুলি হ্রাস করে। স্পষ্টতই, এআইসি সরাসরি নমুনা আকারের উপর নির্ভর করে না। তদুপরি, সাধারণত বললে, এআইসি বিপদটি উপস্থাপন করতে পারে যে এটি তার চেয়ে বেশি উপযুক্ত হতে পারে, অন্যদিকে বিআইসির দ্বারা মুক্ত প্যারামিটারগুলিকে কীভাবে দন্ডিত করা হয় তার পক্ষে এই ঝুঁকিটি উপস্থাপন করা যায় A (এআইসিতে 2 * কে; বিআইসিতে এনএল (এন) * কে)। তাত্পর্যপূর্ণভাবে, ডেটা প্রবর্তন করার সাথে সাথে স্কোরগুলি পুনরায় গণনা করা হয়, তুলনামূলকভাবে কম এন (7 এবং কম) এ বিআইসি এআইসির তুলনায় নিখরচায় প্যারামিটারগুলিতে বেশি সহনশীল তবে উচ্চতর এন-তে কম সহিষ্ণু হয় (এন এর প্রাকৃতিক লগ 2 কে কাটিয়ে ওঠে)।

অতিরিক্তভাবে, এআইসি অজানা ডেটা উত্পন্ন প্রক্রিয়াটির (প্রত্যাশিত আনুমানিক কেএল ডাইভারজেন হ্রাস করার মাধ্যমে ) সেরা আনুমানিক মডেল সন্ধানের লক্ষ্য । যেমনটি, এটি সম্ভাব্যতার সত্যিকারের মডেলটিতে রূপান্তর করতে ব্যর্থ হয়েছে (ধরে নেওয়া হয় যে এই দলটির মধ্যে একজন উপস্থিত রয়েছে যাঁরা মূল্যায়ন করেছেন), অন্যদিকে বিআইসি রূপান্তরিত করে যেমন এন অসীমের দিকে ঝোঁক।

সুতরাং, অনেক পদ্ধতিগত প্রশ্নের মতো, কোনটি পছন্দ করা উচিত তার উপর নির্ভর করে আপনি কী করার চেষ্টা করছেন, অন্যান্য কী কী পদ্ধতি উপলব্ধ রয়েছে এবং কোনও বৈশিষ্ট্য বর্ণিত হয়েছে কিনা তা (কনভার্জেশন, ফ্রি প্যারামিটারগুলির জন্য আপেক্ষিক সহনশীলতা, প্রত্যাশিত কেএল ডাইভারজেন্সকে হ্রাস করে) ), আপনার লক্ষ্যে কথা বলুন।


8
চমৎকার উত্তর. এআইসি এবং বিআইসির সম্ভাব্য বিকল্প গ্রহণটি হ'ল এআইসি বলে যে নমুনার আকার বৃদ্ধি পাওয়ায় "বা উদ্দীপনাজনিত প্রভাবগুলি মডেলটিতে enterুকলে আমাদের পাত্তা দেয় না)" তীব্র প্রভাবগুলি "সনাক্ত করা সহজ হয় না, বিআইসি বলে যে তারা তা করে। ওয়ালএসের দৃষ্টিকোণ থেকে রাফটারির 1994-এর কাগজে যেমন দেখতে পাওয়া যায়, প্রভাবটি এটি-তে প্রায় "তাত্পর্যপূর্ণ" (অর্থাত্ বৃহত্তর মডেল পছন্দসই) হয়ে যায় যদি এর টি-পরিসংখ্যান than চেয়ে বেশি হয় , বিআইসি যদি এর টি-স্ট্যাটিস্টিক হয় চেয়ে বড় | t| >|t|>2|t|>log(n)
সম্ভাব্যতা

2
ভাল উত্তর, +1। আমি বিশেষত মূল্যবান গ্রুপে প্রকৃত মডেল উপস্থিত কিনা তা সম্পর্কে সতর্কতামূলক পছন্দ করি। আমি যুক্তি দিয়ে বলব যে "সত্যিকারের মডেল" কখনও উপস্থিত হয় না । (বাক্স অ্যান্ড ড্রাগার বলেছিলেন যে "সমস্ত মডেল মিথ্যা, তবে কিছু দরকারী)" এবং বার্নহ্যাম অ্যান্ডারসন এটিকে "টেপারিং এফেক্ট মাপ" বলে call আমরা বাস্তবে যে মডেলগুলি দেখি তার মধ্যে সেরা সান্নিধ্যে।
স্টিফান কোলাছা

68

আমার দ্রুত ব্যাখ্যা

  • এআইসির পূর্বাভাস দেওয়ার জন্য এটি সর্বোত্তম কারণ এটি অসম্পূর্ণভাবে ক্রস-বৈধতার সমতুল্য।
  • বিআইসি ব্যাখ্যার পক্ষে সেরা কারণ এটি অন্তর্নিহিত ডেটা উত্পাদন প্রক্রিয়াটির ধারাবাহিক অনুমানের অনুমতি দেয়।

এআইসি কে-ভাঁজ ক্রস-বৈধকরণের সমতুল্য, বিআইসির সমান সমান লভ-ওয়ান-আউট ক্রস-বৈধকরণ। তবুও, উভয় উপপাদ্য কেবল লিনিয়ার রিগ্রেশন ক্ষেত্রেই ধারণ করে।

5
এমবিকিউ, এটি এআইসি / এলও (এল কেও বা কে-ভাঁজ নয়) এবং আমি মনে করি না পাথর 1977 এর প্রমাণটি লিনিয়ার মডেলগুলির উপর নির্ভর করেছিল। আমি বিআইসির ফলাফলের বিবরণ জানি না।
Ars

11
আরস সঠিক। এটি এআইসি = এলও এবং বিআইসি = কে-ভাঁজ যেখানে কে নমুনা আকারের একটি জটিল কাজ function
রব হ্যান্ডম্যান

অভিনন্দন, আপনি আমাকে পেয়েছেন; আমি তাড়াহুড়া করে তা লিখছিলাম এবং তাই আমি এই ত্রুটিটি করেছি, স্পষ্টতই রব এটি লিখেছিল wrote নেভারথেলস এটি শাও 1995 সালের, যেখানে একটি ধারণা ছিল যে মডেলটি লিনিয়ার। আমি স্টোনকে বিশ্লেষণ করব, তবুও আমি মনে করি আপনি, আরস, আমার ক্ষেত্রের এলইউও বিভিন্ন * আইসি হিসাবে সমান খারাপ খ্যাতি অর্জন করায় হতে পারে।

উইকিপিডিয়ায় বর্ণিত বিবরণ ( en.wikedia.org/wiki/… ) এটিকে মনে করে যে কে-ফোল্ড ক্রস-বৈধকরণটি পরামিতিগুলির স্থায়িত্ব অনুমান করার জন্য পুনরাবৃত্ত সিমুলেশনের মতো। আমি দেখতে পাচ্ছি যে এলআইওর সাথে এআইসি কেন স্থিতিশীল হবে বলে আশা করা যায় (যেহেতু এলইওটি নিছকভাবে নিখরচায় সঞ্চালিত হতে পারে), তবে কে বুঝতে পারে না কেন কেও ভাঁজ দিয়ে বিআইসি স্থিতিশীল থাকবে যদি না কেও বিচ্ছিন্ন থাকে। কে-এর মান অন্তর্নিহিত জটিল সূত্র কী এটিকে বিস্মৃত করে তোলে? নাকি অন্য কিছু হচ্ছে?
রাসেলপিয়ের্স

16

আমার অভিজ্ঞতায়, বিআইসির ফলাফল গুরুতর আন্ডারফিটিং এবং এআইসি সাধারণত ভাল পারফরম্যান্স করে, যখন লক্ষ্যটি হয় ভবিষ্যদ্বাণীমূলক বৈষম্যকে সর্বাধিক করে তোলা।


1
অতি বিলম্বিত, তবে যেহেতু এটি এখনও গুগলে উচ্চ র‌্যাঙ্কিং করছে আপনি কোন অঞ্চলে কাজ করছেন তা বিশদভাবে জানাতে আপনার কি আপত্তি আছে? আমি কেবল কৌতূহলী, যদি আমাদের ডোমেনের কিছু প্রভাব থাকে তবে এটি আমাদের উচিত।
খুববাদাথিস

@ প্রতিবাদতি: ক্লিনিকাল বায়োস্টাটিক্স (স্রেফ গুগল "ফ্র্যাঙ্ক হ্যারেল", তার একটি ওয়েব উপস্থিতি রয়েছে)
বেন বলকার

13

ব্রায়ান রিপলির এআইসি এবং বিআইসির একটি তথ্যবহুল এবং অ্যাক্সেসযোগ্য "ডেরাইভেশন" এখানে পাওয়া যাবে: http://www.stats.ox.ac.uk/~ripley/Nelder80.pdf

রিপলি গাণিতিক ফলাফলের পিছনে অনুমান সম্পর্কে কিছু মন্তব্য সরবরাহ করে। অন্যান্য উত্তরগুলির মধ্যে কিছু ইঙ্গিত করে তার বিপরীতে, রিপলি জোর দিয়েছিলেন যে মডেলটি সত্য তা ধরে নিয়েই এআইসি ভিত্তিক। যদি মডেলটি সত্য না হয় তবে একটি সাধারণ গণনা প্রকাশ করে যে "প্যারামিটারের সংখ্যা" আরও জটিল পরিমাণে প্রতিস্থাপন করতে হবে। রিপ্লেস স্লাইডগুলিতে কিছু রেফারেন্স দেওয়া আছে। তবে নোট করুন, লিনিয়ার রিগ্রেশন (একটি পরিচিত বৈকল্পের সাথে কঠোরভাবে কথা বলার জন্য), সাধারণভাবে, আরও জটিল পরিমাণ প্যারামিটারের সংখ্যার সমান হতে সহজ করে তোলে।


3
(+1) যাইহোক, রিপ্লে সেই বিন্দুতে ভুল যেখানে তিনি বলেছেন যে মডেলগুলি বাসা বাঁধতে হবে। কুলব্যাক-লেবেলর ডাইভারজেন্সের প্রাক্কলনকারী হিসাবে এআইসিকে ব্যবহার করে ডাইরিভিশনটিতে আকায়েকের মূল ডেরিভেশন বা স্পষ্ট করে বলার ক্ষেত্রে এ জাতীয় কোনও বাধা নেই। প্রকৃতপক্ষে, আমি যে কাগজে কাজ করছি তাতে আমি কিছুটা "অভিজ্ঞতায়" দেখাই যে এআইসি এমনকি কোভারিয়েন্স স্ট্রাকচারের মডেল নির্বাচনের জন্যও ব্যবহার করা যেতে পারে (বিভিন্ন সংখ্যক প্যারামিটার, পরিষ্কারভাবে অ-নেস্টেড মডেল)। টাইম-সিরিজের হাজার হাজার সিমুলেশন যেগুলি আমি বিভিন্ন covariance কাঠামো নিয়ে দৌড়েছি, সেগুলির কোনওটিতেই এআইসি ভুল হয় না ...
নেস্টর

... যদি "সঠিক" মডেলটি প্রকৃতপক্ষে মডেলগুলির সেটে থাকে (এটি তবে এটিও বোঝায় যে আমি যে মডেলগুলিতে কাজ করছি তার জন্য অনুমানকারীটির বৈকল্পিকতা খুব কম ... তবে এটি কেবল প্রযুক্তিগত বিস্তারিত)।
নস্টোর

1
@ নস্টার, আমি সম্মত মডেলদের বাসা বেঁধে রাখা সম্পর্কে বিষয়টি আশ্চর্যজনক।
এনআরএইচ

3
দ্রাঘিমাংশীয় তথ্য (মিশ্র প্রভাবগুলির মডেল বা জেনারেলাইজড ন্যূনতম স্কোয়ারস) এর জন্য কোভারিয়েন্স স্ট্রাকচারগুলি নির্বাচন করার সময় 3 টিরও বেশি প্রার্থী কাঠামো থাকলে এআইসি সহজেই ভুল কাঠামোটি খুঁজে পেতে পারেন। যদি 3 টিরও বেশি থাকে তবে আপনাকে কাঠামোটি নির্বাচন করতে AIC ব্যবহারের ফলে তৈরি মডেল অনিশ্চয়তার জন্য সামঞ্জস্য করতে আপনাকে বুটস্ট্র্যাপ বা অন্যান্য উপায় ব্যবহার করতে হবে।
ফ্র্যাঙ্ক হ্যারেল

8

প্রকৃতপক্ষে একমাত্র পার্থক্য হ'ল বিআইসি এআইসি বর্ধিত হয় যাতে সংখ্যার অবজেক্ট (নমুনা) বিবেচনায় নেওয়া হয়। আমি বলব যে উভয়ই বেশ দুর্বল থাকাকালীন (ক্রস-বৈধকরণের তুলনায়) এআইসি ব্যবহার করা ভাল, এর চেয়ে বেশি লোক সংক্ষিপ্তসারটির সাথে পরিচিত হবে - সত্যিকার অর্থে আমি কোনও কাগজ বা এমন কোনও প্রোগ্রাম দেখিনি যেখানে বিআইসি হবে ব্যবহার করা হবে (তবুও আমি স্বীকার করি যে আমি এমন সমস্যার প্রতি পক্ষপাতিত্ব করছি যেখানে এই জাতীয় মানদণ্ডগুলি কেবল কার্যকরভাবে কাজ করে না)।

সম্পাদনা করুন: এআইসি এবং বিআইসি ক্রস-বৈধতার সমতুল্য প্রদত্ত দুটি গুরুত্বপূর্ণ অনুমান - যখন সেগুলি সংজ্ঞায়িত করা হয়, সুতরাং যখন মডেলটি সর্বাধিক সম্ভাবনা এক হয় এবং যখন আপনি কেবল প্রশিক্ষণের ডেটাতে মডেল সম্পাদনা করতে আগ্রহী হন। কিছু তথ্যকে একরকম usকমত্যে ভেঙে ফেলার ক্ষেত্রে তারা পুরোপুরি ঠিক আছে।
কিছু বাস্তব-বিশ্বের সমস্যার জন্য ভবিষ্যদ্বাণীকারী মেশিন তৈরির ক্ষেত্রে প্রথমটি মিথ্যা, কারণ আপনার প্রশিক্ষণ সেটটি আপনি যে সমস্যার সাথে মোকাবিলা করছেন সে সম্পর্কে কেবলমাত্র একটি স্ক্র্যাপের প্রতিনিধিত্ব করে, তাই আপনি কেবল নিজের মডেলটিকেই অনুকূল করতে পারবেন না; দ্বিতীয়টি মিথ্যা, কারণ আপনি আশা করেন যে আপনার মডেলটি এমন নতুন ডেটা পরিচালনা করবে যার জন্য আপনি প্রশিক্ষণ সেটটি প্রতিনিধি হওয়ারও আশা করতে পারেন না। এবং এই প্রান্তে সিভি উদ্ভাবিত হয়েছিল; যখন কোনও স্বাধীন ডেটার মুখোমুখি হয় তখন মডেলের আচরণ অনুকরণ করতে। মডেল নির্বাচনের ক্ষেত্রে, সিভি আপনাকে কেবল গুণমানের আনুমানিক নয়, গুণগতমানের আনুমানিক বিতরণও দেয়, সুতরাং এটির এই দুর্দান্ত সুবিধা রয়েছে যে এটি বলতে পারে "আমি জানি না, নতুন তথ্য যা আসবে তা উভয়েরই হতে পারে উত্তম."


এর অর্থ কি এই যে নির্দিষ্ট নমুনা আকারের জন্য বিআইসির তুলনায় এআইসির চেয়ে কম কড়া হতে পারে?
রাসেলপিয়ের্স

1
কঠোরতা এখানে সেরা শব্দ নয়, পরামিতিগুলির জন্য আরও সহনশীল; স্থির, হ্যাঁ, সাধারণ সংজ্ঞাগুলির জন্য (প্রাকৃতিক লগ সহ) এটি 7 এবং কম বস্তুর জন্য ঘটে।

এআইসি অসমায়িতভাবে ক্রস-বৈধতার সমতুল্য।
রব হ্যান্ডম্যান

5
@ এমবিকিউ - ক্রস বৈধতা কীভাবে "আন-রিপ্রেজেনটেটিভিটি" সমস্যাটি কাটিয়ে উঠছে তা আমি দেখতে পাচ্ছি না। যদি আপনার প্রশিক্ষণ ডেটা ভবিষ্যতে যে ডেটা প্রাপ্ত হবে তার প্রতিনিধি না হলে আপনি যা চান তার সবগুলিই আপনাকে বৈধতা দিতে পারে তবে আপনি যে "জেনারালাইজেশন ত্রুটি" এর মুখোমুখি হবেন তা উপস্থাপন করা হবে না (যেমন " সত্য "নতুন তথ্য প্রশিক্ষণ ডেটার মডেলবিহীন অংশ দ্বারা উপস্থাপন করা হয় না"। আপনি যদি ভাল পূর্বাভাস দিতে চান তবে একটি প্রতিনিধি ডেটা সেট করা জরুরী।
সম্ভাব্যতা

1
@ এমবিকিউ - আমার বক্তব্যটি হ'ল আপনি বিকল্পের উপর ভিত্তি করে আইসি ভিত্তিক নির্বাচন "আলতো করে" প্রত্যাখ্যান করেছেন বলে মনে হচ্ছে যা সমস্যার সমাধান করে না। ক্রস-বৈধকরণ ভাল (যদিও এটির মূল্যবানতা রয়েছে?), তবে প্রতিনিধিত্বমূলক ডেটা ডেটা চালিত প্রক্রিয়া ব্যবহার করে মোকাবেলা করা যায় না। কমপক্ষে নির্ভরযোগ্যভাবে না। আপনার কাছে পূর্বের তথ্য থাকতে হবে যা আপনাকে জানায় যে এটি কীভাবে প্রতিনিধি (বা আরও সাধারণভাবে, "প্রতিনিধি" ডেটা প্রকৃত ভবিষ্যতের ডেটার সাথে কোন যৌক্তিক সংযোগ রাখে) observe
সম্ভাব্যতা ব্লগ

5

যেমনটি আপনি উল্লেখ করেছেন, এআইসি এবং বিআইসি হল আরও রেজিস্ট্রার ভেরিয়েবল থাকার জন্য মডেলগুলিকে শাস্তি দেওয়ার পদ্ধতি। এই পদ্ধতিগুলিতে একটি পেনাল্টি ফাংশন ব্যবহৃত হয়, যা মডেলের পরামিতিগুলির সংখ্যার ফাংশন।

  • এআইসি প্রয়োগ করার সময়, জরিমানা ফাংশনটি z (p) = 2 পি হয়

  • বিআইসি প্রয়োগ করার সময়, জরিমানা ফাংশনটি z (p) = p ln ( n ) হয়, যা পূর্বের তথ্য থেকে প্রাপ্ত শাস্তিটি ব্যাখ্যা করার উপর ভিত্তি করে (অতএব নাম বেয়েসিয়ান তথ্য মানদণ্ড)।

যখন এন বড় হবে তখন দুটি মডেল বেশ আলাদা ফলাফল অর্জন করবে। তারপরে বিআইসি জটিল মডেলগুলির জন্য আরও বৃহত্তর জরিমানা প্রয়োগ করে এবং তাই এআইসির চেয়ে সহজ মডেলগুলিতে নিয়ে যায়। তবে বিআইসির উইকিপিডিয়ায় যেমন বলেছেন :

এটি লক্ষ করা উচিত যে অনেক অ্যাপ্লিকেশনগুলিতে ..., বিআইসি সহজেই সর্বাধিক সম্ভাবনা নির্বাচনকে হ্রাস করে কারণ পরামিতিগুলির সংখ্যা আগ্রহের মডেলগুলির জন্য সমান।


4
নোট করুন যে যখন ডাইমেনশনটি পরিবর্তন হয় না তখন এআইসিও এমএল এর সমান হয়। আপনার উত্তর দেখে মনে হচ্ছে এটি কেবল বিআইসির পক্ষে।
সম্ভাব্যতা ব্লগ

5

আমি যা বলতে পারি তা থেকে, এআইসি এবং বিআইসির মধ্যে খুব বেশি পার্থক্য নেই। মডেলগুলির দক্ষতার সাথে তুলনা করার জন্য এগুলি উভয়ই গণিতের সুবিধামতো অনুমিত make যদি তারা আপনাকে আলাদা আলাদা "সেরা" মডেল দেয় তবে এর অর্থ সম্ভবত আপনার উচ্চ মডেলের অনিশ্চয়তা রয়েছে, যা আপনাকে এআইসি বা বিআইসি ব্যবহার করা উচিত কিনা তা নিয়ে চিন্তিত হওয়া আরও গুরুত্বপূর্ণ। আমি ব্যক্তিগতভাবে বিআইসিকে আরও ভাল পছন্দ করি কারণ এতে কোনও মডেলের আরও বেশি (কম) তথ্য থাকে তার পরামিতিগুলির সাথে ফিট করার জন্য আরও বেশি (কম) ডেটা থাকে - যেমন শিক্ষকের মতো শিক্ষার্থীর উচ্চতর (নিম্ন) মানের পারফরম্যান্সের জন্য জিজ্ঞাসা করা হয় যদি তাদের শিক্ষার্থীর বেশি (কম) থাকে ) বিষয় সম্পর্কে জানতে সময়। আমার কাছে এটি কেবল করণীয় স্বজ্ঞাত জিনিস বলে মনে হচ্ছে। তবে আমি নিশ্চিত যে এআইসির পক্ষেও এর সরল রূপটি হিসাবে সমান স্বজ্ঞাত এবং বাধ্যতামূলক যুক্তি রয়েছে।

এখন যে কোনও সময় আপনি একটি আনুমানিকতা তৈরি করেন, অবশ্যই এই শর্তগুলি আবশ্যকতার সাথে কিছু শর্ত থাকবে। এটি অবশ্যই এআইসির জন্য দেখা যেতে পারে, যেখানে নির্দিষ্ট শর্তগুলির জন্য অ্যাকাউন্টের জন্য অনেকগুলি "অ্যাডজাস্টমেন্ট" (এআইসিসি) উপস্থিত রয়েছে যা মূল আনুমানিকটি খারাপ করে। এটি বিআইসির জন্যও উপস্থিত, কারণ বিভিন্ন অন্যান্য আরও সঠিক (তবে এখনও দক্ষ) পদ্ধতি বিদ্যমান যেমন জেলনারের জি-প্রিয়ার্সের মিশ্রণের ফুলি ল্যাপ্লেস অ্যাটিক্সিমেশনস (বিআইসিসি ইন্টিগ্রালের জন্য ল্যাপ্লেস আনুমানিক পদ্ধতির একটি অনুমান)।

আপনি যে কোনও মডেলটির মধ্যে প্যারামিটারগুলি সম্পর্কে যথেষ্ট পূর্ববর্তী তথ্য পেয়ে থাকেন সে জায়গাগুলিতে তারা উভয়ই কৃপণ হয়। এআইসি এবং বিআইসি অযৌক্তিকভাবে এমন মডেলগুলিকে শাস্তি দেয় যেখানে পরামিতিগুলি এমন মডেলের তুলনায় আংশিকভাবে পরিচিত যেখানে ডেটাগুলি থেকে অনুমানের প্রয়োজন হয়।

P(D|M,A)P(M|D,A)MMA

Mi:the ith model is the best description of the dataA:out of the set of K models being considered, one of them is the best

এবং তারপরে একই সম্ভাব্যতা মডেলগুলি (একই প্যারামিটারগুলি, একই ডেটা, একই আনুমানিকতা ইত্যাদি) নির্ধারণ করা চালিয়ে যাও, আমি বিআইসি মানগুলির একই সেট পাব। যৌক্তিক অক্ষর "এম" এর সাথে একরকম অনন্য অর্থ সংযুক্তি করলেই "সত্যিকারের মডেল" ("সত্য ধর্মের প্রতিধ্বনি)" সম্পর্কে অপ্রাসঙ্গিক প্রশ্নে আকৃষ্ট হয়। এমকে "সংজ্ঞায়িত" একমাত্র জিনিস হ'ল গাণিতিক সমীকরণ যা এটি তাদের গণনায় ব্যবহার করে - এবং এটি একটি এবং কেবলমাত্র একটি সংজ্ঞা খুব কমই এককভাবে খুঁজে পায়। আমি এম সম্পর্কে সমানভাবে পূর্বাভাসের প্রস্তাব রাখতে পারি ("আইথ মডেলটি সেরা পূর্বাভাস দেবে")। আমি ব্যক্তিগতভাবে দেখতে পাচ্ছি না এটি কীভাবে কোনও সম্ভাবনার পরিবর্তন করতে পারে, এবং তাই বিআইসি কতটা ভাল বা খারাপ হবে (সেই বিষয়টির জন্য এআইসি পাশাপাশি - যদিও এআইসি একটি ভিন্ন উপাখার উপর ভিত্তি করে)

এবং তদ্ব্যতীত, বিবৃতিতে কী ভুল তা যদি আমি বিবেচনা করছি সে ক্ষেত্রে যদি সত্যিকারের মডেলটি থাকে তবে 57% সম্ভাবনা রয়েছে এটি মডেল বি । আমার কাছে যথেষ্ট যুক্তিসঙ্গত বলে মনে হচ্ছে, বা আপনি আরও "নরম" সংস্করণে যেতে পারেন 57% সম্ভাবনা আছে যে মডেল বি সেট বিবেচনা করা হচ্ছে তার মধ্যে সেরা is

একটি সর্বশেষ মন্তব্য: আমি মনে করি আপনি এআইসি / বিআইসি সম্পর্কে যতটা মতামত পাবেন কারণ তাদের সম্পর্কে যারা জানেন তারাও আছেন।


4

এআইসি খুব কমই ব্যবহার করা উচিত, কারণ এটি কেবলমাত্র তাত্পর্যপূর্ণভাবে বৈধ। এটিআইসিসি ব্যবহার করা প্রায়শই ভাল ( সীমাবদ্ধ নমুনার আকারের জন্য সি গিরিযুক্ত AIC ) ব্যবহার করা। এআইসি ওভারপ্যারামিটারাইজেশন করতে ঝোঁক: এই সমস্যাটি এআইসিসির সাথে ব্যাপকভাবে হ্রাস পায়। এআইসিসি ব্যবহারের মূল ব্যতিক্রম হ'ল অন্তর্নিহিত বিতরণগুলি যখন ভারী লেপটোকুর্টিক হয়। এ সম্পর্কে আরও তথ্যের জন্য, বার্নহ্যাম ও অ্যান্ডারসনের মডেল নির্বাচন বইটি দেখুন ।


1
সুতরাং, আপনি যা বলছেন তা হ'ল এআইসি পরামিতিগুলির জন্য মডেলগুলিকে পর্যাপ্ত পরিমাণে শাস্তি দেয় না তাই এটিকে মানদণ্ড হিসাবে ব্যবহার করা হলে ওভারপ্যারামেট্রাইজেশন হতে পারে। আপনি পরিবর্তে এআইসিসি ব্যবহারের পরামর্শ দিন। আমার প্রাথমিক প্রশ্নের প্রসঙ্গে এটিকে ফিরিয়ে দেওয়া, যেহেতু বিআইসিসি ইতিমধ্যে এআইসির চেয়ে আরও কঠোর, বিআইসির উপরেও আইআইসিসি ব্যবহার করার কোনও কারণ আছে?
রাসেলপিয়ের্স

1
আপনি এআইসি দ্বারা যা বোঝাতে চান তা হ'ল অনিচ্ছাকৃতভাবে বৈধ। জন টেলর দ্বারা নির্দেশিত হিসাবে এআইসি অসঙ্গতিপূর্ণ। আমি মনে করি বিআইসির সাথে এআইসির বিপরীত তাঁর পদক্ষেপগুলি সেরা দেওয়া হয়েছে। দু'জনকে ক্রস-বৈধকরণের মতো হতে দেখছি না। তাদের সকলের একটি দুর্দান্ত সম্পত্তি রয়েছে যা তারা সাধারণত সর্বাধিক সংখ্যক ভেরিয়েবলের চেয়ে কম একটি মডেলটিতে শীর্ষে থাকে। তবে তারা সবাই বিভিন্ন মডেল বাছাই করতে পারে।
মাইকেল চেরনিক

4

মডেলগুলির তুলনা করার জন্য এআইসি এবং বিআইসি তথ্য মাপদণ্ড। প্রতিটি মডেল ফিট এবং পার্সিমনি ব্যালেন্স করার চেষ্টা করে এবং প্রতিটি প্যারামিটারের জন্য পৃথকভাবে জরিমানা করে।

AIC=2k2ln(L)
kL2ln(L)2k

BIC=kln(n)2ln(L)

আমি কেআইসির কথা শুনিনি।


কেআইসির কথাও শুনেনি, তবে এআইসি এবং বিআইসির জন্য সংযুক্ত প্রশ্নটি দেখুন বা এআইসির সন্ধান করুন। stats.stackexchange.com/q/577/442
হেনরিক

1
(এই উত্তর সদৃশ প্রশ্ন যে "KIC" এর ব্যাখ্যা চাইলেন থেকে মার্জ করা হয়েছে হয়েছে।)
whuber

3
মডেলদের এআইসি বা বিআইসির সাথে তুলনা করার জন্য নেস্ট করার দরকার নেই।
ম্যাক্রো

1

খুব সংক্ষেপে:

lambda=2lambda=log(n)যেখানে কোনও উদ্দেশ্যকে (এলএএসএসও বা ইলাস্টিক নেট রিগ্রেশন) অপ্টিমাইজ করার পরে নিয়মিতকরণের প্যারামিটারগুলির টিউনটি অনুসরণ করা হয় অন্য কয়েকটি উদ্দেশ্য (যা উদাহরণস্বরূপ ক্রস বৈধকরণের পূর্বাভাস ত্রুটি হ্রাস করে, এআইসি বা বিআইসি)।

n1n

নোট করুন যে LOOCV ত্রুটিটি অবশ্যই কোনও ক্রস বৈধতা না নিয়েই, টুপি ম্যাট্রিক্সের অবশিষ্টাংশ এবং ত্রিভুজ থেকে বিশ্লেষণ করে গণনা করা যেতে পারে । এটি এলইউসিভি ত্রুটির সংবেদনশীল অনুমান হিসাবে সর্বদা এআইসির বিকল্প হতে পারে।

তথ্যসূত্র

স্টোন এম। (1977) ক্রস-বৈধতা এবং আকাইকের মানদণ্ডের দ্বারা মডেল নির্বাচনের একটি অ্যাসিম্পটোটিক সমতুল্য। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটি সিরিজের জার্নাল বি 39, 44-7।

শাও জে। (1997) রৈখিক মডেল নির্বাচনের জন্য একটি অ্যাসিম্পটোটিক তত্ত্ব। পরিসংখ্যান সিনিকা 7, 221-242।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.