এআইসি বা পি-মান: মডেল নির্বাচনের জন্য কোনটি বেছে নেবে?


22

আমি এই আর জিনিসটিতে একেবারে নতুন তবে কোন মডেলটি নির্বাচন করব তা সম্পর্কে আমি নিশ্চিত নই।

  1. আমি সর্বনিম্ন AIC এর উপর ভিত্তি করে প্রতিটি ভেরিয়েবল নির্বাচন করে একটি ধাপে এগিয়ে ফরোয়ার্ড রিগ্রেশন করেছি । আমি 3 টি মডেল নিয়ে এসেছি যা আমি নিশ্চিত না যেটি "সেরা"।

    Model 1: Var1 (p=0.03) AIC=14.978
    Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = 12.543
    Model 3: Var1 (p=0.04) + Var2 (p=0.04) + Var3 (p=0.06) AIC= -17.09
    

    আমি মডেল # 3 এর সাথে যেতে আগ্রহী কারণ এর মধ্যে সর্বনিম্ন এআইসি রয়েছে (আমি শুনেছি নেতিবাচক ঠিক আছে) এবং পি-মানগুলি এখনও এর চেয়ে কম থাকে।

    হ্যাচলিং মাসের পূর্বাভাসক হিসাবে আমি 8 ভেরিয়েবল দৌড়েছি এবং আবিষ্কার করেছি যে এই তিনটি ভেরিয়েবলই সবচেয়ে ভাল ভবিষ্যদ্বাণীকারী।

  2. আমার পরবর্তী ধাপে আমি মডেল 2 পছন্দ করি কারণ এআইসি কিছুটা বড় হলেও পি মানগুলি আরও ছোট ছিল। আপনি কি একমত এটি সেরা?

    Model 1: Var1 (p=0.321) + Var2 (p=0.162) + Var3 (p=0.163) + Var4 (p=0.222)  AIC = 25.63
    Model 2: Var1 (p=0.131) + Var2 (p=0.009) + Var3 (p=0.0056)                  AIC = 26.518
    Model 3: Var1 (p=0.258) + Var2 (p=0.0254)                                   AIC = 36.905
    

ধন্যবাদ!


আপনি আমাদের (1) এবং (2) মধ্যে পার্থক্য বলতে পারেন? স্পষ্টতই কিছু পরিবর্তন হয়েছে, কারণ মডেল 3 ইন (1) এবং মডেল 2 ইন (2) নামমাত্র অভিন্ন তবে পি-মান এবং এআইসি পৃথক।
শুক্র

2
এই প্রশ্নটি দু'বার পুনরায় পোস্ট করা হয়েছে, যার অর্থ এই যে কেবল আমাদের এগুলি বন্ধ করতে হবে তা নয়, ইতিমধ্যে আপনাকে সরবরাহ করা সম্পর্কিত সম্পর্কিত প্রতিক্রিয়া (গুলি)। আপনি কি দয়া করে আপনার অ্যাকাউন্টটি নিবন্ধিত করতে ( FAQ দেখুন ) এবং ভবিষ্যতে স্ট্যাক এক্সচেঞ্জ পোস্ট নীতিতে মনোযোগ দিতে পারেন? ধন্যবাদ।
chl

@ শুভ, আমি ভয় করি যে আমি আপনার প্রশ্নটি পুরোপুরি বুঝতে পারি না। এটি সম্ভবত আমার পরিসংখ্যানিক বোঝার অভাব। তবে স্পষ্ট করার চেষ্টা করা। মডেল 1 এর 4 ভেরিয়েবল রয়েছে, মডেল 2 এর 3 ভেরিয়েবল রয়েছে এবং মডেল 3 এর 2 ভেরিয়েবল রয়েছে। ভেরিয়েবলগুলি প্রতিটি মডেলে একই ক্রমে থাকে (যার অর্থ প্রতিটি মডেলের ভেরিয়েবল এক = টেম্প)। আমার মনে হয় @ গ্যাবার্গুলিয়া এবং @ ডিজেমা আমার প্রশ্নের সঠিক উত্তর দিয়েছে। চলক 4 টি ভেরিয়েবলের সাথে সম্পর্কযুক্ত 3 এএইচ-এইচএ! ইন্দ্রিয় তোলে। ধন্যবাদ ওডলস!
এমইএল

আমি আপনার প্রতিক্রিয়াটিকে উপরের মন্তব্যে রূপান্তর করেছি। আপনি যদি মনে করেন যে বর্তমান প্রতিক্রিয়াগুলির মধ্যে একটি আপনাকে সহায়তা করেছে বা আপনার প্রশ্নের উত্তর দিয়েছে, তবে এটি দয়া করে ভুলে যাবেন না, যেমনটি দয়া করে @ রিচিওমরিস্রোইয়ের মাধ্যমে স্মরণ করিয়ে দিয়েছেন। বিটিডাব্লু, আপনার অ্যাকাউন্টটি নিবন্ধিত করে দেখতে ভাল লাগছে।
chl

উত্তর:


23

এআইসি হ'ল ফিটের পরিমাপের একটি সদ্ব্যবহার যা মডেলটিতে ছোট্ট অবশিষ্টাংশ ত্রুটির পক্ষে, তবে আরও ভবিষ্যদ্বাণীকারীদের অন্তর্ভুক্ত করার জন্য শাস্তি দেয় এবং অতিরিক্ত মানা এড়াতে সহায়তা করে। আপনার দ্বিতীয় সেটগুলির মডেল 1-এ (সর্বনিম্ন এআইসিসহ এক) আপনার ডেটাসেটের বাইরে ভবিষ্যদ্বাণী করার জন্য ব্যবহার করতে পারলে সেরা পারফরম্যান্স করতে পারে। মডেল 2-এ 2 এর ফলাফল কেন কম এআইসির ফলাফলের সম্ভাব্য ব্যাখ্যা, তবে উচ্চতর পি মানগুলি হ'ল ভার 4 কিছুটা ভার 1, 2 এবং 3 এর সাথে সম্পর্কিত lated মডেল 2 এর ব্যাখ্যাটি এত সহজ।


31

স্বতন্ত্র পি-মানগুলি ভ্রান্তকর হতে পারে। যদি আপনার সাথে ভেরিয়েবলগুলি থাকে যা কলিনারি (উচ্চতর সম্পর্ক) থাকে তবে আপনি বড় পি-মান পাবেন। এর অর্থ এই নয় যে ভেরিয়েবলগুলি অকেজো।

থাম্বের দ্রুত নিয়ম হিসাবে, এআইসির মানদণ্ডের সাথে আপনার মডেল নির্বাচন করা পি-মানগুলি দেখার চেয়ে ভাল।

আপনার যখন ডেটাপয়েন্ট রেশিওতে ভেরিয়েবলটি বড় হয় তখন কোনও ব্যক্তি নিম্নতম এআইসির সাথে মডেলটি নির্বাচন না করার কারণ।

নোট করুন যে মডেল নির্বাচন এবং পূর্বাভাসের সঠিকতা কিছুটা স্বতন্ত্র সমস্যা। যদি আপনার লক্ষ্যটি সঠিক ভবিষ্যদ্বাণী পাওয়া যায় তবে আমি প্রশিক্ষণ এবং পরীক্ষার সেটগুলিতে আপনার ডেটা আলাদা করে আপনার মডেলটিকে ক্রস-বৈধকরণের পরামর্শ দেব।

চলক নির্বাচনের উপর একটি কাগজ: পরিবর্তনশীল নির্বাচনের জন্য স্টোকাস্টিক স্টেপওয়াইস এনসেমবলস


4
যদি আপনার লক্ষ্যটি পূর্বাভাসের নির্ভুলতা হয় তবে আপনি এআইসি ব্যবহার করতে চান (এটি ফিটযুক্ত মডেল এবং সত্যের মধ্যে প্রত্যাশিত কেএল বিভাজনকে হ্রাস করে)। যদি আপনি একটি সামঞ্জস্যপূর্ণ মডেল নির্বাচন পদ্ধতি (ফিক্সড পি, ক্রমবর্ধমান এন) চান তবে আপনি এর পরিবর্তে বিআইসি ব্যবহার করতে পারেন। হাইপোথেসিসগুলি বেছে নেওয়ার জন্য ধাপে ধাপে রিগ্রেশনে পি-মানগুলি ব্যবহার করার পরামর্শ দেওয়া হয় না।
ইমাকালিক

8
0,154|টি|>লগ(এন)

-3

এআইসি সাধারণীকরণ ত্রুটির প্রাক্কলন দ্বারা অনুপ্রাণিত হয় (যেমন ম্যালোর সিপি, বিআইসি, ...)। আপনি যদি ভবিষ্যদ্বাণীগুলির জন্য মডেলটি চান তবে এই মানদণ্ডগুলির মধ্যে একটির আরও ভাল ব্যবহার করুন। যদি কোনও ঘটনাকে ব্যাখ্যা করার জন্য আপনি আপনার মডেলটি চান তবে পি-মানগুলি ব্যবহার করুন।

এছাড়াও, এখানে দেখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.