আর-তে "হাত ধরে" এআইসির গণনা করা হচ্ছে


16

আমি আর তে লিনিয়ার রিগ্রেশন এর এআইসি গণনা করার চেষ্টা করেছি তবে এই AICফাংশনটি ব্যবহার না করেই :

lm_mtcars <- lm(mpg ~ drat, mtcars)

nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2)
[1] 97.98786

তবে, AICএকটি আলাদা মান দেয়:

AIC(lm_mtcars)
[1] 190.7999

কেউ আমাকে বলতে পারে যে আমি কী ভুল করছি?


5
(এখনও আপনার উত্তর যাচাই না করে): আপনি অগত্যা কোনও ভুল করছেন না, কারণ সম্ভাবনাটি কেবলমাত্র একটি গুণক ধ্রুবক পর্যন্ত সংজ্ঞায়িত; দুটি লোক লগ-সম্ভাবনা গণনা করতে এবং বিভিন্ন সংখ্যা পেতে পারে (তবে লগ-সম্ভাবনার মধ্যে পার্থক্য একই)।
গ্লেন_বি -রিনস্টেট মনিকা

1
হংক ওওস উত্তর এই প্রশ্নের সাথে সম্পর্কিত, আমি মনে করি। সূত্র ফাংশন যা AICব্যবহার করে -2*as.numeric(logLik(lm_mtcars))+2*(length(lm_mtcars$coefficients)+1)
COOLSerdash

লুসিয়ানো: এই সূত্রটিতে "+1" @COOLSerdash পয়েন্টটি ভেরিয়েন্স প্যারামিটার শব্দ থেকে উত্পন্ন করে। আরও মনে রাখবেন যে logLiklmlog(2*pi)
ফাংশনটিতে

1
@ গ্লেেন_বি: কেন কেবল সম্ভাবনার সংজ্ঞা শুধুমাত্র একটি গুণক ধ্রুবক পর্যন্ত বলা হয়? সর্বোপরি, বিতরণের বিভিন্ন পরিবার (যেমন এআইসি সহ, বা কক্স পরীক্ষার সাথে) থেকে অ-নেস্টেড মডেলগুলির তুলনা করার সময়, আপনাকে সেই ধ্রুবকটি মনে রাখা দরকার।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ স্কার্টচি সংজ্ঞাটি আমার নয়! এটি আপনাকে আরএফিশারর সাথে নিতে হবে। আমার মনে হয় (1921) প্রথম থেকেই এটি শুরু হয়েছিল। এটি এখনও সেইভাবে সংজ্ঞায়িত করা হয়েছে, কমপক্ষে একটানা ক্ষেত্রে, উদাহরণস্বরূপ, এখানে আরও বিশদভাবে শুরু হওয়া বাক্যটিতে এখানে দেখুন ।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


19

দ্রষ্টব্য যে আর-তে logLikফাংশনটিতে সহায়তা বলেছে যে lmমডেলগুলির জন্য এতে 'সমস্ত ধ্রুবক' অন্তর্ভুক্ত রয়েছে ... সুতরাং log(2*pi)কোথাও কোথাও কোথাও এমনটি থাকবে , পাশাপাশি সম্ভাব্য ব্যক্তির জন্য আরও একটি ধ্রুবক শব্দ। এছাড়াও, আপনি এই সত্যটি গণনা করতে ভুলে যেতে পারবেন না যে একটি প্যারামিটার।σ2

L(μ^,σ^)=(12πsn2)nexp(12i(ei2/sn2))

2logL=nlog(2π)+nlogsn2+i(ei2/sn2)

=n[log(2π)+logsn2+1]

AIC=2p2logL

তবে নোট করুন যে 1 টি স্বাধীন ভেরিয়েবলের মডেলটির জন্য, পি = 3 (এক্স-সহগ, ধ্রুবক এবং σ2 )

যার অর্থ আপনি কীভাবে তাদের উত্তর পাবেন:

nrow(mtcars)*(log(2*pi)+1+log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))
       +((length(lm_mtcars$coefficients)+1)*2)

আপনার হিসাব কেন আপনি শুধুমাত্র দ্বারা বিভাজক হয় এন এবং N - পি ? s2nnp
লুক থর্বার্ন

1
এআইসি সংজ্ঞা দেখুন: যেখানে প্যারামিটার ভেক্টর, θ সর্বাধিক মূল্যায়ন করা হয় (যেমন সব উপাদান θ MLEs হয়); উদাহরণস্বরূপ উইকিপিডিয়া আকাইকে তথ্যের মানদণ্ড: সংজ্ঞা । আপনার দ্বারা ভাগ না করে থাকেন এন এর গণনার সেখানে σ 2 , আপনি MLE গণক করছি না σ 2 এবং তাই সত্যিই কম্পিউটিং না এআইসি - প্রভাব আপনি ঝুলানো পরামিতি প্রভাব জন্য দুইবার সামঞ্জস্য চাই না। (হ্যাঁ, প্রচুর লোকেরা এটি ভুল করে)2logL(θ^)+2pθθ^nσ^2σ2
গ্লেন_বি -রিনস্টেট মনিকা

2logL=nlog(2π)+nlogsn+i(ei2/sn2)2πsn2
rhody

11

The AIC function gives 2k2logL, where L is the likelihood & k is the number of estimated parameters (including the intercept, & the variance). You're using nlogSrn+2(k1), where Sr is the residual sum of squares, & n is the sample size. These formulæ differ by an additive constant; so long as you're using the same formula & looking at differences in AIC between different models where the constants cancel, it doesn't matter.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.