এআইসিতে 'প্যারামিটারের সংখ্যা' অর্থ


21

AIC গণনা করার সময়,

AIC=2k2lnL

কে মানে 'প্যারামিটারের সংখ্যা'। তবে প্যারামিটার হিসাবে কী গণনা করা যায়? সুতরাং উদাহরণস্বরূপ মডেল

y=ax+b

A এবং b কি সর্বদা পরামিতি হিসাবে গণনা করা হয়? আমি যদি ইন্টারসেপ্টের মান সম্পর্কে চিন্তা না করি, তবে আমি কি তা উপেক্ষা করতে পারি বা এটি এখনও গণনা করা যায়?

কি যদি

y=af(c,x)+b

যেখানে সি এবং এক্স এর ফাংশন, আমি এখন 3 টি পরামিতি গণনা করব?f


9
এটি একটি ভাল প্রশ্ন, কারণ একটি সূক্ষ্মতা আছে: অনুমান করা যায় এমন সনাক্তকারী পরামিতিগুলির সংখ্যা । উদাহরণস্বরূপ, যদিও রিগ্রেশন মডেলটিতে পাঁচটি পরামিতি লেখা রয়েছে, তবুও । (এই মডেল সমতূল্য সঙ্গে এবং , যা স্পষ্টভাবে মাত্র চারটি পরামিতি প্রয়োজন ।)kYN(β0+β1X1+β2X2+β3(X1+X2),σ2) ওয়াই এন ( β 0 + α 1 এক্স 1 + α 2 এক্স 2 , σ 2 ) α 1 = β 1 + β 3 α 2 = β 2 + β 3k=4YN(β0+α1X1+α2X2,σ2)α1=β1+β3α2=β2+β3
হোয়বার

3
কঠোরভাবে, আপনি সমস্ত সনাক্তকারী, নিখরচায় প্যারামিটার গণনা করেন - মানে প্যারামিটার, আকৃতি এবং স্কেল প্যারামিটারগুলি যাই হোক না কেন (এবং এটি এআইসি জন্য গুরুত্বপূর্ণ ) তবে আপনি যদি মডেলগুলির সাথে তুলনামূলকভাবে পরামিতিগুলি বাদ দেন তবে এআইসির কোনও ফল হয় না। সুতরাং উদাহরণস্বরূপ, রিগ্রেশনে, আপনার ভেরিয়েন্স প্যারামিটারটি গণনা করা উচিত। সুতরাং, আমার গণনা অনুসারে, আপনার প্রশ্নে আপনার সমস্ত পরামিতি গণনাগুলি একটি সংক্ষিপ্ত - তবে যদি সমস্ত মডেলের মধ্যে ঠিক একটি থাকে তবে এটি এআইসি-তে ফেলে দেওয়ার ক্ষতি করে না। রিগ্রেশন মডেলগুলিতে এআইসিকে গণনা করার সময় স্পষ্টভাবে ভেরিয়েন্স প্যারামিটার গণনা করে। C
গ্লেন_বি -রিনস্টেট মনিকা

@ শুভ কেন এই দুর্দান্ত মন্তব্যটি উত্তর হিসাবে পোস্ট করা হয় না? :)
অ্যালেক্সিস

ধন্যবাদ, অ্যালেক্সিস। আমি এই চিন্তাভাবনাটিকে একটি মন্তব্য হিসাবে পোস্ট করেছি কারণ এই ধারণাটি পি শেনেলের উত্তরে পর্যাপ্তরূপে coveredাকা আছে: আমি কেবল এটি আরও কিছুটা জোর দেওয়া চাই।
হোবার

উত্তর:


17

যেমন মুগেন উল্লেখ করেছেন, অনুমিত পরামিতিগুলির সংখ্যা উপস্থাপন করে । অন্য কথায়, মডেলটি পুরোপুরি নির্দিষ্ট করতে আপনাকে যে পরিমাণ অতিরিক্ত পরিমাণ জানতে হবে তা এটি। সরল লিনিয়ার রিগ্রেশন মডেল আপনি , , বা উভয়ই অনুমান করতে পারবেন । আপনি যে পরিমাণে অনুমান করেন না তা অবশ্যই ঠিক করতে হবে। আপনি এটি জানেন না এবং এটি সম্পর্কে চিন্তা করবেন না এমন অর্থে কোনও প্যারামিটার "উপেক্ষা করা" নেই is সর্বাধিক সাধারণ মডেল যা এবং উভয়ই অনুমান করে না তা হ'ল নন-ইন্টারসেপ্ট মডেল, যেখানে আমরা স্থির করি । এটিতে 1 টি প্যারামিটার থাকবে। আপনি ঠিক সহজেই বা ঠিক করতে পারেনy = a x + b a b a b b = 0 a = 2 b = 1 σk

y=ax+b
ababb=0a=2b=1যদি আপনার বিশ্বাস করার কোনও কারণ থাকে যে এটি বাস্তবতা প্রতিফলিত করে। (সূক্ষ্ম বিন্দু: একটি সাধারণ লিনিয়ার রিগ্রেশন-এর একটি প্যারামিটারও রয়েছে, তবে এটি প্রতিটি মডেলটিতে যেহেতু আপনি এটির তুলনা প্রভাবিত না করেই এটিকে ফেলে দিতে পারেন))σ

যদি আপনার মডেলটি তবে প্যারামিটারের সংখ্যা নির্ভর করে আপনি এই মানগুলির কোনও ঠিক করেন কিনা এবং আকারে । উদাহরণস্বরূপ, আমরা যদি অনুমান করতে চাই এবং জানতে পারি, তবে আমরা যখন মডেলটি লিখি তখন তিনটি অজানা পরামিতি সহ আমাদের । যদি, তবে, , তবে আমাদের কাছে মডেল রয়েছে যা সত্যই কেবল দুটি পরামিতি রয়েছে: এবং ।f a , b , c f ( c , x ) = x c y = a x c + b f ( c , x ) = c x y = a c x + b a

y=af(c,x)+b
fa,b,cf(c,x)=xc
y=axc+b
f(c,x)=cx
y=acx+b
acb

এটি অত্যন্ত গুরুত্বপূর্ণ যে দ্বারা সূচিত ফাংশনগুলির একটি পরিবার । যদি আপনি সমস্ত কিছু জানেন যে অবিচ্ছিন্ন এবং এটি এবং উপর নির্ভর করে তবে আপনি ভাগ্য থেকে দূরে থাকবেন কারণ প্রচুর অবিচ্ছিন্ন ক্রমাগত কার্য রয়েছে।c f ( c , x ) c xf(c,x)cf(c,x)cx


2
(+1) সম্ভবত "অনুমান" জুড়ে উল্লেখযোগ্য অর্থ "সর্বাধিক সম্ভাবনার দ্বারা অনুমান"।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

এটা কি সত্যিই গুরুত্বপূর্ণ? প্রকৃতপক্ষে আমার একটি বিরাট সিমুলেশন, বিশ্লেষণাত্মকভাবে টানা অসম্ভব, এবং কয়েক ঘন্টা গণনা করতে। আমি প্রায় 20 টি বিভিন্ন সাথে এটি চেষ্টা করে দেখি কারণ আমাদের কাছে সময় আছে এবং আমি এর মান ধরে যা দিনের শেষে সেরা দেয় । সুতরাং কথা বলার একটি পদ্ধতিতে আমি হিসাবে যথাসম্ভব অনুমান করেছি, যদিও আপনি যেমন কোনও প্রতিরোধের মতো হন না। অবশ্যই এটি এখনও এআইসির জন্য প্যারামিটার হিসাবে গণনা করে? c r 2(,এক্স)R2
সিডিশো বব

2
@ সিডিশোবোজ: হ্যাঁ - আপনি যখন দুটি মডেলের তুলনা করেন সর্বাধিক লগ হওয়ার সম্ভাবনার মধ্যে পার্থক্যটি প্রত্যাশিত কুলব্যাক-লেবেলারের তথ্য ক্ষতির পার্থক্যের পক্ষপাতদায়ক অনুমান এবং এআইসিতে পেনাল্টি শব্দটি প্রায় এই পক্ষপাতাকে সংশোধন করে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

1
@ সিডিশোবোজ: আমার উল্লেখ করা উচিত যে সাধারণীকৃত অনুমানের সমীকরণ এবং এর মতো এআইসির সংশোধনী রয়েছে - তারা সর্বাধিক অর্ধ-সম্ভাবনা এবং আরও জটিল পেনাল শব্দটি ব্যবহার করে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

4

যে কোনও পরিসংখ্যানের মডেলের জন্য, এআইসির মান হ'ল যেখানে কে মডেলের পরামিতিগুলির সংখ্যা এবং এল মডেলের সম্ভাবনা ফাংশনের সর্বাধিক মান।একজনআমিসি=2-2Ln(এল)

( এখানে দেখুন )

আপনি দেখতে পাচ্ছেন, প্রতিটি মডেলের অনুমান পরামিতিগুলির সংখ্যা উপস্থাপন করে । যদি আপনি মডেলটিতে একটি ইন্টারসেপ্ট অন্তর্ভুক্ত করেন (এটি যদি আপনি কোনও বিন্দুর অনুমান, ইন্টারসেপ্টের জন্য বৈকল্পিকতা এবং আত্মবিশ্বাসের ব্যবধান গণনা করেন) তবে এটি প্যারামিটার হিসাবে গণনা করা হয়। অন্যদিকে, আপনি যদি কোনও বিরতি ছাড়াই কোনও মডেল গণনা করছেন, এটি গণনা করে না।

মনে রাখবেন যে এআইসি কেবল ফিটের সার্থকতার সংক্ষিপ্তসারই দেয় না তবে এটি মডেলের জটিলতাও বিবেচনা করে। এজন্য আরও বেশি পরামিতি সহ মডেলগুলিকে দণ্ডিত করার বিদ্যমান।

আপনার দ্বিতীয় প্রশ্নের উত্তর দিতে আমি যথেষ্ট জ্ঞান বোধ করি না, আমি এটি সম্প্রদায়ের অন্য সদস্যের জন্য রেখে দেব।


1
λ

1
হ্যাঁ, অবশ্যই.
PA6OTA

1

প্রথমত, যারা এআইসির সাথে পরিচিত না হতে পারেন তাদের কাছে: আকাইকে তথ্য মানদণ্ড (এআইসি) একটি সাধারণ মেট্রিক যা মডেলগুলির "ধার্মিকতা" তুলনা করার জন্য ডিজাইন করা হয়েছে।

এআইসির মতে, একই ইনপুট এবং প্রতিক্রিয়ার ভেরিয়েবলগুলিতে প্রয়োগ হওয়া দুটি ভিন্ন মডেলের মধ্যে নির্বাচন করার চেষ্টা করার সময় , একই সমস্যা সমাধানের জন্য ডিজাইন করা মডেলগুলি, নিম্ন এআইসির সাথে মডেলটিকে "আরও ভাল" হিসাবে বিবেচনা করা হয়।

c(,এক্স)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.