লাসো রিগ্রেশন মডেলগুলির জন্য এআইসি এবং বিআইসি গণনা করা সম্ভব?


31

লাসো রিগ্রেশন মডেল এবং অন্যান্য নিয়মিত মডেল যেখানে প্যারামিটারগুলি কেবল আংশিকভাবে সমীকরণে প্রবেশ করছে সেখানে এআইসি বা বিআইসির মান গণনা করা সম্ভব? একজন কীভাবে স্বাধীনতার ডিগ্রি নির্ধারণ করে?

আমি প্যাকেজ glmnet()থেকে ফাংশনটির সাথে লাসো রিগ্রেশন মডেলগুলি ফিট করার জন্য আর ব্যবহার করছি glmnetএবং আমি কীভাবে কোনও মডেলের জন্য এআইসি এবং বিআইসি মান গণনা করতে হবে তা জানতে চাই। এই পদ্ধতিতে আমি নিয়মিতকরণ ছাড়াই মানানসই মডেলগুলির সাথে তুলনা করতে পারি। এটা কি সম্ভব?


1
হ্যাঁ আপনি এটি করতে পারেন তবে সম্ভবত এটি আপনাকে সঠিক সংশোধন করতে হবে। সংশোধিত সীমাবদ্ধ মিশ্রণের মডেলিংয়ের প্রসঙ্গে ncbi.nlm.nih.gov/pmc/articles/PMC2629611 এই কাগজটিতে সংশোধন করা হয়েছে , তবে অন্যান্য শাস্তিযুক্ত মডেলগুলিতে একটি সাদৃশ্য যুক্তি যথেষ্ট।
ম্যাক্রো

উত্তর:


12

আপনি নীচের কাগজপত্রগুলি আগ্রহী হিসাবে পেতে পারেন:

আরজে তিবশিরানী এবং জে টেলর (২০১১), লাসো সমস্যায় স্বাধীনতার ডিগ্রি , আরএক্সিব প্রিপ্রিন্ট: 1111.0653

এইচ। জু, টি। হাসিটি এবং আর টিবশিরানী (২০০)), লাসোর স্বাধীনতার ডিগ্রি অন , অ্যানালালস অফ স্ট্যাটিস্টিকস 35 (5), 2173–2192।


14
চূড়ান্ত উত্তরের উপর কিছুটা ব্যাখ্যা থাকলে ভাল হত;
ব্যবহারকারী 4581

10

গ্ল্যামনেট মডেলগুলির জন্য কীভাবে এআইসি এবং বিআইসি গণনা করা যায় সে উপায় নিয়ে আমি অনেক লড়াই করে যাচ্ছিলাম। তবে, অনেকগুলি অনুসন্ধানের পরে, আমি গুগলের তৃতীয় পৃষ্ঠায় উত্তরটি পেয়েছি। এটি এখানে পাওয়া যাবে । আমি এখানে ভবিষ্যতের পাঠকদের জন্য পোস্ট করছি কারণ আমি বিশ্বাস করি যে আমিই একমাত্র হতে পারি না।

শেষ পর্যন্ত, আমি নিম্নলিখিত পদ্ধতিতে এআইসি এবং বিআইসি বাস্তবায়ন করেছি:

fit <- glmnet(x, y, family = "multinomial") 

tLL <- fit$nulldev - deviance(fit)
k <- fit$df
n <- fit$nobs
AICc <- -tLL+2*k+2*k*(k+1)/(n-k-1)
AICc

BIC<-log(n)*k - tLL
BIC

2

জন্নহেইনেকেন প্রসঙ্গে লিঙ্কটিতে লেখক বলেছেন:

আমি ভীত যে গ্ল্যামনেট অবজেক্ট (দেব.আরটিও, নালদেব) থেকে প্রাপ্ত দুটি পরিমাণের মডেলটির সম্ভাবনা অর্জন করার জন্য পর্যাপ্ত নয়, যা আপনাকে এআইসিসি গুনতে হবে। আপনার তিনটি অজানাতে দুটি সমীকরণ রয়েছে: সম্ভাবনা (নাল), সম্ভাবনা (মডেল) এবং সম্ভাবনা (স্যাচুরেটেড)। আমি সম্ভাবনা (নাল) থেকে মুক্ত সম্ভাবনা (মডেল) পেতে পারি না।

আমার কাছে মনে হচ্ছে, আপনি যদি দু'টি মডেলের মধ্যে এআইসির তুলনা করেন, আপনি নাল বিচ্যুতি আলাদা করতে পারবেন না সে বিষয়টি গুরুত্বপূর্ণ নয়। যেহেতু এটি বৈষম্যের উভয় পক্ষেই রয়েছে, এটি দেখায় যে কোন মডেলটির অবশ্যই নীচের এআইসি থাকা উচিত। এটি দুটি বিষয়ের উপর নির্ভরশীল:

  1. উভয় মডেলগুলিতে ডেটা একরকম (যাইহোক এআইসির তুলনার জন্য প্রয়োজনীয়)
  2. আমি স্টেট 101 বা হাই স্কুল বীজগণিত (আমার বর্তমান ক্যাফিন গ্রহণের দৃ strong় ধারণা) থেকে কিছু ভুলে যাচ্ছি না
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.