আরআর স্কোয়ার এলএএসএএসও ব্যবহারের জন্য উপযুক্ত নয় কেন?


12

আমি বেশ কয়েকটি জায়গায় পড়েছি যে যখন কোনও মডেল লাসো ব্যবহার করে ফিট হয় তখন আর স্কয়ার্ড কোনও আদর্শ পরিমাপ নয়। তবে কেন তা ঠিক তা নিয়ে আমি পরিষ্কার নই ।

উপরন্তু, আপনি সেরা বিকল্প সুপারিশ করতে পারেন?

উত্তর:


19

লাসো ব্যবহারের লক্ষ্যটি বহু সংখ্যক কোভারিয়েট না থাকার অর্থে একটি বিচ্ছিন্ন প্রতিনিধিত্ব (একটি পূর্বাভাসযুক্ত পরিমাণের) প্রাপ্তি। সাথে মডেলগুলির তুলনা করা প্রচুর পরিমাণে কোভারিয়েটের সাথে মডেলগুলির পক্ষে হয়ে থাকে: বাস্তবে, ফলাফলের সাথে সম্পর্কিত না হওয়া কোভারিয়েটগুলি যুক্ত করা কখনই হ্রাস পাবে না এবং প্রায় সর্বদা এটি কমপক্ষে কিছুটা বাড়ায়। লাসো মডেলটি সর্বোত্তম দন্ডিত লগ-সম্ভাবনার সাথে মডেলটি সনাক্ত করবে (একটি আনপেনালাইজড লগ-সম্ভাবনা একঘেয়েভাবে সাথে সম্পর্কিত )। অন্যান্য প্রকারের মডেলগুলির সাথে লাসো মডেলগুলির তুলনা করার জন্য বহুল ব্যবহৃত ব্যবহৃত বৈধতা পরিসংখ্যানগুলি হ'ল, বিআইসি বা ক্রস-বৈধতাযুক্ত । ।R2R2R2R2


1
+1 স্পষ্টভাবে কারণের জন্য উপস্থাপন করুন এবং বিকল্প সরবরাহ করুন
হাইতাও ডু

1
মহান উত্তরের জন্য অনেক ধন্যবাদ! আপনি কি "এলএএসএসও মডেলটি সর্বোত্তম দণ্ডিত লগ-সম্ভাবনা (একটি আনপেনালাইজড লগ-সম্ভাবনা একঘেয়েভাবে আর 2 এর সাথে সম্পর্কিত) দিয়ে মডেলটিকে শনাক্ত করবেন" এই বিষয়ে বিস্তারিত জানাতে আপনি কি আপত্তি করতে চান? " আমি প্রথম অংশটি বোঝাতে চাই যে এটি ন্যূনতম পরিমাণে ত্রুটি (ভবিষ্যদ্বাণীতে এবং শাস্তির মাধ্যমে) দিয়ে মডেলটি চয়ন করবে? কিন্তু বন্ধনী বিটের অর্থ কী তা সম্পর্কে আমি অস্পষ্ট। এর অর্থ কি এই যে আনপেনালাইজড এলএল উপরে উঠে যায় আর 2 ডাউন হওয়ার সাথে সাথে? এছাড়াও, ক্রস-যাচাই করা আর 2 কি সম্পূর্ণ নতুন ডেটাসেটে থাকতে হবে? অথবা এটি প্রশিক্ষণের ডেটা ভিত্তিক করা যেতে পারে?
ডেভ

3
@ ডেভ আমি মনে করি আপনার সঠিক ধারণা আছে। লিনিয়ার রিগ্রেশন মডেল একটি লাসো যা কোনও জরিমানা ছাড়াই, এবং লগ-সম্ভাবনা কেবল just যদিও আর 2 হ'ল । দণ্ড কার্যকরভাবে পরোক্ষভাবে ত্রুটি তৈরিতে অবদান রাখে, স্বল্পতা প্রয়োগের জন্য এটি মূল্য দেওয়া মূল্য। আনপেনালাইজড মডেলটিতে সর্বদা নিম্ন (অভ্যন্তরীণ) ত্রুটি থাকবে। লোকেরা সাধারণত একই ডেটাসেট দিয়ে ক্রস-বৈধকরণ করে। নতুন ডেটাসেটে মডেলগুলির পরীক্ষা করা সম্পূর্ণ অন্য একটি জিনিস ("ক্রস" অংশের প্রয়োজন হয় না) এবং এটি যথেষ্টভাবে সম্পন্ন হয় না। log(2π)N+1log(N)+log(i=1nri2)1i=1nri2/i=1nyi2
অ্যাডমো

@ অ্যাডামো আমি মনে করি আপনার মন্তব্যে আপনার উত্তরটি সম্পাদনা করা ভাল ধারণা হবে, এটি খুব ভাল।
ম্যাথু ড্রুরি

হাই @ অ্যাডামো একটি চূড়ান্ত ফলোআপ প্রশ্ন। আমি এখন বুঝতে পারি কেন চিরাচরিত আর 2 খারাপ পদক্ষেপ। তবে, আমি কেন অস্পষ্ট যে ক্রস-বৈধতাযুক্ত আর 2 (একই ডেটাসেটের মধ্যে) ঠিক আছে?
ডেভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.