লাসোর পরিবর্তে গ্রুপ লাসো ব্যবহার করবেন কেন?


13

আমি পড়েছি যে গ্রুপ লাসোটি ভেরিয়েবলের একটি গ্রুপে পরিবর্তনশীল নির্বাচন এবং স্পারসিটির জন্য ব্যবহৃত হয়। আমি এই দাবির পিছনে অন্তর্দৃষ্টি জানতে চাই

  • গ্রুপ লাসো কেনো লাসোর চেয়ে বেশি পছন্দ?
  • গোষ্ঠী লাসো সমাধানের পথটি কেন পয়েন্টওয়্যার লিনিয়ার নয়?

1
ইউয়ান এবং লিন (2006) থেকে আমি যা বুঝতে পারি যে লাসোটি পৃথক ভেরিয়েবলগুলি নির্বাচনের জন্য নয়, ফ্যাক্টর নির্বাচনের জন্য ডিজাইন করা হয়েছে। সুতরাং লাসো আনোভা সমস্যাটিকে সম্বোধন করে যেখানে ভেরিয়েবলের গ্রুপগুলির নির্বাচনের সমান হুবহু পূর্বাভাস দেওয়ার জন্য গুরুত্বপূর্ণ মুখ্য প্রভাব এবং মিথস্ক্রিয়া নির্বাচন করা হয়। অন্য উদাহরণটি বহুপদী সহ অ্যাডেটিভ মডেলের যেখানে প্রতিটি উপাদান মূল পরিমাপক ভেরিয়েবলের ভিত্তি ফাংশনের রৈখিক সংমিশ্রণ হিসাবে প্রকাশ করা হয়
ভেন্ডেটেটা

উত্তর:


11

Intuitively ভাষী, গ্রুপ Lasso Lasso পছন্দ করা যেতে পারে যেহেতু এটা আমাদের নিগমবদ্ধ জন্য একটি উপায় প্রদান করে (একটি নির্দিষ্ট টাইপ) সত্য সহগ জন্য আমাদের অনুমান মধ্যে অতিরিক্ত তথ্য । চরম পরিস্থিতি হিসাবে, নিম্নলিখিতগুলি বিবেচনা করুন:β

yN(Xβ,σ2I)S={j:βj0}β

β^=argminβyXβ22+λ(|S|1/2βS2+(p|S|)1/2βSC2),
λ β = 0 λ λ মি একটি এক্স λ আছি একটি এক্স - ε ε > 0 β এস এসλmaxλβ^=0। গ্রুপ Lasso শাস্তি প্রকৃতির কারণে, আমরা জানি যে থেকে প্যাচসমূহ থেকে (কিছু ছোট ), ঠিক একটি গোষ্ঠীর সমর্থনে প্রবেশ করবে , যা জন্য অনুমান হিসাবে জনপ্রিয় হিসাবে বিবেচিত । আমাদের গ্রুপিংয়ের কারণে উচ্চ সম্ভাবনা রয়েছে, নির্বাচিত গ্রুপটি হবে এবং আমরা একটি নিখুঁত কাজটি করব।λλmaxλmaxϵϵ>0β^SS

অনুশীলনে, আমরা গ্রুপগুলি এটি ভালভাবে নির্বাচন করি না। তবে উপরোক্ত চরম দৃশ্যের চেয়ে সূক্ষ্ম হওয়া সত্ত্বেও গোষ্ঠীগুলি এখনও আমাদের সহায়তা করবে: সত্যের কোভেরিয়েটগুলির একটি গ্রুপ এবং অসত্য কোভেরিয়েটের একটি গ্রুপের মধ্যে এই পছন্দটি করা হবে। আমরা এখনও শক্তি ধার করছি।

এটি এখানে আনুষ্ঠানিকভাবে হয় । তারা কিছু শর্তে দেখায় যে গ্রুপ লাসোর ভবিষ্যদ্বাণী ত্রুটির উপরের একটি আবদ্ধ অংশটি সরল লাসোর ভবিষ্যদ্বাণী ত্রুটির উপরের একটি নিম্ন সীমাটির চেয়ে কম। তা হ'ল, তারা প্রমাণ করেছে যে গ্রুপিংটি আমাদের অনুমানকে আরও ভাল করে তোলে।

আপনার দ্বিতীয় প্রশ্নের জন্য: (সমতল) লাসো পেনাল্টিটি টুকরোচক লিনিয়ার, এবং এটি টুকরোজ লিনিয়ার সমাধানের পথটিকে উত্সাহ দেয়। স্বজ্ঞাতভাবে, গ্রুপ লাসো ক্ষেত্রে, জরিমানাটি আর টুকরোচক লিনিয়ার হয় না, সুতরাং আমাদের আর এই সম্পত্তি নেই। সমাধানের পথগুলির পিসওয়াইজ লাইনারিটির একটি দুর্দান্ত রেফারেন্স এখানে । তাদের প্রস্তাব দেখুন 1. আসুন এবং । তারা দেখায় যে গ্রুপ লাসোর সমাধানের পথটি রৈখিক এবং যদি কেবলমাত্র টুকরোচক ধ্রুবক। অবশ্যই, এটি আমাদের পেনাল্টি বিশ্বব্যাপী বক্রতা না হওয়ার পরে নয় ।( β ) = জি জি | | 1 / 2β 2 ( 2 এল ( β ) + + λ 2 জে ( β ) ) - 1জে ( β ) জেL(β)=yXβ22J(β)=gG|g|1/2βg2

(2L(β^)+λ2J(β^))1J(β^)
J

2
এটি এখন অনেক অর্থবোধ করে। ধন্যবাদ আপনার উত্তরের জন্য অনেক।
ভেন্ডেটা

4

বেনের উত্তর সবচেয়ে সাধারণ ফলাফল। তবে ওপিটির স্বজ্ঞাত উত্তরটি শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলির ক্ষেত্রে অনুপ্রাণিত হয়, যা সাধারণত একাধিক ডামি ভেরিয়েবল হিসাবে এনকোড থাকে: প্রতিটি বিভাগের জন্য একটি করে। এটি বিভিন্ন বিশ্লেষণে পৃথক পৃথকভাবে না হয়ে একসাথে এই ডামি ভেরিয়েবলগুলি (একটি শ্রেণিবদ্ধ ভবিষ্যদ্বাণীকে উপস্থাপন করে) একসাথে বিবেচনা করে তা বোঝায়।

যদি আপনার পাঁচটি স্তরের সাথে বিভাগগত পরিবর্তনশীল থাকে তবে একটি সরল লাসো দুটি এবং তিনটি বাইরে থাকতে পারে। আপনি কীভাবে এটি একটি নীতিগত পদ্ধতিতে পরিচালনা করেন? ভোট দেওয়ার সিদ্ধান্ত নিবেন? আক্ষরিকভাবে আরও অর্থবহ শ্রেণীবদ্ধের পরিবর্তে ডামি ভেরিয়েবলগুলি ব্যবহার করবেন? আপনার ডামি এনকোডিংটি আপনার পছন্দগুলিকে কীভাবে প্রভাবিত করবে?

তারা যেমন লজিস্টিক রিগ্রেশনের জন্য গ্রুপ লাসো প্রবর্তনের সময় বলেছে , এতে উল্লেখ করা হয়েছে:

ইতিমধ্যে লিনিয়ার রিগ্রেশনের বিশেষ ক্ষেত্রে যখন কেবল অবিচ্ছিন্ন নয় কেবল শ্রেণিবদ্ধ ভবিষ্যদ্বাণী (কারণগুলি) উপস্থিত থাকে, লাসো দ্রবণটি সন্তোষজনক নয় কারণ এটি সম্পূর্ণ কারণগুলির পরিবর্তে স্বতন্ত্র-ডামি ভেরিয়েবলগুলি নির্বাচন করে se তদুপরি, লসো সমাধানটি ডামি ভেরিয়েবলগুলি কীভাবে এনকোড করা হয় তার উপর নির্ভর করে। শ্রেণিবদ্ধ ভবিষ্যদ্বাণীটির জন্য বিভিন্ন বৈসাদৃশ্য নির্বাচন করা সাধারণভাবে বিভিন্ন সমাধান তৈরি করে।

বেন উল্লেখ করেছেন যে, ভবিষ্যদ্বাণীকারীদের মধ্যে আরও সূক্ষ্ম লিঙ্ক রয়েছে যা তারা ইঙ্গিত করতে পারে যে তারা হয় বা এক সাথে থাকা উচিত। তবে শ্রেণীবদ্ধ ভেরিয়েবলগুলি গ্রুপ লাসোর পোস্টার চাইল্ড।


@ বেন: হুমম ... আমি ওপির প্রথম মন্তব্যটি সত্যই বুঝতে পারি না, দেখে মনে হচ্ছে এটি এখন মুছে দেওয়া মন্তব্যের প্রতিক্রিয়া? প্রশ্নটি নিজেই এবং এর শিরোনাম - যা বেশিরভাগ দর্শক পড়বে - এটি একটি সাধারণ প্রশ্ন বলে মনে হয়। আমি অবশ্যই উত্তরটি মুছে ফেলব যদি প্রশ্ন এবং শিরোনামটি "শ্রেণিবদ্ধ লাসোগুলিকে শ্রেণিবদ্ধ ভেরিয়েবলের ক্ষেত্রে ছাড়িয়ে কী করা যায়?" সম্পর্কিত কিছুতে পরিবর্তন করা হয় তবে?
ওয়েইন

ঠিক আছে. আমি কীভাবে (প্লেইন) লসোকে ফ্যাক্টরগুলিতে ব্যবহার করে অনুমানগুলি উপাদানগুলির কোডিংয়ের উপর নির্ভর করে তা সম্পর্কে আপনার বক্তব্যটি আমি পছন্দ করি! আমি পূর্বে গ্রুপ লাসোকে "প্যারামিটার স্পারসিটি" না দিয়ে এক ধরণের "পরিমাপ স্পারসিটি" দেওয়ার হিসাবে ভেবেছিলাম (যেমন আমাদের ফ্যাক্টরটি পরিমাপ করা উচিত বা না - সমস্ত স্তর বাছাই করা উচিত বা
কোনওটিই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.