যদি কেবল ভবিষ্যদ্বাণী করা আগ্রহী হয় তবে লসো ওভার রিজটি কেন ব্যবহার করবেন?


37

পরিসংখ্যানগত শিক্ষার পরিচিতির 223 পৃষ্ঠায় , লেখকরা রিজ রিগ্রেশন এবং লাসোর মধ্যে পার্থক্যগুলির সংক্ষিপ্তসার জানিয়েছেন। তারা যখন "লাসো পক্ষপাতিত্ব, বৈকল্পিকতা এবং এমএসই-র ক্ষেত্রে রিজ রিগ্রেশনকে ছাড়িয়ে যায়" এর একটি উদাহরণ দেয় (চিত্র 6..৯)।

আমি বুঝতে পারি যে লাসো কেন আকাঙ্ক্ষিত হতে পারে: এর ফলে বিরাট সমাধান পাওয়া যায় কারণ এটি অনেকগুলি সহগকে 0 এ সংকুচিত করে, ফলে সাধারণ এবং ব্যাখ্যাযোগ্য মডেল তৈরি হয়। তবে আমি বুঝতে পারি না যে কেবলমাত্র ভবিষ্যদ্বাণীগুলি আগ্রহী হলে এটি কীভাবে রিজকে ছাড়িয়ে যাবে (উদাহরণস্বরূপ এটি এমএসইতে কীভাবে নিখুঁতভাবে নিচে নেমেছে?)।

রিজের সাহায্যে, যদি অনেক ভবিষ্যদ্বাণীকারী প্রতিক্রিয়ার উপর প্রায় কোনও প্রভাব ফেলেনি (কয়েকটি প্রভাবশালী বড় প্রভাব ফেলেছে) তবে তাদের সহগগুলি কেবলমাত্র শূন্যের খুব কাছেই একটি সংখ্যায় সঙ্কুচিত হবে না ... ফলস্বরূপ লাসোর সাথে খুব সামান্য কিছু ঘটবে ? তাহলে চূড়ান্ত মডেলটিতে লসোর চেয়ে খারাপ পারফরম্যান্স থাকবে কেন?



2
আমি সেই লিঙ্কটি দেখেছি। এটি প্রশ্নের উত্তর দেয় না।
অলিভার অ্যাঞ্জেলিল

উত্তর:


34

আপনি এই প্রশ্নটি জিজ্ঞাসা করা ঠিক। সাধারণভাবে, যখন সঠিক যথাযথতার স্কোরিং নিয়ম ব্যবহার করা হয় (উদাহরণস্বরূপ, স্কোয়ারড পূর্বাভাস ত্রুটির অর্থ), রিজ রিগ্রেশন লাসোকে ছাড়িয়ে যাবে। লাসো "সঠিক" ভবিষ্যদ্বাণীকারীদের সন্ধান করার জন্য কিছু তথ্য ব্যয় করে এবং অনেক ক্ষেত্রে এটি করাও দুর্দান্ত নয়। দুজনের আপেক্ষিক কর্মক্ষমতা সত্যিকারের রিগ্রেশন সহগের বিতরণের উপর নির্ভর করবে। আপনার যদি সত্যের মধ্যে ননজারো সহগের একটি ছোট ভগ্নাংশ থাকে তবে লাসো আরও ভাল পারফর্ম করতে পারে। ভবিষ্যদ্বাণীমূলক নির্ভুলতায় আগ্রহী হয়ে ব্যক্তিগতভাবে আমি প্রায় সমস্ত সময় রিজ ব্যবহার করি।


1
আপনি ভবিষ্যদ্বাণীপূর্ণ নির্ভুলতা আগ্রহী না যখন উদাহরণ আছে?
ওয়ালরাস দ্য ক্যাট

1
@ ওয়ালাস্টেগ্যাটিক্যাট স্ট্যানফোর্ড থেকে আসা কিছু লোক, উচ্চ-মাত্রিক পরিবর্তনশীল নির্বাচনের ক্ষেত্রে লাসোর ব্যবহারের পক্ষে। সম্ভবত, ফ্র্যাঙ্কের অর্থ "... প্রাথমিকভাবে ভবিষ্যদ্বাণীমূলক নির্ভুলতার জন্য" কেবল "..." ভবিষ্যদ্বাণীমূলক নির্ভুলতায় আগ্রহী ", যদিও আমার মতে, এই দুটির মধ্যে পার্থক্যটি দরকারী দুটি পেডেন্টিক।
জন ম্যাডেন

আমি কখনই "মাত্রিকতা হ্রাস হিসাবে নিয়মিতকরণ" পদ্ধতির বুঝতে পারি নি। আপনি লসো নিয়মিতকরণের মাধ্যমে বা মাত্রায় মাত্রা হ্রাস সম্পাদন করতে পারেন এবং তারপরে ফলাফলগুলির বৈশিষ্ট্যগুলিতে আপনার মূল সমস্যার জন্য সেরা নিয়মিতকরণ ফাংশনটি ব্যবহার করতে পারেন। কিন্তু আমার দ্বিমত আছে.
ওয়ালরাস দ্য ক্যাট

8
"সাধারণভাবে [...] রিজ রিগ্রেশন লাসোকে ছাড়িয়ে যাবে" এবং "যদি আপনার সত্যের মধ্যে ননজারো সহগের একটি ছোট অংশ থাকে তবে লাসো আরও ভাল পারফরম্যান্স করতে পারে" এটি মনে হয় যে বেশিরভাগ ভবিষ্যদ্বাণীমূলক সমস্যার মধ্যে স্থল সত্যটি বিচ্ছিন্ন নয়। এই আপনি কি বলছেন?
অ্যামিবা 21.39-এ মনিকা

4
হ্যাঁ, প্রধানত যদি আপনি "বিতরণে" গ্রাউন্ড সত্যটি জানেন তবে আপনি অজানা প্রতিরোধের সহগগুলির জন্য একটি বায়সিয়ান পূর্ব বিতরণ তৈরি করবেন যা আপনাকে অনুকূল ফলাফল অর্জন করবে। এমনকি যখনই বলুন, 3/4 পূর্বাভাসকারীদের ঠিক শূন্য প্রভাব রয়েছে, রিজ লাসোর সাথে প্রতিযোগিতামূলক।
ফ্র্যাঙ্ক হ্যারেল

10

আমি মনে করি যে আপনার উল্লেখ করা উদাহরণের নির্দিষ্ট সেটআপটি কেন লাসোকে ছাড়িয়ে যায় তা বোঝার মূল চাবিকাঠি: 45 টির মধ্যে 2 জন ভবিষ্যদ্বাণীকারী আসলেই প্রাসঙ্গিক।

একটি প্যাথলজিকাল ক্ষেত্রে এই সীমানা: লাসো, বিশেষত শূন্যকে সহজেই হ্রাস করার উদ্দেশ্যে করা, ঠিক যেমনটি ইচ্ছা মতো সম্পাদন করে, যখন রিজকে প্রচুর পরিমাণে অকেজো শর্তাদি মোকাবেলা করতে হবে (এমনকি তাদের প্রভাব শূন্যের সাথে বন্ধ করে দেওয়া হয়, এটি এখনও একটি অ-শূন্য প্রভাব)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.