লাসো রিগ্রেশন সহগের ব্যাখ্যা


12

আমি বর্তমানে ase 300 ভেরিয়েবল এবং 800 টি পর্যবেক্ষণ সহ একটি ডেটাসেটে বাইনারি ফলাফলের জন্য ভবিষ্যদ্বাণীমূলক মডেল তৈরির কাজ করছি। ধাপে ধাপে রিগ্রেশন সম্পর্কিত সমস্যাগুলি এবং কেন এটি ব্যবহার করবেন না সে সম্পর্কে আমি এই সাইটে অনেকগুলি পড়েছি।

আমি লাসো রিগ্রেশন এবং বৈশিষ্ট্য নির্বাচনের জন্য এর ক্ষমতা সম্পর্কে পড়ছি এবং "ক্যারেট" প্যাকেজ এবং "গ্ল্যামনেট" ব্যবহার করে এটি বাস্তবায়নে সফল হয়েছি।

আমি সর্বোত্তম lambdaএবং alpha"ক্যারেট" থেকে মডেলের সহগ বের করতে সক্ষম ; তবে, সহগের কীভাবে ব্যাখ্যা করা যায় সে সম্পর্কে আমি অপরিচিত।

  • লাসো সহগগুলি কি একই পদ্ধতিতে লজিস্টিক রিগ্রেশন হিসাবে ব্যাখ্যা করা হয়?
  • ল্যাসিস্টিক রিগ্রেশন-এ লাসো থেকে নির্বাচিত বৈশিষ্ট্যগুলি ব্যবহার করা কি উপযুক্ত হবে?

সম্পাদনা

অন্যান্য সকল সহগকে ধ্রুবক ধরে রাখার সময় সহগের 1 ইউনিট পরিবর্তনের জন্য লগ প্রতিক্রিয়া হিসাবে লাসো রিগ্রেশন থেকে সূচকীয় সহগগুলির মতো সহগের ব্যাখ্যা।

https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-how-do-i-interpret-odds-ratios-in-logistic-regression/


"লজিস্টিক রিগ্রেশন হিসাবে একইভাবে ব্যাখ্যা করা" বলতে কী বোঝায় আপনি কি কিছুটা পূরণ করতে পারেন? আপনি কোন ব্যাখ্যাটি সাধারণ করতে চান ঠিক তা জানতে আমি খুব উপকারী হব।
ম্যাথু ড্রুরি

1
@ ম্যাথু ড্রুরি - আমার সহায়তা করার সময় লাসোর উপর দিয়ে যায় নি বলে আমাকে সহায়তা করার জন্য সময় দেওয়ার জন্য আপনাকে অনেক ধন্যবাদ। সাধারণভাবে, আমি আমার স্নাতক কোর্সের সময় যা শিখিয়েছি, সেগুলি থেকে, একটি লজিস্টিক রিগ্রেশন থেকে সূক্ষ্ম সহগগুলি অন্যান্য সহগের ধ্রুবককে ধরে রেখে সহগের 1 ইউনিট বৃদ্ধির লগ প্রতিক্রিয়া অর্জন করে।
মাইকেল লুউ

1
"ক্যারেট" এ আপনি এবং নির্বাচন করেন । কোথায় থেকে এসেছে? এটি কি সম্ভবত কোনও ইলাস্টিক নেট (হাইসোপারামিটারের তুলনায় লাসো তুলনা করে রিজ পেনাল্টি) (যে ক্ষেত্রে আপনি আসলে লাসোর চেয়ে ইলাস্টিক নেট ব্যবহার করবেন)? λ ααλα
রিচার্ড হার্ডি

আমি যতদূর বলতে পারি, বেশিরভাগ ল্যাসো বাস্তবায়নে সহগের জন্য তাত্পর্য পরীক্ষা করা হয় নি introduced সুতরাং একটি পার্থক্য কি না যে আমরা ওএলএসের পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পরিবর্তনশীলগুলি নির্ধারণ করতে পারি, আমরা লাসোর সাথে এটি একটি দুর্বল বক্তব্য না রেখেই নির্বাচন করতে পারি যে নির্বাচিত অনুরূপ ভেরিয়েবলগুলির লাসো সহগুণগুলি "গুরুত্বপূর্ণ" ভেরিয়েবলগুলি বিবেচনা করবেন?
গডস্পিড

উত্তর:


13

লাসো সহগগুলি কি একই পদ্ধতিতে লজিস্টিক রিগ্রেশন হিসাবে ব্যাখ্যা করা হয়?

আমাকে পুনঃব্যবস্থা করা যাক: যেমন লাসো সহগগুলি একইভাবে ব্যাখ্যা করা যায়, উদাহরণস্বরূপ, কোনও লজিস্টিক রিগ্রেশনে ওএলএস সর্বাধিক সম্ভাবনার সহগগুলি ?

লাসো (একটি দণ্ডিত অনুমানের পদ্ধতি) এর লক্ষ্য হিসাবে একই পরিমাণের (মডেল সহগগুলি) হিসাবে অনুমান করা, যেমন, ওএলএস সর্বাধিক সম্ভাবনা (একটি আনপেনালাইজড পদ্ধতি)। মডেলটি একই, এবং ব্যাখ্যা একই থাকে। এলএএসএসও-র সংখ্যাসূচক মানগুলি সাধারণত ওএলএসের সর্বোচ্চ সম্ভাবনা থেকে পৃথক হবে : কিছু শূন্যের কাছাকাছি থাকবে, অন্যগুলি হ'ল শূন্য হবে। যদি একটি বুদ্ধিমান পরিমাণ জরিমানা প্রয়োগ করা হয়, তবে লাসোর হিসাবগুলি ওএলএস সর্বাধিক সম্ভাবনার প্রাক্কলনের তুলনায় সত্য মানের সাথে আরও নিকটবর্তী হবে , যা একটি পছন্দসই ফলাফল।

ল্যাসিস্টিক রিগ্রেশন-এ লাসো থেকে নির্বাচিত বৈশিষ্ট্যগুলি ব্যবহার করা কি উপযুক্ত হবে?

এটির সাথে কোনও অন্তর্নিহিত সমস্যা নেই, তবে আপনি কেবল বৈশিষ্ট্য নির্বাচনের জন্য নয় তবে গুণাগুণ অনুমানের জন্যও লাসো ব্যবহার করতে পারেন। যেমন আমি উপরে উল্লেখ করেছি, লাসোর হিসাবগুলি ওএলএস সর্বাধিক সম্ভাবনার অনুমানের চেয়ে আরও সঠিক হতে পারে ।


এই প্রতিক্রিয়ার জন্য আপনাকে অনেক ধন্যবাদ! বোধগম্য করে তোলে! এই বিষয়ে আমার সীমিত জ্ঞান ক্ষমা করুন। যেমন আপনি অন্য একটি মন্তব্যে উল্লেখ করেছেন যে আমি ক্যাসেটের মাধ্যমে লাসো না হয়ে ইলাস্টিক নেট ব্যবহার করছিলাম কারণ এটি অনুকূল ল্যাম্বদা এবং আলফা পছন্দ করে। সহগের ক্ষেত্রেও কি একই প্রযোজ্য?
মাইকেল লু

হ্যাঁ এটা হবে. প্রাথমিক যুক্তি একই থাকে remains
রিচার্ড হার্ডি

আপনি লিখুন "ব্যাখ্যা একই থাকে"। আপনি কি আমাকে এই বিষয়টি বুঝতে সাহায্য করতে পারেন? এটি আমার কাছে মনে হয় যে একাধিক রিগ্রেশন সেটিংয়ে ওএলএস সহগের ব্যাখ্যা আংশিক রিগ্রেশন প্লটের উপর নির্ভর করে । যাইহোক, এই সম্পত্তিটি লাসো সহগের পক্ষে রাখে না, আমাকে ব্যাখ্যাটি ভিন্ন হবে বলে বিশ্বাস করতে নেতৃত্ব দেয়।
ব্যবহারকারী795305

1
@ বেন, আমরা যদি একটি অন্তর্নিহিত পরিসংখ্যানের মডেল ধরে নিই তবে আমরা এর পরামিতিগুলি বিভিন্ন উপায়ে অনুমান করতে পারি, দুটি জনপ্রিয় ওএলএস এবং লাসো। অনুমানযুক্ত সহগগুলি একই লক্ষ্যবস্তুগুলিকে লক্ষ্য করে এবং উভয়ের মধ্যে কিছু অনুমানের ত্রুটি থাকে (যা যদি স্কোয়ার করা হয় তবে পক্ষপাত এবং বৈকল্পিকতায় বিভক্ত হতে পারে), সুতরাং এই অর্থে তাদের ব্যাখ্যাটি একই is এখন অবশ্যই পদ্ধতিগুলি এক নয়, তাই আপনি বিভিন্ন আনুমানিক সহগের মান পান। আপনি যদি পদ্ধতিগুলি এবং তাদের বীজগণিত এবং জ্যামিতিক ব্যাখ্যা ব্যাখ্যা করেন তবে এগুলি এক নয়। তবে বিষয়বস্তুর ব্যাখ্যা একই রকম।
রিচার্ড হার্ডি

(1,,p)T
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.