পরিসংখ্যানবিদরা যখন বলে তখন কী বোঝায় যে আমরা সত্যিই বুঝতে পারি না যে লাসো (নিয়মিতকরণ) কীভাবে কাজ করে?


10

আমি সম্প্রতি লাসোর (নিয়মিতকরণ) বিষয়ে কয়েকটি পরিসংখ্যানের আলোচনায় এসেছি এবং একটি বিষয় যা অব্যাহত রাখে তা হ'ল লাসো কেন কাজ করে বা কেন এটি এত ভাল কাজ করে তা আমরা সত্যই বুঝতে পারি না। আমি ভাবছি যে এই বিবৃতিটি উল্লেখ করছে। স্পষ্টতই আমি বুঝতে পারি কেন লাসো প্রযুক্তিগতভাবে কাজ করে, পরামিতিগুলি সঙ্কুচিত করে ওভারফিটিং প্রতিরোধের মাধ্যমে, তবে আমি ভাবছি যে এই জাতীয় বক্তব্যের পিছনে আরও গভীর অর্থ রয়েছে কিনা। কারো কি কোন ধারনা আছে? ধন্যবাদ!


1
"কাজ" সংজ্ঞায়িত করুন। ঠিক কি কাজ করে? স্পারসিটি বাড়াতে কাজ করে? ওভারফিটিং প্রতিরোধে কাজ করে? যুক্তিসঙ্গত পরিসংখ্যান পরীক্ষার উত্পাদন কাজ করে? - বা অন্যভাবে বলতে গেলে, এই প্রসঙ্গে "কাজ করছে না" এর অর্থ কী? - আপনি বর্তমান উত্তরের মন্তব্যগুলি থেকে দেখতে পাচ্ছেন, আপনি কী করছেন তা নিয়ে কিছুটা বিভ্রান্তি রয়েছে।
আরএম

@ আরএম, আপনি আসলে ওপি, আইএমএইচও-কে পুনরায় চাপ দিচ্ছেন। আপনার চিহ্নিত করতে সমস্যা হ'ল ওপি সম্ভবত একই অজানা পরে is
রিচার্ড হার্ডি

1
@ রিচার্ড হার্ডি আমি দেখতে পাচ্ছি যে এটি কীভাবে হতে পারে তবে আমি যদি আশা করি যে ওপি কমপক্ষে সেই পরিসংখ্যানের আলোচনায় প্রাসঙ্গিকভাবে প্রসারিত হতে পারে যে পরিসংখ্যান আলোচনায় এই বক্তা কী হতে পারে সে বিষয়ে আমাদের ফোকাস করতে আশাবাদী চিন্তা করা হয়েছে।
আরএম

@ আরএম, তখন ভাল।
রিচার্ড হার্ডি

উত্তর:


11

কার্যত পরিসংখ্যানবিদদের এবং লাসোর মতো পদ্ধতির ভিত্তি অধ্যয়নকারী শিখন তত্ত্ব সম্প্রদায়ের মধ্যে কখনও কখনও যোগাযোগের অভাব দেখা দেয়। লাসোর তাত্ত্বিক বৈশিষ্ট্যগুলি আসলে খুব ভালভাবে বোঝা যায়।

এই দস্তাবেজটিতে এটি উপভোগ করা সংখ্যক বৈশিষ্ট্যের 4 বিভাগে একটি সংক্ষিপ্তসার রয়েছে। ফলাফলগুলি বেশ প্রযুক্তিগত, তবে মূলত:

  • এটি উচ্চ সম্ভাবনা সহ বড় পরিমাণে ডেটাসেটের জন্য কিছু হালকা অনুমানের অধীনে একটি বিচ্ছিন্ন ওজন ভেক্টরের সত্য সমর্থন (অ-শূন্য প্রবেশের সেট) পুনরুদ্ধার করে।
  • যতক্ষণ না কলামগুলি খুব বেশি সম্পর্কযুক্ত না হয় ততক্ষণ নমুনার আকার বাড়ার সাথে সাথে এটি সর্বোত্তম হারে সঠিক ওজন ভেক্টরে রূপান্তরিত হয় ।X

3

লাসো কেন কাজ করে তা বোঝার মাধ্যমে যদি আপনি বোঝাচ্ছেন যে এটি বৈশিষ্ট্য নির্বাচন কেন সম্পাদন করে (অর্থাত কিছু বৈশিষ্ট্যের জন্য ওজন নির্ধারণ করা হয়) তবে আমরা এটি খুব ভালভাবে বুঝতে পারি:

ল্যাশোরিয়ান অপ্টিমাইজেশন হিসাবে নিয়মিতকরণ


4
একটি সুন্দর উদাহরণের জন্য ধন্যবাদ, তবে আমি সন্দেহ করি যে ওপি এটির আগ্রহী অংশ নয় Of অবশ্যই এটি পরিষ্কার করা ওপি-র বিষয়।
রিচার্ড হার্ডি

আমি আপনার চিত্রের বিন্দু (গুলি) বুঝতে পারি না।
মাইকেল আর চেরনিক

7
এল1λ^

4
@ চকন, আপনার পয়েন্টগুলি উত্তরের একটি দুর্দান্ত ভিত্তি তৈরি করেছে!
রিচার্ড হার্ডি

1
@ চকন, লাসোর সম্পর্কে আমরা কী বুঝি তা চিহ্নিত করে যদিও এটি দরকারী আলোচনা তৈরি করেছে বলে মনে হয়েছিল !
rinspy

2

মডেল নির্বাচনের ধারাবাহিকতার সাইন পুনরুদ্ধারের সমস্যা রয়েছে (যা পরিসংখ্যানবিদরা উত্তর দিয়েছেন ), এবং

অনুমানের সমস্যা রয়েছে (অনুমানের জন্য ভাল আত্মবিশ্বাসের অন্তর তৈরি করা), যা গবেষণার বিষয় পর্যন্ত is

বেশিরভাগ কাজ "শিক্ষণ তত্ত্ব সম্প্রদায়" না করে পরিসংখ্যানবিদরা করেন।


এটি ইতিমধ্যে যা দেওয়া হয়েছিল তাতে কীভাবে যুক্ত হবে?
মাইকেল আর চেরনিক

এখানে অনুমানের সমস্যাটির কথা কেউ উল্লেখ করেনি, কারণ আমি বিশ্বাস করি যে দাবীটি ("এটি ভালভাবে বোঝা যায় না") প্রথম কারণেই করা হয়েছিল।
গাও ঝেং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.