লাম্বদা কেন "ন্যূনতম থেকে এক মান ত্রুটির মধ্যে" ইলাস্টিক নেট রিগ্রেশনে লাম্বদার জন্য প্রস্তাবিত মান হয়?


24

আমি বুঝতে পারি যে ল্যাম্বডা ইলাস্টিক-নেট রিগ্রেশনটিতে কী ভূমিকা পালন করে। এবং আমি বুঝতে পারি যে কেন একজন ল্যাম্বডা.মিন নির্বাচন করবেন, ল্যাম্বদার মান যা ক্রস বৈধতাযুক্ত ত্রুটি হ্রাস করে।

আমার প্রশ্ন হ'ল পরিসংখ্যানের সাহিত্যে কোথায় ল্যাম্বডা .১ ব্যবহার করার পরামর্শ দেওয়া হয়েছে, এটি লাম্বডার মান যা সিভি ত্রুটিটি এবং একটি স্ট্যান্ডার্ড ত্রুটি হ্রাস করে ? আমি একটি আনুষ্ঠানিক উদ্ধৃতি, বা কেন এটি প্রায়শই ভাল মান বলে একটি কারণ খুঁজে পেতে পারে না। আমি বুঝতে পারি যে এটি একটি আরও নিয়ন্ত্রিত নিয়মিতকরণ, এবং প্যারামিটারগুলি শূন্যের দিকে আরও সঙ্কুচিত করবে, তবে আমি লাম্বডা.মিনের চেয়ে ল্যাম্বডে .1 এর চেয়ে ভাল পছন্দ হিসাবে এমন অবস্থার বিষয়ে আমি সর্বদা নির্দিষ্ট নই। কেউ ব্যাখ্যা করতে সাহায্য করতে পারেন?


5
একটি আনুষ্ঠানিক রেফারেন্স হাসতি এট আল এ পাওয়া যাবে। "পরিসংখ্যানগত শিক্ষার উপাদানগুলি" পৃষ্ঠা lements১. তবে, তারা এই পছন্দটির পক্ষে খুব বেশি ন্যায়সঙ্গততা দেয় না ...
রিচার্ড হার্ডি

উত্তর:


22

ফ্রেডম্যান, হাসেটি এবং তিবশিরানী (২০১০) , স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদানগুলির বরাত দিয়ে লিখেছেন,

সেরা মডেলটি নির্বাচন করার সময় আমরা প্রায়শই "এক-মানক-ত্রুটি" বিধিটি ব্যবহার করি; এটি ঝুঁকির বক্ররেখা ত্রুটিযুক্ত হিসাবে অনুমান করা হয় যে সত্য স্বীকার করে, তাই পার্সিমনি পাশ।

অন্য কোনও পরিমাণের বিপরীতে একটি স্ট্যান্ডার্ড ত্রুটি ব্যবহার করার কারণ বলে মনে হচ্ছে এটি ভাল, মান ... Krstajic, এট আল (2014) লিখুন ( গা bold় জোর খনি):

ব্রেইমান এট আল। [25] শ্রেণিবদ্ধকরণ গাছের মডেলগুলির জন্য সর্বোত্তম গাছের আকার বাছাইয়ের ক্ষেত্রে দেখা গেছে যে ন্যূনতম ক্রস-বৈধতা ত্রুটিযুক্ত গাছের আকার একটি মডেল উত্পন্ন করে যা সাধারণত ওভারফিট। অতএব, তাদের বইয়ের ব্রেইমান এট আলার ৩.৪.৩ বিভাগে। [25] একটি অনুকূল গাছের আকার বেছে নেওয়ার জন্য একটি আদর্শ ত্রুটি বিধি (1 এসই নিয়ম) সংজ্ঞায়িত করুন এবং তারা পুরো বই জুড়ে এটি প্রয়োগ করে। একক ভি-ভাঁজ ক্রস-বৈধকরণের জন্য স্ট্যান্ডার্ড ত্রুটি গণনা করার জন্য, প্রতিটি ভাঁজটির জন্য নির্ভুলতা গণনা করা দরকার, এবং প্রতিটি তল থেকে মান যথাযথ ত্রুটি গণনা করা হয়। হাসিটি এট আল। []] সবচেয়ে পার্সিমোনিয়াস মডেল বাছাই হিসাবে 1 এসই বিধিটিকে সংজ্ঞায়িত করুন যার ত্রুটি সেরা মডেলের ত্রুটির চেয়ে এক মান ত্রুটির বেশি নয় এবং সাধারণ ক্রস-বৈধতা ব্যবহারের জন্য 1 এস বিধি ব্যবহার করে তারা বেশ কয়েকটি জায়গায় পরামর্শ দেয়।1 এসই নিয়মের মূল বিষয়, যার সাথে আমরা একমত, সবচেয়ে সহজ মডেলটি বেছে নেওয়া যাঁর নির্ভুলতা সেরা মডেলের সাথে তুলনীয়

λ


1
ধন্যবাদ! এখন অবশেষে উপযুক্ত কিছু উদ্ধৃত করতে পারি যখন ল্যাম্বদার "স্ট্যান্ডার্ড" পছন্দের সাথে অপরিচিত তাদের জন্য প্রশ্ন আসে। ক্রেস্টাজিক এট আল-এর লিঙ্কটিও দুর্দান্ত দেখাচ্ছে।
জেরেশ

এই উদ্ধৃতিটি কেবলমাত্র বলে "1se শ্রেণিবদ্ধের জন্য অনুকূল বলে মনে হয়েছিল "। তবে প্রশ্ন জিজ্ঞাসা করলেন রিগ্রেশন সম্পর্কে ! বিকল্প আছে। যদি আমরা উদাহরণস্বরূপ 2se তে ফিরে যাওয়ার চেষ্টা করি তবে আমরা সমস্যাটি পাই যে ল্যাম্বডা অনেক বড় এবং কফিটগুলি খুব বেশি সঙ্কুচিত করে। তবে আমরা উদাহরণস্বরূপ সেই মডেলটিকে পুনর্নির্মাণ করতে পারি যা মূল মডেলের ল্যাম্বদা .১ এ নির্বাচিত না সমস্ত ভেরিয়েবলগুলি বাদ দেয়।
smci

@ এসএমসি কোন উদ্ধৃতি? এটি আমি উদ্ধৃতকৃত কোটগুলির মধ্যে একটিও নয়, যা উভয়ই পরামর্শ দেয় যে 1-এসই বিধি কেবল শ্রেণিবিন্যাসের ক্ষেত্রে নয়, সাধারণভাবে প্রযোজ্য।
শ্যাডট্যালকার

6

ব্রেইমান এট আল-এর বই (ক্রাস্টাজিকের অন্যান্য উত্তরের উদ্ধৃতিতে উদ্ধৃত) হ'ল 1 এস রুলের জন্য আমি সবচেয়ে প্রাচীনতম উল্লেখ পেয়েছি।

এটি হলেন ব্রেইমান, ফ্রেডম্যান, স্টোন এবং ওলশনের শ্রেণিবদ্ধতা এবং রেগ্রেশন ট্রি (1984)। বিভাগটি 3.4.3 এ তারা এই নিয়মটি "উত্সাহিত" করে।

সুতরাং আপনার যদি কোনও আনুষ্ঠানিক উদ্ধৃতি প্রয়োজন হয় তবে এটি মূল উত্স বলে মনে হচ্ছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.