এসভিএম-এ নিয়মিতকরণ প্যারামিটারের অন্তর্দৃষ্টি


11

কোনও এসভিএম-এ নিয়মিতকরণ পরামিতি পরিবর্তিতকরণ কীভাবে অ-বিচ্ছেদযোগ্য ডেটাসেটের সিদ্ধান্তের সীমানা পরিবর্তন করে? সীমাবদ্ধ আচরণগুলি সম্পর্কে একটি ভিজ্যুয়াল উত্তর এবং / অথবা কিছু মন্তব্য (বড় এবং ছোট নিয়মিতকরণের জন্য) খুব সহায়ক হবে।

উত্তর:


17

নিয়মিতকরণ প্যারামিটার (ল্যাম্বদা) একটি ডিগ্রি গুরুত্ব হিসাবে কাজ করে যা মিস-শ্রেণিবদ্ধকরণকে দেওয়া হয়। এসভিএম একটি চতুষ্কোণ অপ্টিমাইজেশান সমস্যা সৃষ্টি করে যা উভয় শ্রেণির মধ্যে মার্জিন সর্বাধিককরণ এবং মিস-শ্রেণিবদ্ধকরণের পরিমাণ হ্রাস করার জন্য দেখায়। যাইহোক, বিচ্ছেদ-বিহীন সমস্যার জন্য, সমাধানের সমাধানের জন্য, মিস-শ্রেণিবদ্ধকরণের সীমাবদ্ধতাটি শিথিল করা উচিত, এবং এটি উল্লিখিত "নিয়মিতকরণ" সেট করে সম্পন্ন করা হয়েছে।

সুতরাং, স্বজ্ঞাতভাবে, লাম্বদা যত বড় হবে ততই ভুলভাবে শ্রেণিবদ্ধ উদাহরণগুলি অনুমোদিত (বা ক্ষতির ক্ষেত্রে সবচেয়ে বেশি দামের বেতন দেওয়া হবে) অনুমোদিত। তারপরে ল্যাম্বদা যখন অসীমের দিকে ঝুঁকে তখন সমাধানটি হার্ড-মার্জিনের দিকে ঝুঁকে পড়ে (কোনও মিস-শ্রেণিবদ্ধকরণের অনুমতি দেয় না)। যখন ল্যাম্বদা 0 তে থাকে (0 না হয়ে) তত বেশি মিস-শ্রেণিবদ্ধকরণ অনুমোদিত হয়।

এই দুটি এবং সাধারণত ছোট ল্যাম্বডাসের মধ্যে অবশ্যই একটি বাণিজ্য রয়েছে, তবে খুব ছোট নয়, ভাল করে নিন সাধারণভাবে। রৈখিক এসভিএম শ্রেণিবদ্ধকরণ (বাইনারি) জন্য তিনটি উদাহরণ নীচে দেওয়া হয়েছে।

লিনিয়ার এসভিএম ল্যাম্বদা = 0.1 লিনিয়ার এসভিএম ল্যাম্বদা = 1 এখানে চিত্র বর্ণনা লিখুন

লিনিয়ার-কার্নেল এসভিএম-এর ক্ষেত্রে ধারণাটি একই রকম similar এটি প্রদত্ত, ল্যাম্বদার উচ্চ মানের জন্য ওভারফিটিংয়ের উচ্চতর সম্ভাবনা রয়েছে, তবে ল্যাম্বদার নিম্ন মানের জন্য আন্ডারফিট করার উচ্চতর সম্ভাবনা রয়েছে।

নীচের চিত্রগুলি আরবিএফ কার্নেলের জন্য আচরণ দেখায়, সিগমা প্যারামিটারটি 1 এ স্থির করে এবং ল্যাম্বদা = 0.01 এবং ল্যাম্বদা = 10 চেষ্টা করে

আরবিএফ কার্নেল এসভিএম ল্যাম্বদা = 0.01 আরবিএফ কার্নেল এসভিএম ল্যাম্বদা = 10

আপনি বলতে পারবেন যে প্রথম চিত্র যেখানে ল্যাম্বডা কম রয়েছে সেখানে দ্বিতীয় চিত্রের চেয়ে বেশি "স্বাচ্ছন্দ্য" যেখানে ডেটা আরও সুনির্দিষ্টভাবে লাগানো হবে।

(অধ্যাপক ওরিওল পুজোলের স্লাইডস। ইউনিভার্সিটিট ডি বার্সেলোনা)


চমৎকার ছবি! এগুলি কি আপনি নিজে তৈরি করেছেন? যদি হ্যাঁ, সম্ভবত আপনি তাদের আঁকার জন্য কোডটি ভাগ করতে পারেন?
আলেক্সি গ্রিগোরভ

চমৎকার গ্রাফিক্স। পাঠ্যটি থেকে শেষ দুটি => সম্পর্কিত বিষয়ে একজন স্পষ্টতই মনে করবে প্রথম চিত্রটি ল্যাম্বডা = 0.01 সহ একটি, তবে আমার বোধ থেকে (এবং শুরুতে গ্রাফের সাথে সামঞ্জস্যপূর্ণ হওয়া) এটি ল্যাম্বডা = 10 সহকারে একটি কারণ এটি স্বল্পতম নিয়মিতকরণ (সবচেয়ে বেশি চাপ দেওয়া, সবচেয়ে স্বচ্ছন্দ) সহ একটি with
উইম 'টাইটে' থিলস

^ এটি আমার বোধগম্যতাও বটে। দুটি বর্ণের গ্রাফের শীর্ষে স্পষ্টভাবে ডেটা আকারের আরও সংকোচ দেখায়, সুতরাং গ্রাফটি অবশ্যই যেখানে এসভিএম সমীকরণের মার্জিনটি উচ্চতর ল্যাম্বডায় অনুকূল ছিল। দুটি রঙের গ্রাফের নীচে তথ্যের আরও স্বচ্ছন্দ শ্রেণিবিন্যাস দেখানো হয় (কমলা অঞ্চলে নীল রঙের ছোট গুচ্ছ) যার অর্থ শ্রেণিবিন্যাসে ত্রুটির পরিমাণ হ্রাস করার চেয়ে মার্জিন ম্যাক্সিমাইজেশনের পক্ষে ছিল না।
ব্রায়ান অ্যামিবিলি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.