SVM এর সমান RLU অ্যাক্টিভেশন সহ একক স্তর নিউরাল নেটওয়ার্ক?


10

ধরুন আমার কাছে এন ইনপুট এবং একটি একক আউটপুট (বাইনারি শ্রেণিবদ্ধকরণ টাস্ক) সহ একটি সাধারণ একক স্তর নিউরাল নেটওয়ার্ক রয়েছে। যদি আমি সিগময়েড ফাংশন হিসাবে আউটপুট নোডে অ্যাক্টিভেশন ফাংশনটি সেট করি- তবে ফলাফলটি লজিস্টিক রিগ্রেশন শ্রেণিবদ্ধ হয়।

এই একই দৃশ্যে, যদি আমি আউটপুট অ্যাক্টিভেশনটিকে রিলু (সংশোধিত লিনিয়ার ইউনিট) তে পরিবর্তন করি, তবে ফলাফলের কাঠামোটি কি কোনও এসভিএমের মতো বা অনুরূপ?

না হলে কেন?


কেন এটি হতে পারে সে সম্পর্কে আপনার কোনও অনুমান আছে? একক পারসেপ্ট্রন = লজিস্টিক হ'ল কারণ সক্রিয়করণের কারণ - এগুলি মূলত একই মডেল, গাণিতিকভাবে (যদিও ভিন্নভাবে প্রশিক্ষিত হতে পারে) - লিনিয়ার ওজন + ম্যাট্রিক্স গুণনের ক্ষেত্রে একটি সিগময়েড প্রয়োগ করা হয়। এসভিএমগুলি বেশ আলাদাভাবে কাজ করে - তারা ডেটা আলাদা করার জন্য সেরা লাইন সন্ধান করে - এগুলি "ভারী" / "ম্যাট্রিক্সির" চেয়ে বেশি জ্যামিতিক। আমার জন্য, আরএলইউ সম্পর্কে এমন কিছু নেই যা আমাকে ভাবতে হবে = আহ, এগুলি একটি এসভিএমের মতো। (লজিস্টিক এবং লিনিয়ার এসভিএম যদিও খুব একইভাবে পারফর্ম করতে থাকে)
মেটজুশ

একটি এসএমএমের সর্বাধিক-মার্জিন উদ্দেশ্য এবং রিলু অ্যাক্টিভেশন ফাংশনটি একই দেখায়। সুতরাং প্রশ্ন।
এডি

"এসভিএমগুলি পুরোপুরি আলাদাভাবে কাজ করে - তারা ডেটা পৃথক করার জন্য সেরা লাইন সন্ধান করে - এগুলি" ভারী "/" ম্যাট্রিক্সির "চেয়ে বেশি জ্যামিতিক a এবং perceptron।
খ্রি

উত্তর:


11

হতে পারে যা আপনাকে আরএলইউ সম্পর্কে ভাবায় তা হ'ল এসভিএমগুলির হিন্জ লস , তবে ক্ষতি আউটপুট অ্যাক্টিভেশন ফাংশনটিকে অ-নেগেটিভ (আরএলইউ) হিসাবে সীমাবদ্ধ করে না।E=max(1ty,0)

নেটওয়ার্ক ক্ষয়টি এসভিএমগুলির একই আকারে হওয়ার জন্য, আমরা কেবল আউটপুট স্তরটির বাইরে থাকা কোনও অ-রৈখিক অ্যাক্টিভেশন ফাংশন সরিয়ে ফেলতে পারি, এবং ব্যাকপ্রসারণের জন্য কব্জি ক্ষতি ব্যবহার করতে পারি।

তদুপরি, আমরা যদি ক্ষতি সাথে প্রতিস্থাপন করি (যা ক্ষতির মসৃণ সংস্করণের মতো দেখায়), তবে আমরা সাধারণ সিগময়েড + ক্রস-এন্ট্রপি নেটওয়ার্ক হিসাবে লজিস্টিক রিগ্রেশন করব। এটি সিগময়েড ফাংশনটিকে আউটপুট স্তর থেকে ক্ষতির দিকে নিয়ে যাওয়ার কথা ভাবা যেতে পারে।E=ln(1+exp(ty))

সুতরাং ক্ষতির ক্রিয়াকলাপগুলির ক্ষেত্রে, এসভিএম এবং লজিস্টিক রিগ্রেশন বেশ কাছাকাছি, যদিও এসভিএমগুলি সমর্থন ভেক্টরের উপর ভিত্তি করে প্রশিক্ষণ এবং অনুমানের জন্য খুব আলাদা অ্যালগরিদম ব্যবহার করে।

প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং বইয়ের .1.১.২ বিভাগে এসভিএম এবং লজিস্টিক রিগ্রেশন সম্পর্কিত এবং একটি চমৎকার আলোচনা রয়েছে ।

এখানে চিত্র বর্ণনা লিখুন


বইটি নির্দেশ করার জন্য ধন্যবাদ সুতরাং আমি একটি ধারণা পেয়ে যাচ্ছি যে অ্যাক্টিভেশন ফাংশন বাদে আসল পার্থক্যটি ব্যবহৃত অপটিমাইজেশন অ্যালগরিদমগুলিতে। এলআর এর জন্য আমরা সাধারণ অনিয়ন্ত্রিত গ্রেডিয়েন্ট বংশদ্ভুত ব্যবহার করতে পারি, এসভিএম-এ আমরা সাধারণত একটি সীমাবদ্ধ অপ্টিমাইজেশান সমাধান করি।
খ্রি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.