কেন কার্নেলাইজড এসভিএমগুলির সাথে কাজ করার সময় লোকেরা চতুষ্কোণ প্রোগ্রামিং কৌশল (যেমন এসএমও) ব্যবহার করে? গ্রেডিয়েন্ট বংশোদ্ভূত কি সমস্যা? কার্নেলগুলি ব্যবহার করা কি অসম্ভব বা এটি খুব ধীর (এবং কেন?)।
এখানে আরও একটি প্রসঙ্গ এখানে দেওয়া হয়েছে: এসভিএমগুলি আরও ভালভাবে বোঝার চেষ্টা করে, আমি নিম্নলিখিত ব্যয়ের ফাংশনটি ব্যবহার করে লিনিয়ার এসভিএম শ্রেণিবদ্ধকে প্রশিক্ষণের জন্য গ্রেডিয়েন্ট ডেসেন্ট ব্যবহার করেছি:
আমি নিম্নলিখিত স্বরলিপি ব্যবহার করছি:
- মডেলের বৈশিষ্ট্য ওজন এবং এর বায়াস প্যারামিটার।
- হয় প্রশিক্ষণ উদাহরণস্বরূপ এর বৈশিষ্ট্য ভেক্টর।
- জন্য লক্ষ্য শ্রেণী (-1 বা 1) হল উদাহরণস্বরূপ।
- হল প্রশিক্ষণের উদাহরণগুলির সংখ্যা।
- নিয়মিতকরণ হাইপারপ্যারামিটার।
আমি এই সমীকরণটি থেকে একটি (উপ) গ্রেডিয়েন্ট ভেক্টর ( এবং সাথে সম্মত ) পেয়েছি এবং গ্রেডিয়েন্ট বংশোদ্ভূত ঠিকঠাক কাজ করেছেন worked
যদি খুব ধীর হয়, তবে কেন? ব্যয় ফাংশন উত্তল নয়? অথবা এটি কারণ যে গ্রেডিয়েন্টটি খুব দ্রুত পরিবর্তিত হয় (এটি লিপচিটজ অবিচ্ছিন্ন নয়) তাই অ্যালগরিদম উত্থানের সময় উপত্যকাগুলির ওপারে ঝাঁপিয়ে পড়ে, তাই এটি খুব ধীরে ধীরে রূপান্তরিত হয়? তবুও কীভাবে এটি চতুর্ভুজ প্রোগ্রামিংয়ের সময়ের জটিলতার চেয়ে খারাপ হতে পারে, যা ? ? যদি এটি স্থানীয় মিনিমার কথা হয় তবে স্টোকাস্টিক জিডি কি অনুকরণযুক্ত অ্যানেলিং দিয়ে তাদের কাটিয়ে উঠতে পারে না?