আমরা কেন তখনকার অন্যান্য নিউরাল নেটওয়ার্কগুলির জন্য গ্রেডিয়েন্ট শালীনতার জন্য অ ধ্রুবক শিক্ষার হারগুলি ব্যবহার করি না?


14

গভীর শেখার সাহিত্য গ্রেডিয়েন্ট বংশোদ্ভূত অ-ধ্রুবক শিক্ষার হার ব্যবহার করে চতুর কৌশল দ্বারা পূর্ণ। ক্ষতিকারক ক্ষয়, আরএমএসপ্রপ, অ্যাডাগ্রাড ইত্যাদির মতো বিষয়গুলি কার্যকর করা সহজ এবং প্রতিটি গভীর শেখার প্যাকেজে পাওয়া যায়, তবুও এগুলি নিউরাল নেটওয়ার্কগুলির বাইরে অস্তিত্বহীন বলে মনে হয়। এটির জন্যে কোন কারণ আছে কি? যদি এটি হয় যে লোকেরা কেবল যত্ন করে না, এমন কোনও কারণ আছে যা আমাদের নিউরাল নেটওয়ার্কগুলির বাইরে যত্ন নিতে হবে না?


2
আমি মনে করি লাইন অনুসন্ধান বা বিশ্বাসের অঞ্চল পদ্ধতিটি "অ-ধ্রুবক" শেখার হার।
হাইটাও ডু

2
অনেকগুলি অ-ধ্রুবক গ্রেডিয়েন্ট পদ্ধতি রয়েছে যা এনএন থেকে স্বাধীনভাবে বিকাশ করা হয়েছিল। বারজিলাই-বোরউইন জিডি এবং নেস্টারভ জিডি দুটি বিশিষ্ট উদাহরণ।
সাইকোরাক্স বলছেন

@ সাইকোরাক্স কিন্তু তারা কি এনএনএস এর বাইরে প্রতিদিন ভিত্তিতে ব্যবহার হয়?
টিম

2
@ টিম আমি বলতে পারি না। যখন আমাকে এনএন এর বাইরে স্থানীয় অনুসন্ধান করার দরকার পড়ে তখন আমার কাছে দ্বিতীয়-আদেশের পদ্ধতিগুলি ব্যবহার করার বিলাসিতা থাকে। তবে আমি এই উপলক্ষে দ্রুত জিডি পদ্ধতি সম্পর্কে জানতে পেরে আগ্রহী ছিলাম যে আমার পিছনে পকেটে একটি সুন্দর কৌশল থাকতে পারে।
সাইকোরাক্স বলছেন 18-29 এ পুনরায় ইনস্টল করুন মনিকা

1
এটি লক্ষণীয় যে (আমার আশ্চর্যরূপে) আমি এমন কেস পেয়েছি যেগুলি জিবিএমগুলি স্থিরভাবে শেখার হারগুলি ব্যবহার করে না, কিছুটা লোকের অবাক করে দেয়। একটি বিশেষ উদাহরণ হ'ল লাইটজিবিএম-তে ডার্ট বাস্তবায়ন। যদিও মূল কাগজপত্রগুলি ক্রমবর্ধমান ছোট এলআর ব্যবহার করে না প্রকৃত প্রয়োগটি ডিফল্টরূপে করে।
usεr11852

উত্তর:


16

অস্বীকৃতি: আমার নিউরাল নেটওয়ার্কগুলির বাইরে অপ্টিমাইজেশনের সাথে এত অভিজ্ঞতা নেই, সুতরাং আমার উত্তরটি স্পষ্টভাবে পক্ষপাতমূলক হবে, তবে বেশ কয়েকটি বিষয় যা ভূমিকা পালন করে:

  • (গভীর) নিউরাল নেটওয়ার্কগুলির অনেকগুলি পরামিতি রয়েছে । এর বেশ কয়েকটি নিদর্শন রয়েছে:

    প্রথমত, হেসিয়ান এবং উচ্চতর ডেরাইভেটিভগুলি গণনা করা অযোগ্য হয়ে ওঠার কারণে এটি উচ্চতর আদেশের পদ্ধতিগুলি বিভক্ত করে। অন্যান্য ডোমেনে, এসজিডি-তে কোনও টুইটের চেয়ে এটি কার্যকর একটি বৈধ পন্থা হতে পারে।

    দ্বিতীয়ত, এসজিডি দুর্দান্ত হলেও এটি ব্যবহারিকভাবে ধীর হয়ে যায়। এই উন্নত এসজিডি বৈকল্পিকগুলি প্রধানত দ্রুত প্রশিক্ষণ সক্ষম করে, এসজিডির কয়েকটি দুর্দান্ত বৈশিষ্ট্য সম্ভাব্যভাবে হারাতে পারার পরে । অন্যান্য ডোমেনগুলিতে, এসজিডি প্রশিক্ষণের সময় বাধা হতে পারে না, সুতরাং এটির গতি বাড়ানোর মাধ্যমে প্রাপ্ত উন্নতিগুলি কেবল নগণ্য।

  • প্রশিক্ষণ (গভীর) নিউরাল নেটওয়ার্কগুলি নন-উত্তল অপ্টিমাইজেশন এবং ক্ষেত্রের উল্লেখযোগ্য উত্তল শিথিলতার ফলাফল সম্পর্কে আমি অবগত নই। অন্যান্য ক্ষেত্রের মতো নয়, নিউরাল নেটওয়ার্কগুলি বিশ্বব্যাপী অনুকূল সমাধানগুলির দিকে মনোনিবেশ করে না, এটি অপ্টিমাইজেশনের সময় লোকসানের পৃষ্ঠ এবং তার ট্র্যাভারসাল সম্পর্কিত বৈশিষ্ট্যগুলি উন্নত করতে আরও প্রচেষ্টা বিনিয়োগের দিকে পরিচালিত করে।

    অন্যান্য ক্ষেত্রে, উত্তল শিথিলকরণ নিয়োগ এবং বিশ্বব্যাপী অনুকূল সমাধানগুলি গ্রহণ অপ্টিমাইজেশন অ্যালগরিদমের পরিবর্তে আগ্রহের কেন্দ্রে থাকতে পারে, কারণ সমস্যাটি একবার উত্তল সমস্যা হিসাবে সংজ্ঞায়িত করা গেলে, অপ্টিমাইজেশন অ্যালগরিদমের পছন্দ সমাধানের মানকে উন্নত করতে পারে না ।

আমি মনে করি এই উত্তরটি সমস্ত সম্ভাব্য দিকগুলি কভার করে না এবং আমি নিজেই অন্যান্য মতামত সম্পর্কে আগ্রহী।


সুতরাং আপনি মূলত বলছেন যে অন্যান্য সমস্যাগুলি অনেক সহজ, তাই কৌশলগুলির দরকার নেই এবং ভ্যানিলা এসজিডি কি তাদের পক্ষে যথেষ্ট?
টিম

3
এটি আমার বার্তাটি বোঝাচ্ছে। 1) কিছু সমস্যা উচ্চতর অর্ডার পদ্ধতি ব্যবহার করতে পারে, অভিযোজক এসজিডির প্রয়োজন হয় না। 2) কিছু সমস্যা আমদাহলের আইনের কারণে এসজিডি উন্নতি থেকে উপকৃত হতে পারে না। 3) কিছু সমস্যা উত্তল সমাধান দিতে পারে এবং প্রধান অসুবিধা তাদের উত্তল হিসাবে উত্থাপন হয়। এর কোনটিই বলে না যে অন্যান্য সমস্যাগুলি গভীর শিক্ষার চেয়ে সহজতর নয়, বরং ব্যাখ্যা করে কেন এসজিডি উন্নতি করা তাদের মনোযোগের কেন্দ্রে নয়।
জান কুক্কাকা

একটি সম্ভাব্য পয়েন্ট 4: আপনি যদি অন্য কোনও পদ্ধতি গ্রহণ করেন এবং অত্যাধুনিক গ্রেডিয়েন্ট বংশদ্ভুত পদ্ধতিগুলি থেকে উপকৃত হওয়ার জন্য এটি যথেষ্ট জটিল (উচ্চ মাত্রিক, ননলাইনার, ননকনভেক্স) করেন তবে এটিকে সম্ভবত নিউরাল নেটওয়ার্ক বলা হবে।
নাথানিয়েল

1
@ জানকুকাকা আমি জানি, আপনার উত্তরটি পরোক্ষ হওয়ার কারণে আমি স্পষ্টতার সন্ধান করছিলাম
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.