আপনি যে দুটি প্রথম অ্যালগরিদম উল্লেখ করেছেন (নেল্ডার-মিড এবং সিমুলেটেড অ্যানিলিং) সাধারণত অপটিমাইজেশন চেনাশোনাগুলিতে বেশ অপ্রচলিত হিসাবে বিবেচিত হয়, কারণ আরও অনেক ভাল বিকল্প রয়েছে যা উভয়ই নির্ভরযোগ্য এবং কম ব্যয়বহুল। জেনেটিক অ্যালগরিদমগুলি বিস্তৃত পরিসীমা জুড়ে এবং এর কয়েকটি যুক্তিসঙ্গত হতে পারে।
তবে ডেরিভেটিভ-ফ্রি অপ্টিমাইজেশনের (ডিএফও) অ্যালগরিদমগুলির বিস্তৃত শ্রেণিতে এমন অনেকগুলি রয়েছে যা এই "ক্লাসিকগুলি" থেকে তুলনামূলকভাবে ভাল, কারণ সাম্প্রতিক দশকগুলিতে এটি গবেষণার একটি সক্রিয় ক্ষেত্র ছিল। সুতরাং, এই নতুন পদ্ধতির কয়েকটি গভীর শিক্ষার পক্ষে যুক্তিযুক্ত হতে পারে?
আর্টের রাজ্যের তুলনায় তুলনামূলকভাবে সাম্প্রতিক একটি কাগজ নিম্নলিখিত:
রিওস, এলএম, এবং সহিনিডিস, এনভি (2013) ডেরিভেটিভ-মুক্ত অপ্টিমাইজেশন: অ্যালগরিদমগুলির একটি পর্যালোচনা এবং সফ্টওয়্যার বাস্তবায়নের তুলনা। জার্নাল অফ গ্লোবাল অপটিমাইজেশন।
এটি একটি দুর্দান্ত কাগজ যা সাম্প্রতিক কৌশলগুলির মধ্যে অনেক আকর্ষণীয় অন্তর্দৃষ্টি রয়েছে। উদাহরণস্বরূপ, ফলাফলগুলি পরিষ্কারভাবে দেখায় যে সর্বোত্তম স্থানীয় অপ্টিমাইজারগুলি হ'ল "মডেল-ভিত্তিক", ক্রমবর্ধমান কোয়াড্র্যাটিক প্রোগ্রামিং (এসকিউপি) এর বিভিন্ন ফর্ম ব্যবহার করে ।
তবে, তাদের বিমূর্তে উল্লিখিত হিসাবে "আমরা দেখতে পেয়েছি যে ভাল সমাধান পাওয়ার জন্য এই সমস্ত সমাধানকারীদের ক্ষমতা ক্রমবর্ধমান সমস্যার আকারের সাথে হ্রাস পাচ্ছে।" সংখ্যাগুলির ধারণা দেওয়ার জন্য, সমস্ত সমস্যার জন্য সমাধানকারীদের 2500 ফাংশন মূল্যায়নের একটি বাজেট দেওয়া হয়েছিল এবং অনুকূলিতকরণের জন্য সমস্যার আকারগুলি সর্বোচ্চ ~ 300 পরামিতি ছিল। ও [10] পরামিতিগুলির বাইরে, এই অপটিমাইজারগুলির মধ্যে খুব কমই খুব ভাল পারফরম্যান্স করেছে এবং সমস্যাগুলির আকার বৃদ্ধি পাওয়ায় সেরা পারফরম্যান্সে পারফরম্যান্সে একটি লক্ষণীয় ক্ষয়ও প্রদর্শিত হয়েছিল।
সুতরাং খুব উচ্চ মাত্রিক সমস্যার জন্য, ডিএফও অ্যালগরিদমগুলি কেবল ডেরাইভেটিভ ভিত্তিকগুলির সাথে প্রতিযোগিতামূলক নয়। কিছু দৃষ্টিকোণ দেওয়ার জন্য, PDE (আংশিক ডিফারেনশিয়াল সমীকরণ)-ভিত্তিক অনুকূলকরণ খুব উচ্চ মাত্রিক সমস্যাযুক্ত (যেমন, একটি বৃহত থ্রিডি সীমাবদ্ধ উপাদান গ্রিডের প্রতিটি কক্ষের জন্য কয়েকটি পরামিতি ) অন্য একটি ক্ষেত্র। এই রাজ্যে, " অ্যাডেজমেন্ট পদ্ধতি " সর্বাধিক ব্যবহৃত পদ্ধতিগুলির মধ্যে একটি। এটি একটি ফরোয়ার্ড মডেল কোডের স্বয়ংক্রিয় পার্থক্যের ভিত্তিতে গ্রেডিয়েন্ট-বংশোদ্ভূত অপ্টিমাইজার।
একটি হাই-ডাইমেনশনাল ডিএফও অপ্টিমাইজারের সবচেয়ে কাছাকাছিটি সম্ভবত এনসেম্বেল কালম্যান ফিল্টার , জটিল পিডিই সিমুলেশনগুলির উদাহরণ হিসাবে আবহাওয়ার মডেলগুলিতে ডেটা একীকরণের জন্য ব্যবহৃত হয়। মজার বিষয় হল এটি মূলত একটি এসকিউপি পদ্ধতি, তবে একটি বায়সিয়ান-গাউসিয়ান ব্যাখ্যার সাথে (সুতরাং চতুর্ভুজ মডেলটি ইতিবাচক সুনির্দিষ্ট, অর্থাত কোনও স্যাডল পয়েন্ট নয়)। তবে আমি মনে করি না যে এই অ্যাপ্লিকেশনগুলিতে পরামিতি বা পর্যবেক্ষণগুলির সংখ্যা গভীর শিক্ষায় দেখা যায় তার সাথে তুলনামূলক।
পার্শ্ব নোট (স্থানীয় মিনিমা): গভীর শিক্ষার উপর আমি যেটুকু পড়েছি তা থেকে আমি মনে করি যে sensকমত্যটি এটি স্থানীয় মিনিমার পরিবর্তে স্যাডল পয়েন্ট যা উচ্চ মাত্রিক এনএন-প্যারামিটার জায়গাগুলির জন্য সবচেয়ে সমস্যাযুক্ত।
উদাহরণস্বরূপ, প্রকৃতির সাম্প্রতিক পর্যালোচনা বলছে "সাম্প্রতিক তাত্ত্বিক এবং অভিজ্ঞতাবাদী ফলাফলগুলি দৃ strongly়ভাবে সুপারিশ করে যে স্থানীয় মিনিমা সাধারণভাবে কোনও গুরুতর সমস্যা নয় Instead পরিবর্তে, ল্যান্ডস্কেপটি একত্রিতভাবে প্রচুর পরিমাণে জিন পয়েন্টযুক্ত যেখানে গ্রেডিয়েন্টটি শূন্য, এবং পৃষ্ঠের কার্ভগুলি বেশিরভাগ মাত্রায় আপ হয় এবং বাকী অংশগুলিতে বক্ররেখা নীচে যায়। "
সম্পর্কিত উদ্বেগ স্থানীয় বনাম গ্লোবাল অপ্টিমাইজেশন সম্পর্কে (উদাহরণস্বরূপ মন্তব্যে এই প্রশ্নটি দেখানো হয়েছে)। যদিও আমি গভীর শেখা না করি, আমার অভিজ্ঞতার মধ্যে ওভারফিটিং অবশ্যই একটি বৈধ উদ্বেগ। আমার মতে, বৈশ্বিক অপ্টিমাইজেশন পদ্ধতি ইঞ্জিনিয়ারিং ডিজাইন সমস্যার জন্য সবচেয়ে উপযুক্ত যা "প্রাকৃতিক" ডেটার উপর দৃ .়ভাবে নির্ভর করে না। তথ্য আত্তীকরণ সমস্যার, যেকোন বর্তমান বৈশ্বিক মিনিমা সহজে নতুন তথ্য সংযোজন উপর পরিবর্তন হতে পারে (সতর্কীকরণ: আমার অভিজ্ঞতা হয় geoscience সমস্যা, যেখানে তথ্য সাধারণতঃ মডেল ধারণক্ষমতা থেকে "বিক্ষিপ্ত" আপেক্ষিক কেন্দ্রীভূত)।
একটি আকর্ষণীয় দৃষ্টিভঙ্গি সম্ভবত
ও। বাউসকেট এবং এল। বোটোউ (২০০৮) বড় আকারের শিক্ষার ট্রেড অফস । Nips।
যা কখন এবং কখন আনুমানিক অপ্টিমাইজেশন অনুশীলনে পছন্দনীয় হতে পারে সে সম্পর্কিত অর্ধ-তাত্ত্বিক যুক্তি সরবরাহ করে।
শেষ দ্রষ্টব্য (মেটা-অপ্টিমাইজেশন): যদিও গ্রেডিয়েন্ট ভিত্তিক কৌশলগুলি প্রশিক্ষণ নেটওয়ার্কগুলির জন্য প্রভাবশালী বলে মনে হয়, তবুও সম্পর্কিত মেটা-অপ্টিমাইজেশন কার্যগুলিতে ডিএফওর জন্য ভূমিকা থাকতে পারে।
একটি উদাহরণ হাইপার-প্যারামিটার টিউনিং হবে। (মজার বিষয় হল, রিওস এবং সহিনিডিসের সফল মডেল-ভিত্তিক ডিএফও অপ্টিমাইজারগুলি অবশ্যই পরীক্ষামূলকভাবে নকশা- প্রতিক্রিয়া / প্রতিক্রিয়া-পৃষ্ঠের সমস্যার সমাধান হিসাবে দেখা যেতে পারে ))
O[N2]notL1 মেটা-অপ্টিমাইজড হতে পারে))