গ্রেডিয়েন্ট বংশদ্ভুত সম্পর্কে অনেক টিউটোরিয়াল অনলাইন আলোচনা করে এবং প্রায় সকলেই একটি নির্দিষ্ট ধাপের আকার (শিক্ষার হার ) ব্যবহার করে। লাইন অনুসন্ধানের কোনও ব্যবহার নেই কেন (যেমন ব্যাকট্র্যাকিং লাইন অনুসন্ধান বা সঠিক লাইন অনুসন্ধান)?
গ্রেডিয়েন্ট বংশদ্ভুত সম্পর্কে অনেক টিউটোরিয়াল অনলাইন আলোচনা করে এবং প্রায় সকলেই একটি নির্দিষ্ট ধাপের আকার (শিক্ষার হার ) ব্যবহার করে। লাইন অনুসন্ধানের কোনও ব্যবহার নেই কেন (যেমন ব্যাকট্র্যাকিং লাইন অনুসন্ধান বা সঠিক লাইন অনুসন্ধান)?
উত্তর:
ভ্যানিলা গ্রেডিয়েন্ট বংশদ্ভুত লাইন অনুসন্ধানগুলি ব্যবহার করে আরও নির্ভরযোগ্য করা যেতে পারে; আমি অ্যালগরিদম লিখেছি যা এটি করে এবং এটি একটি খুব স্থিতিশীল অ্যালগরিদম তৈরি করে (যদিও দ্রুত প্রয়োজন হয় না)।
যাইহোক, স্টোকাস্টিক গ্রেডিয়েন্ট পদ্ধতির জন্য একটি লাইন অনুসন্ধান করতে প্রায় কোনও বুদ্ধি নেই । আমি এটি বলার কারণটি হ'ল যদি আমরা সম্পূর্ণ ক্ষতির কার্যকারিতা হ্রাস করার উপর ভিত্তি করে একটি লাইন অনুসন্ধান করি, আমরা তত্ক্ষণাত স্টোকাস্টিক পদ্ধতিগুলি করার প্রধান প্রেরণা হারিয়ে ফেলেছি; আমাদের এখন প্রতিটি আপডেটের জন্য সম্পূর্ণ ক্ষতির ফাংশন গণনা করতে হবে, যার মধ্যে সম্পূর্ণরূপে প্রথম ডেরাইভেটিভ গণনার সাথে তুলনামূলকভাবে গণনা ব্যয় হয়। গণনাগত ব্যয়ের কারণে আমরা সম্পূর্ণ গ্রেডিয়েন্টের কম্পিউটিং এড়াতে চেয়েছি বলে দেওয়া হয়েছে, এটি খুব কমই বলে মনে হচ্ছে যে আমরা সম্পূর্ণ ক্ষতির ক্রিয়াকলাপটি ঠিক করতে চাই।
বিকল্পভাবে, আপনি এলোমেলোভাবে নমুনাযুক্ত ডেটা পয়েন্টের উপর ভিত্তি করে লাইন অনুসন্ধানের মতো কিছু করার কথা ভাবতে পারেন। তবে এটিও ভাল ধারণা নয়; এটি আপনাকে খুব বেশি দূরে সরে গিয়েছে কিনা (যা লাইন অনুসন্ধানগুলির মূল উপকার) তা সম্পর্কে আপনাকে কিছু বলবে না। উদাহরণস্বরূপ, ধরুন আপনি লজিস্টিক রিগ্রেশন করছেন। তারপরে প্রতিটি ফলাফল কেবল একটি 0 বা 1 হয় এবং যে কোনও একক নমুনার জন্য আমরা তুচ্ছভাবে নির্ভুল পৃথকীকরণ পাই তাই 1 এর নমুনার উপর ভিত্তি করে আমাদের রিগ্রেশন প্যারামিটারের সর্বোত্তম সমাধানটি তুচ্ছ বা ∞ হউক ডোনার প্রভাব দ্বারা। এটা ভালো না.
সম্পাদনা
@ ডেলটাইভ উল্লেখ করেছেন যে এটি কেবলমাত্র স্বতন্ত্র নমুনাগুলি নয়, মিনি-ব্যাচের ক্ষেত্রেও প্রযোজ্য।
টিউটোরিয়ালগুলি সম্ভবত গ্রেডিয়েন্ট বংশোদ্ভূত সম্পর্কে কথা বলে কারণ এটি অপটিমাইজেশনের জন্য ব্যবহৃত অন্যতম সহজ অ্যালগরিদম, তাই এটি ব্যাখ্যা করা সহজ। যেহেতু এই জাতীয় বেশিরভাগ টিউটোরিয়াল সংক্ষিপ্ত, তাই তারা সাধারণ স্টাফগুলিতে ফোকাস করে। গভীর গ্রেডিয়েন্ট বংশদ্ভুতের বাইরে কমপক্ষে কয়েকটি জনপ্রিয় অপ্টিমাইজেশন অ্যালগরিদম রয়েছে যা গভীর শিক্ষার জন্য ব্যবহৃত হয়। প্রকৃতপক্ষে লোকেরা প্রায়শই বিভিন্ন অ্যালগরিদমগুলি ব্যবহার করে তারপরে গ্রেডিয়েন্ট বংশোদ্ভূত হয় কারণ তারা সাধারণত দ্রুত রূপান্তর করে। তাদের মধ্যে কিছুতে অবিচ্ছিন্ন শেখার হার রয়েছে (যেমন সময়ের সাথে সাথে হ্রাস পাচ্ছে)। এই জাতীয় অ্যালগরিদমগুলির পর্যালোচনার জন্য আপনি সেবাস্তিয়ান রুডার (বা আর্কাইভস পেপার ) দ্বারা গ্রেডিয়েন্ট বংশদ্ভুত অপ্টিমাইজেশন অ্যালগরিদম পোস্টের একটি ওভারভিউ পরীক্ষা করতে পারেন ।