এক ঘন্টার পরীক্ষার পরে আমি যে সমাধানটি পৌঁছেছি তা সাধারণত মাত্র 100 পর্বগুলিতে রূপান্তরিত হয় ।
হ্যাঁ, আমি জানি এটির মধ্যে স্মুটেস্ট সিদ্ধান্তের সীমানা নেই তবে এটি বেশ দ্রুত রূপান্তরিত হয়।
আমি এই সর্পিল পরীক্ষা থেকে কয়েকটি জিনিস শিখেছি: -
- আউটপুট স্তরটি ইনপুট স্তরের চেয়ে বড় বা সমান হওয়া উচিত । এই সর্পিল সমস্যার ক্ষেত্রে আমি কমপক্ষে এটি লক্ষ্য করেছি।
- এক্ষেত্রে ০.০ এর মতো প্রাথমিক শিক্ষার হারকে উচ্চ রাখুন , তারপরে আপনি 3-5% বা তার চেয়ে কম পরীক্ষার ত্রুটির কাছে পৌঁছানোর সাথে সাথে শিক্ষার হার একটি খাঁজ (0.03) বা দুটি দ্বারা হ্রাস করুন। এটি দ্রুত রূপান্তরিত করতে সহায়তা করে এবং বিশ্বব্যাপী মিনিমাতে ঝাঁপিয়ে পড়া এড়ানো যায়।
- উপরের ডানদিকে ত্রুটি গ্রাফটি পরীক্ষা করে আপনি শিখার হারকে উচ্চ রাখার প্রভাবগুলি দেখতে পাচ্ছেন।
- ১, ০. এর মতো ছোট ব্যাচের আকারের জন্য লার্নিং হার খুব বেশি কারণ মডেলটি বিশ্বব্যাপী মিনিমাকে ঘুরিয়ে দেওয়ার সাথে সাথে রূপান্তর করতে ব্যর্থ হয়।
- সুতরাং, আপনি যদি উচ্চ শিক্ষার হার (0.1) রাখতে চান তবে ব্যাচের আকারও উচ্চ (10) রাখুন। এটি সাধারণত একটি ধীর অথচ মসৃণ রূপান্তর দেয়।
কাকতালীয়ভাবে যে সমাধানটি আমি নিয়ে এসেছি তা সালভাদোর ডালির সাথে সাদৃশ্যপূর্ণ ।
দয়া করে কোনও মন্তব্য যুক্ত করুন, যদি আপনি আরও কোনও স্বজ্ঞাত বা যুক্তি খুঁজে পান।