আমি ডিপ লার্নিংয়ের জন্য অ্যাডাম অপ্টিমাইজার সম্পর্কে পড়ছিলাম এবং নীচের বাক্যটি পেরিয়েছিলাম ডিগ্র লার্নিং বাই বেগনিও, গুডফেলো এবং কোর্টভিলে-র নীচে:
আদম প্রথম অর্ডার মুহুর্তের (গতিবেগের মেয়াদ) এবং (নিরীক্ষিত) দ্বিতীয়-ক্রমের মুহুর্তগুলির অনুমানের সংশোধন অন্তর্ভুক্ত করার জন্য উত্সে তাদের সূচনা হিসাবে বিবেচনা করে।
দেখে মনে হচ্ছে যে এই পক্ষপাত সংশোধন শর্তাদি অন্তর্ভুক্ত করার মূল কারণটি হ'ল এটি কোনওভাবে এবং এর আরম্ভের পক্ষপাতটিকে সরিয়ে দেয় ।
- আমি এর অর্থ 100% নিশ্চিত নই তবে এটি আমার কাছে মনে হয় এটির সম্ভবত অর্থ হ'ল 1 ম এবং 2 য় মুহুর্তটি শূন্য থেকে শুরু হয় এবং কোনওভাবে শূন্য থেকে একে শুরু করে প্রশিক্ষণের জন্য অন্যায় (বা দরকারী) উপায়ে শূন্যের কাছাকাছি মানগুলি দেয় ?
- যদিও আমি এটি জানতে চাই যে এর অর্থটি আরও কিছুটা সুনির্দিষ্টভাবে বোঝা যাচ্ছে এবং এটি কীভাবে শিক্ষার ক্ষতি করে। বিশেষত, অপটিমাইজেশনের ক্ষেত্রে অপ্ট-বাইসিং অপ্টিমাইজারের কী কী সুবিধা রয়েছে?
- এটি কীভাবে গভীর শেখার মডেলগুলি প্রশিক্ষণে সহায়তা করে?
- এছাড়াও, যখন এটি পক্ষপাতহীন তখন এর অর্থ কী? নিরপেক্ষ স্ট্যান্ডার্ড বিচ্যুতি বলতে কী বোঝায় আমি তা জানি তবে এই প্রসঙ্গে এটির অর্থ কী তা আমার কাছে স্পষ্ট নয়।
- পক্ষপাতিত্ব সংশোধন আসলেই কি খুব বড় বিষয় বা অ্যাডাম অপটিমাইজার পেপারে কোনও কিছুর চাপ বেশি?
ঠিক তাই লোকেরা জানেন যে আমি মূল কাগজটি বোঝার জন্য সত্যই চেষ্টা করেছি কিন্তু আমি মূল কাগজটি পড়ার এবং পুনরায় পড়ার খুব কম চেষ্টা করেছি। আমি অনুমান করি যে এখানে কিছু প্রশ্নের উত্তর দেওয়া হতে পারে তবে আমি উত্তরগুলি বিশ্লেষণ করতে পারছি না।