মূল প্রশ্নটি বিশেষত টেনসরফ্লো বাস্তবায়ন সম্পর্কিত ছিল। তবে উত্তরগুলি সাধারণভাবে প্রয়োগের জন্য। এই সাধারণ উত্তরটি টেনসরফ্লো এর সঠিক উত্তরও।
টেনসরফ্লোতে ব্যাচের নরমালাইজেশন এবং ড্রপআউট ব্যবহার করার সময় (বিশেষত কন্ট্রিবিউটারগুলি ব্যবহার করে) ক্রমটি অর্ডার সম্পর্কে উদ্বিগ্ন হওয়া দরকার কি?
এটি সম্ভবত মনে হয় যে আমি যদি ব্যাচের নরমালাইজেশন দ্বারা অবিলম্বে ড্রপআউট ব্যবহার করি তবে সমস্যা হতে পারে। উদাহরণস্বরূপ, যদি ব্যাচের সাধারণকরণের শিফটটি প্রশিক্ষণের আউটপুটগুলির বৃহত্তর স্কেল সংখ্যায় ট্রেন করে তবে সেই একই শিফ্টটি ছোট (আরও আউটপুট থাকার ক্ষতিপূরণের কারণে) পরীক্ষার সময় ড্রপ আউট ছাড়াই ছোট ক্ষেত্রে প্রয়োগ করা হয়, তবে তা শিফট বন্ধ হতে পারে। টেনসরফ্লো ব্যাচের সাধারণকরণ স্তরটি কী স্বয়ংক্রিয়ভাবে এর জন্য ক্ষতিপূরণ দেয়? বা আমি অনুপস্থিত কোন কারণে এটি ঘটে না?
এছাড়াও, এই দুটোকে একসাথে ব্যবহার করার সময় কি আরও অসুবিধাগুলি সন্ধান করতে হবে? উদাহরণ হিসেবে বলা যায়, আমি তাদের সঠিক অনুক্রমে ব্যবহার করছি অভিমানী উপরোক্ত শুভেচ্ছা (অভিমানী সেখানে হয় একটি সঠিক অনুক্রমে), সেখানে পারে উভয় ব্যাচ নিয়মমাফিককরণ এবং একাধিক ধারাবাহিক স্তর উপর ঝরে পড়া ব্যবহার করে কষ্ট হবে? আমি সাথে সাথে তত্ক্ষণাত্ সমস্যা দেখতে পাচ্ছি না তবে আমি কিছু অনুপস্থিত।
তোমাকে অনেক ধন্যবাদ!
হালনাগাদ:
একটি পরীক্ষামূলক পরীক্ষা বলে মনে হয় যে ক্রম সুপারিশ করে ব্যাপার। আমি একই ব্যাচটি কেবলমাত্র ব্যাচের আদর্শ এবং ড্রপআউট বিপরীত দিয়ে দু'বার চালিয়েছি। যখন ড্রপআউটটি ব্যাচের আদর্শের আগে হয়, তখন প্রশিক্ষণের ক্ষতি হ্রাস পাওয়ায় বৈধতা হারাতে চলেছে বলে মনে হয়। তারা উভয় অন্য ক্ষেত্রে নিচে যাচ্ছে। তবে আমার ক্ষেত্রে চলাচলগুলি ধীর গতির, তাই আরও প্রশিক্ষণের পরে জিনিসগুলি পরিবর্তন হতে পারে এবং এটি কেবল একটি একক পরীক্ষা। আরও নির্দিষ্ট এবং অবগত উত্তর এখনও প্রশংসা করা হবে।