আমি অনেকগুলি আলোচনার অনুরূপ উপসংহার দেখেছি, যেহেতু মিনিবিচের আকারটি এসজিডি রূপান্তরিত হওয়ার ফলে বাস্তবে আরও শক্ত / খারাপ হয়, উদাহরণস্বরূপ এই কাগজটি এবং এই উত্তরটি । এছাড়াও আমি শুনেছি লোকেরা বড় ব্যাচের আকারের সাহায্যে এই সমস্যাটির সমাধানের জন্য প্রাথমিক পর্যায়ে ছোট শেখার হার বা ব্যাচের আকারের মতো কৌশল ব্যবহার করে।
তবে এটিকে পাল্টা স্বজ্ঞাত বলে মনে হচ্ছে যেহেতু মিনিবাসের গড় ক্ষতি হ'ল ডেটা বিতরণের চেয়ে প্রত্যাশিত ক্ষতির একটি সান্নিধ্য হিসাবে বিবেচনা করা যেতে পারে,
এখানে আমার (সম্ভবত ভুল) কিছু চিন্তাভাবনা রয়েছে যা ব্যাখ্যা করার চেষ্টা করে।
মডেলের প্যারামিটারগুলি একে অপরের উপর নির্ভর করে, যখন ব্যাচটি খুব বড় হয়ে যায় এটি একবারে অনেকগুলি পরামিতিগুলিকে প্রভাবিত করে, যেমন প্যারামিটারগুলির পক্ষে স্থিতিশীল অন্তর্নিহিত নির্ভরতা অবধি পৌঁছানো শক্ত? ( ব্যাচের নরমালাইজেশন পেপারে উল্লিখিত অভ্যন্তরীণ কোভারিয়েট শিফ্ট সমস্যার মতো )
বা যখন প্রায় সমস্ত পরামিতি প্রতিটি পুনরাবৃত্তিতে দায়বদ্ধ থাকে তখন তারা অপ্রয়োজনীয় অন্তর্নিহিত নিদর্শনগুলি শিখতে পছন্দ করবে তাই মডেলের দক্ষতা হ্রাস পাবে? (আমি বলতে চাইছি অঙ্কের শ্রেণিবিন্যাস সমস্যার জন্য কিছু নিদর্শনগুলি বিন্দুর জন্য, কিছুগুলি প্রান্তের জন্য দায়ী হওয়া উচিত, তবে যখন এটি ঘটে তখন প্রতিটি প্যাটার্ন সকল আকারের জন্য দায়বদ্ধ হওয়ার চেষ্টা করে)।
বা এটি কারণ যেহেতু যখন ব্যাচগুলির আকার প্রশিক্ষণের সেটগুলির স্কেলটির কাছাকাছি আসে, তখন মিনিব্যাচগুলি আর ডেটা বিতরণ থেকে আইআইডি হিসাবে দেখা যায় না, কারণ সংযুক্ত মিনিব্যাচের জন্য বড় সম্ভাবনা থাকবে?
আপডেট
যেমন বেনোইট সানচেজের উত্তরে উল্লেখ করা হয়েছে তার একটি গুরুত্বপূর্ণ কারণ হ'ল বড় মিনি মিনিগুলিতে একটি আপডেট সম্পূর্ণ করার জন্য আরও বেশি গণনার প্রয়োজন হয়, এবং বেশিরভাগ বিশ্লেষণ তুলনার জন্য একটি নির্দিষ্ট পরিমাণ প্রশিক্ষণ পর্ব ব্যবহার করে।
তবে এই কাগজটি (উইলসন এবং মার্টিনেজ, 2003) দেখায় যে একটি বৃহত ব্যাচের আকার এখনও কিছুটা অসুবিধাগুলি এমনকি পর্যাপ্ত পরিমাণ প্রশিক্ষণ পর্ব দেওয়া হয়েছে। সাধারণত কি তাই হয়?