এমন কোনও সাহিত্য আছে যা স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত হওয়ার সময় মিনিবেচের আকারের পছন্দটি পরীক্ষা করে? আমার অভিজ্ঞতাকে, এটি একটি অভিজ্ঞতাগত পছন্দ বলে মনে হয়, সাধারণত ক্রস-বৈধতা বা থাম্বের বিভিন্ন নিয়ম ব্যবহার করে পাওয়া যায়।
বৈধতা ত্রুটি হ্রাস হওয়ায় আস্তে আস্তে মিনিব্যাচের আকার বাড়ানো কি ভাল ধারণা? এটি সাধারণকরণের ত্রুটিতে কী প্রভাব ফেলবে? আমি কি খুব ছোট মিনিবাচ ব্যবহার করে কয়েকশো বার আমার মডেলটি আপডেট করছি? অত্যন্ত সামান্য এবং ব্যাচের মধ্যে কোথাও ভারসাম্যপূর্ণ সংখ্যাটি নিয়ে আমি আরও ভাল হতে পারি?
আমি কি আমার মিনিব্যাচের আকারটি ডেটাসেটের আকারের সাথে বা ডেটাসেটের মধ্যে প্রত্যাশিত বৈশিষ্ট্যগুলির সংখ্যা দিয়ে স্কেল করব?
স্পষ্টতই মিনিব্যাচ শেখার প্রকল্পগুলি বাস্তবায়ন সম্পর্কে আমার অনেক প্রশ্ন রয়েছে। দুর্ভাগ্যক্রমে, আমি বেশিরভাগ কাগজপত্র পড়েছি তবে তারা কীভাবে এই হাইপারপ্যারামিটারটি বেছে নিয়েছে তা সত্যই নির্দিষ্ট করে না। ইয়ান লেকুনের মতো লেখকদের কাছ থেকে আমার কিছুটা সাফল্য ছিল, বিশেষত কাগজের সংগ্রহের কৌশলগুলি থেকে। যাইহোক, আমি এখনও এই প্রশ্নগুলি সম্পূর্ণরূপে দেখিনি। কাগজপত্রের জন্য কারও কাছে কি কোনও সুপারিশ রয়েছে, বা বৈশিষ্ট্যগুলি শেখার চেষ্টা করার সময় আমি ভাল মিনি মিনিচের আকার নির্ধারণ করতে কোন মানদণ্ড ব্যবহার করতে পারি সে সম্পর্কে পরামর্শ রয়েছে?