ফিডফোরওয়ার্ড নিউরাল নেটওয়ার্কে সংযোগের ওজন সূচনা করার সময়, শিখনের অ্যালগরিদমটি ভাঙতে সক্ষম হবে না এমন কোনও প্রতিসাম্য এড়াতে এলোমেলোভাবে এগুলি শুরু করা গুরুত্বপূর্ণ।
আমি বিভিন্ন স্থানে যে সুপারিশটি দেখেছি (যেমন টেনসরফ্লো এর এমএনআইএসটি টিউটোরিয়ালে ) q q of এর স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করে ছাঁটাই করা সাধারণ বিতরণ ব্যবহার করা হয় , যেখানে এর ইনপুটগুলির সংখ্যা প্রদত্ত নিউরন স্তর
আমি বিশ্বাস করি যে স্ট্যান্ডার্ড বিচ্যুতি সূত্রটি নিশ্চিত করে যে ব্যাকপ্রোপেটেড গ্রেডিয়েন্টগুলি খুব দ্রুত দ্রবীভূত হবে না বা প্রশস্ত করবে না। তবে কেন জানি না আমরা নিয়মিত সাধারণ বিতরণের বিপরীতে কাটা কাটা সাধারণ বিতরণটি ব্যবহার করছি। এটি বিরল আউটলেট ওজন এড়াতে হয়?