নিউরাল নেটওয়ার্কগুলির প্রাথমিক ওজন এলোমেলো সংখ্যা হিসাবে শুরু করা হয় কেন? আমি কোথাও পড়েছি যে এটি "প্রতিসাম্যতা ভাঙ্গার" জন্য করা হয় এবং এটি নিউরাল নেটওয়ার্কটি দ্রুত শিখতে সক্ষম করে। প্রতিসাম্যতা ভাঙ্গা কীভাবে এটি দ্রুত শিখতে পারে?
ওজন 0 থেকে আরম্ভ করা কি আরও ভাল ধারণা হতে পারে? এইভাবে ওজনগুলি তাদের মানগুলি (ধনাত্মক বা নেতিবাচক) দ্রুত আবিষ্কার করতে সক্ষম হবে?
ওজনকে এলোমেলো করার পিছনে কি আরও কিছু অন্তর্নিহিত দর্শন রয়েছে যে এই আশা করা বাদ দিয়ে যে তারা যখন আরম্ভ করা হবে তখন তাদের সর্বোত্তম মানগুলির কাছাকাছি থাকবে?