গ্রেডিয়েন্ট বংশোদ্ভূত আপনার প্রস্তাব মতো কাজ করে না তবে একই ধরণের সমস্যা দেখা দিতে পারে।
আমরা ব্যাচ থেকে গড় ক্ষতি গণনা করি না, আমরা ক্ষতির কার্যকারিতার গড় গ্রেডিয়েন্টগুলি গণনা করি। গ্রেডিয়েন্টগুলি ওজনের সাথে সম্মানের সাথে ক্ষতির ডাইরিভেটিভ এবং নিউরাল নেটওয়ার্কে এক ওজনের জন্য গ্রেডিয়েন্ট সেই নির্দিষ্ট উদাহরণের ইনপুটগুলির উপর নির্ভর করে এবং এটি মডেলের অন্যান্য অনেক ওজনের উপরও নির্ভর করে।
যদি আপনার মডেলটির 5 টি ওজন হয় এবং আপনার মিনি-ব্যাচের আকার 2 থাকে তবে আপনি এটি পেতে পারেন:
উদাহরণ 1. ক্ষতি = 2,গ্রেডিয়েন্টস = ( 1.5 ,- 2.0 , 1.1 , 0.4 , - 0.9 )
উদাহরণ 2. ক্ষতি = 3,গ্রেডিয়েন্টস = ( 1.2 , 2.3), - 1.1 , - 0.8 , - 0.7 )
এই মিনি-ব্যাচের গ্রেডিয়েন্টগুলির গড় গণনা করা হয়, সেগুলি( 1.35 ,0.15 , 0 , - 0.2 , - 0.8 )
বেশ কয়েকটি উদাহরণের গড় গড় সুবিধা হ'ল গ্রেডিয়েন্টের পার্থক্য কম তাই শিক্ষাগুলি আরও সামঞ্জস্যপূর্ণ এবং একটি উদাহরণের নির্দিষ্টকরণের উপর কম নির্ভরশীল। লক্ষ্য করুন যে তৃতীয় ওজনের গড় গ্রেডিয়েন্ট কীভাবে হয় , এই ওজনটি এই ওজন আপডেটটি পরিবর্তন করে না তবে পরবর্তী ওজনের সাথে বেছে নেওয়া পরবর্তী উদাহরণগুলির জন্য এটি শূন্য নয় which0
মন্তব্যের জবাবে সম্পাদনা করুন:
আমার উদাহরণে উপরে গ্রেডিয়েন্টগুলির গড় গণনা করা হয়। একটি মিনি- ব্যাচ আকার জন্য যেখানে আমরা ক্ষয় নিরূপণ আমরা একে উদাহরণস্বরূপ এবং একটি ওজন থেকে সম্মান সঙ্গে ক্ষতির গড় গ্রেডিয়েন্ট পেতে তাগ ।এল আই ডব্লু জেটএলআমিWঞ
আমার উদাহরণে আমি এটি যেভাবে লিখেছি আমি প্রতিটি গ্রেডিয়েন্টের গড় গড় গড় করেছি:∂এল∂Wঞ= 1টΣটi = 1∂এলআমি∂Wঞ
মন্তব্যে আপনি যে টিউটোরিয়াল কোডটি লিঙ্ক করেছেন সেটি গড় ক্ষতি হ্রাস করতে টেনসরফ্লো ব্যবহার করে।
টেনসরফ্লো লক্ষ্য করে1টΣটi = 1এলআমি
এটি হ্রাস করতে এটি প্রতিটি ওজনের সাথে সম্মানের সাথে গড় ক্ষতির গ্রেডিয়েন্টগুলি গণনা করে এবং ওজন আপডেট করার জন্য গ্রেডিয়েন্ট-ডেসেন্ট ব্যবহার করে:
∂এল∂Wঞ= ∂∂Wঞ1টΣটi = 1এলআমি
পার্থক্যের যোগফলের ভিতরে আনা যায় তাই এটি আমার উদাহরণের পদ্ধতির কাছ থেকে প্রকাশের মত।
∂∂Wঞ1টΣটi = 1এলআমি= 1টΣটi = 1∂এলআমি∂Wঞ