আমি প্রথমত এক মাত্রিক অ্যারে (ইনপুট) এর সরলতার জন্য নীচে একটি সংশ্লেষীয় স্তরটির জন্য ত্রুটিটি পাই যা সহজেই তখন বহুমাত্রিককে স্থানান্তরিত করা যায়:
আমরা এখানে ধরে নিই যে Yl - 1 দৈর্ঘ্যের এন এর ইনপুট হয় l - 1-মাম কনভ স্তর,মি ওজনের কার্নেল-আকার W প্রতিটি ওজন দ্বারা চিহ্নিত করা Wআমি এবং আউটপুট হয় এক্সঠ।
সুতরাং আমরা লিখতে পারি (শূন্য থেকে সংক্ষেপটি নোট করুন):
এক্সঠআমি=Σa = 0মি - 1WএকটিYl - 1a + i
কোথায়
Yঠআমি= চ(এক্সঠআমি) এবং
চঅ্যাক্টিভেশন ফাংশন (যেমন সিগময়েডাল)। এটি হাতে রেখে আমরা এখন কিছু ত্রুটি ফাংশন বিবেচনা করতে পারি
ই এবং প্রদত্ত কনভ্যুশনাল স্তর (আপনার আগের স্তরের একটি) এ ত্রুটি ফাংশন
∂ই/ ∂Yঠআমি। আমরা এখন আগের স্তর (গুলি) এর একটি ওজনের ত্রুটির নির্ভরতা জানতে চাই:
∂ই∂Wএকটি=Σa = 0এন- মি∂ই∂এক্সঠআমি∂এক্সঠআমি∂Wএকটি=Σa = 0এন- মি∂ই∂WএকটিYl - 1i + a
যেখানে আমাদের সমস্ত প্রকাশের উপরে যোগফল রয়েছে
Wএকটি ঘটে, যা হয়
এন- মি। এটিও নোট করুন যে আমরা জানি যে শেষ শব্দটি এই থেকেই উদ্ভূত হয়েছিল
∂এক্সঠআমি∂Wএকটি=Yl - 1i + aযা আপনি প্রথম সমীকরণ থেকে দেখতে পাবেন।
গ্রেডিয়েন্ট গণনা করার জন্য আমাদের প্রথম শব্দটি জানা দরকার, যা দ্বারা নিরূপণ করা যেতে পারে:
∂ই∂এক্সঠআমি=∂ই∂Yঠআমি∂Yঠআমি∂এক্সঠআমি=∂ই∂Yঠআমি∂∂এক্সঠআমিচ(এক্সঠআমি)
যেখানে আবার প্রথম শব্দটি পূর্ববর্তী স্তরের ত্রুটি এবং
চ অ-লিনিয়ার অ্যাক্টিভেশন ফাংশন।
সমস্ত প্রয়োজনীয় সত্তা থাকা আমরা এখন ত্রুটি গণনা করতে এবং মূল্যবান স্তরে দক্ষতার সাথে এটি আবার প্রচার করতে সক্ষম হয়েছি:
δl - 1একটি=∂ই∂Yl - 1আমি=Σa = 0মি - 1∂ই∂এক্সঠi - a∂এক্সঠi - a∂Yl - 1আমি=Σa = 0মি - 1∂ই∂এক্সঠi - aWচl i p p e dএকটি
নোট করুন যে লিখিত লেখার সময় শেষ পদক্ষেপটি সহজেই বোঝা যায়
এক্সঠআমি-স
Yl - 1আমি-s। দ্য
চl i p p e d ট্রান্সপোজড ওজন ম্যাক্সট্রিক্সকে বোঝায় (
টি)।
সুতরাং আপনি কেবল পরবর্তী স্তরের ত্রুটিটি গণনা করতে পারেন (এখন ভেক্টর নোটেশনে):
δঠ= (Wঠ)টিδl + 1চ'(এক্সঠ)
যা একটি কনভোলজিকাল এবং সাবসাম্পলিং লেয়ারের হয়ে ওঠে:
δঠ= তোমার দর্শন লগ করা পি s একটি মি পি ঠ ই ( (Wঠ)টিδl + 1)চ'(এক্সঠ)
যেখানে
তোমার দর্শন লগ করা পি s একটি মি পি ঠ ই অপারেশন সর্বোচ্চ পুলিং স্তর মাধ্যমে ত্রুটি প্রচার করে।
আমাকে যোগ বা সংশোধন বিনা দ্বিধায় দয়া করে!
রেফারেন্সের জন্য দেখুন:
http://ufldl.stanford.edu/tutorial/supervised/ConvolutionalNeuralNetwork/
http://andrew.gibiansky.com/blog/machine-learning/convolutional-neural-networks/
এবং একটি সি ++ বাস্তবায়নের জন্য (ইনস্টল করার প্রয়োজন ছাড়াই):
https://github.com/nyanp/tiny-cnn#supported- নেট ওয়ার্ক