আমি গভীর শিক্ষার উপর যোশুয়া বেনজিওর বইটি পড়ছিলাম এবং এটি 224 পৃষ্ঠায় বলেছে:
কনভ্যোলিউশনাল নেটওয়ার্কগুলি কেবল নিউরাল নেটওয়ার্ক যা তাদের ম্যাট্রিক্সের গুনের জায়গায় কমপক্ষে একটি স্তরগুলিতে কনভোলশন ব্যবহার করে।
তবে, গাণিতিকভাবে সুনির্দিষ্ট অর্থে কীভাবে "কনভলিউশনের মাধ্যমে ম্যাট্রিক্স গুণকে প্রতিস্থাপন করা যায়" সে সম্পর্কে আমি 100% নিশ্চিত ছিলাম না।
আমাকে কী আগ্রহী তা 1 ডি ইনপুট ভেক্টরগুলির জন্য এটি সংজ্ঞায়িত করছে ( ), সুতরাং আমার কাছে চিত্র হিসাবে ইনপুট থাকবে না এবং 2 ডি-তে সংশোধন এড়াতে চেষ্টা করব না।
সুতরাং উদাহরণস্বরূপ, "সাধারণ" স্নায়বিক নেটওয়ার্কগুলিতে, অ্যান্ড্রু এনগের নোটগুলির মতো ক্রিয়াকলাপ এবং ফিড ওয়ার্ডের ধরণটি সংক্ষেপে প্রকাশ করা যেতে পারে:
f ( z ( l + 1 ) ) = a ( l + 1 )
যেখানে the ভ্যাক্টরটি অ-লিনিয়ারিটি পাশ করার আগে এটি গণনা করা হয় । অ-লিনিয়ারিটি ভেক্টর on এবং on এ পেরো প্রবেশের কাজ করে যা প্রশ্নযুক্ত স্তরটির জন্য লুকানো ইউনিটের আউটপুট / সক্রিয়করণ। f z ( l ) a ( l + 1 )
এই গণনাটি আমার কাছে স্পষ্ট কারণ ম্যাট্রিক্সের গুণটি আমার জন্য স্পষ্টভাবে সংজ্ঞায়িত হয়েছে তবে যাইহোক, কেবল ম্যাট্রিক্সের গুণকে প্রতিস্থাপনের দ্বারা প্রতিস্থাপন করা আমার কাছে অস্পষ্ট বলে মনে হয়। অর্থাত
f ( z ( l + 1 ) ) = a ( l + 1 )
আমি নিশ্চিত করতে চাই যে আমি উপরের সমীকরণটি গণিতের সাথে সঠিকভাবে বুঝতে পেরেছি।
আমার প্রথম সমস্যাটি কেবল সমঝোতার সাথে ম্যাট্রিক্সের গুণকে প্রতিস্থাপন করে তা হ'ল সাধারণত, কেউ ডট পণ্যের সাথে of এর একটি সারি চিহ্নিত করে । তাই এক পরিষ্কারভাবে জানেন কিভাবে পুরো একটি ভেক্টর থেকে ওজন এবং যে মানচিত্রগুলি সম্পর্কিত যেমন দ্বারা নির্দেশিত মাত্রা এর । যাইহোক, যখন convolutions পর এক প্রতিস্থাপন দেখ, এটাই আমার কাছে যা এন্ট্রি যা সারি বা ওজন অনুরূপ স্পষ্ট না । এটি আমার কাছে এমনকি স্পষ্ট নয় যে ওজনকে ম্যাট্রিক্স হিসাবে বাস্তবে আর উপস্থাপন করা বোধগম্য হয় (আমি পরে এই বিষয়টি ব্যাখ্যা করার জন্য একটি উদাহরণ দেব) a ( l ) z ( l + 1 ) W ( l ) a ( l )
ইনপুট এবং আউটপুট সমস্ত 1 ডি-তে রয়েছে এমন ক্ষেত্রে, কেউ কি কেবল তার সংজ্ঞা অনুসারে কনভলিউশনটি গণনা করে তারপরে এককতার মধ্য দিয়ে যায়?
উদাহরণস্বরূপ যদি আমাদের কাছে নিম্নলিখিত ভেক্টরটি ইনপুট হিসাবে থাকে:
এবং আমাদের নিম্নলিখিত ওজনগুলি ছিল (সম্ভবত আমরা এটি ব্যাকপ্রপ দিয়ে শিখেছি):
তাহলে বোঝাটি হ'ল:
এটির মাধ্যমে কেবল অ-রৈখিকতা অতিক্রম করা এবং ফলাফলটিকে লুকানো স্তর / উপস্থাপন হিসাবে গণ্য করা ( মুহুর্তের জন্য কোনও পুলিং অনুমান করা ) কী সঠিক হবে? যেমন নীচে:
(স্ট্যানফোর্ড ইউডিএলএফ টিউটোরিয়াল আমি মনে করি যে প্রান্তগুলি 0 এর সাথে কোন কারণে কনভলভ হয় এমন প্রান্তগুলি ছাঁটাচ্ছে, আমাদের কি এটি ছাঁটাতে হবে?)
এটি কি এইভাবে কাজ করা উচিত? কমপক্ষে 1 ডি ইনপুট ভেক্টরের জন্য? কি আর ভেক্টর নয়?
এমনকি আমি মনে করি যে এটির মতো মনে হচ্ছে এটির একটি নিউরাল নেটওয়ার্কও আঁকলাম: