কম্পিউটার ভিশনে তাদের প্রয়োগগুলির কারণে আমি কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলি (সিএনএন) অধ্যয়ন করছি। আমি ইতিমধ্যে স্ট্যান্ডার্ড ফিড-ফেওয়ার্ড নিউরাল নেটওয়ার্কগুলির সাথে পরিচিত, তাই আমি আশা করছি যে এখানে কিছু লোক আমাকে সিএনএন বোঝার জন্য অতিরিক্ত পদক্ষেপ নিতে সহায়তা করতে পারে। সিএনএন সম্পর্কে আমি যা মনে করি তা এখানে:
- Traditionalতিহ্যবাহী ফিড-ফেওয়ার্ড এনএনগুলিতে, আমাদের প্রশিক্ষণের ডেটা রয়েছে যেখানে প্রতিটি উপাদান এমন একটি বৈশিষ্ট্য ভেক্টর নিয়ে থাকে যা আমরা "ইনপুট স্তর" তে এনএন-এ ইনপুট করি, সুতরাং চিত্রের স্বীকৃতি সহ আমরা কেবল প্রতিটি পিক্সেলকে একটি ইনপুট রাখতে পারি। এগুলি আমাদের বৈশিষ্ট্য ভেক্টর। বিকল্পভাবে, আমরা ম্যানুয়ালি অন্য - সম্ভবত ছোট - বৈশিষ্ট্যযুক্ত ভেক্টর তৈরি করতে পারি।
- সিএনএন এর সুবিধা হ'ল এটি শক্তিশালী বৈশিষ্ট্যযুক্ত ভেক্টর তৈরি করতে পারে যা চিত্র বিকৃতি এবং অবস্থানের চেয়ে আরও বেশি আক্রমণাত্মক। নিম্নলিখিত চিত্রটি দেখায় ( এই টিউটোরিয়াল থেকে ), সিএনএনগুলি এমন একটি বৈশিষ্ট্য মানচিত্র তৈরি করে যা পরে কোনও মানক নিউরাল নেটওয়ার্ককে খাওয়ানো হয় (সুতরাং এটি সত্যিই একটি বিশাল প্রাক-প্রক্রিয়াজাতকরণ পদক্ষেপ)।
- আমরা এই "আরও ভাল" বৈশিষ্ট্যগুলি পাওয়ার উপায় হ'ল বিকল্প সমাধান এবং সাব-স্যাম্পলিং দ্বারা। আমি বুঝি কীভাবে সাব-স্যাম্পলিং কাজ করে। প্রতিটি বৈশিষ্ট্যের মানচিত্রের জন্য, কেবল পিক্সেলের একটি উপসেট নিন বা আমরা পিক্সেলের মানগুলি বের করতে পারি।
তবে আমি যা নিয়ে মূলত বিভ্রান্ত তা হ'ল বোঝার পদক্ষেপটি কীভাবে কাজ করে। আমি সম্ভাব্যতা তত্ত্ব (দুটি এলোমেলো ভেরিয়েবলের যোগফলের ঘনত্ব) থেকে উপলব্ধিগুলির সাথে পরিচিত, তবে তারা কীভাবে সিএনএন-তে কাজ করবে এবং কেন তারা কার্যকর?
আমার প্রশ্ন অনুরূপ এই এক কিন্তু বিশেষ করে, আমি নিশ্চিত কেন নই প্রথম সংবর্তন পদক্ষেপ কাজ করে।