উত্তর:
কনভোলশনাল নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে, কার্নেল = ফিল্টার = বৈশিষ্ট্য সনাক্তকারী।
এখানে স্ট্যানফোর্ডের গভীর শিক্ষার টিউটোরিয়াল ( ড্যানি ব্রিটজ দ্বারা সুন্দরভাবে ব্যাখ্যা করেছেন ) থেকে একটি দুর্দান্ত চিত্রণ দেওয়া হয়েছে ।
ফিল্টার হলুদ স্লাইডিং উইন্ডো এবং এর মান হ'ল:
একটি বৈশিষ্ট্য মানচিত্র এই নির্দিষ্ট প্রসঙ্গে ফিল্টার বা "কার্নেল" এর সমান। ফিল্টারের ওজনগুলি নির্দিষ্ট বৈশিষ্ট্যগুলি সনাক্ত করা হয় তা নির্ধারণ করে।
সুতরাং উদাহরণস্বরূপ, ফ্রাঙ্ক একটি দুর্দান্ত ভিজ্যুয়াল সরবরাহ করেছেন। লক্ষ্য করুন যে তার ফিল্টার / বৈশিষ্ট্য-সনাক্তকারীটির তির্যক উপাদানগুলির সাথে x1 এবং অন্যান্য সমস্ত উপাদানগুলির সাথে x0 রয়েছে। এই কার্নেল ওজনটি এইভাবে চিত্রের ত্রিভুজগুলির সাথে ইমেজের পিক্সেলগুলি সনাক্ত করতে পারে যার মান 1 রয়েছে।
লক্ষ্য করুন যে ফলস্বরূপ দ্রবীভূত বৈশিষ্ট্যটি 3x3 ফিল্টারের তির্যক মানগুলির সাথে চিত্রের যেখানে "1" রয়েছে সেখানে 4 টির মান দেখায় (এইভাবে চিত্রটির নির্দিষ্ট 3x3 বিভাগে ফিল্টারটি সনাক্ত করা যায়) এবং এর ক্ষেত্রগুলিতে 2 এর নিম্ন মানের যে ফিল্টারটি দৃ strongly়তার সাথে মেলে না।
আরজিবি চিত্র)। ওজনের 2D অ্যারে এবং ওজনগুলির 3 ডি কাঠামোর জন্য পৃথক করার জন্য একটি আলাদা শব্দ ব্যবহার করা বোধগম্য হয়, যেহেতু 2D অ্যারেগুলির মধ্যে গুণটি ঘটে এবং তারপরে ফলাফলগুলি 3 ডি অপারেশন গণনা করার জন্য সংক্ষিপ্ত করা হয়।
বর্তমানে এই ক্ষেত্রের নামকরণ নিয়ে সমস্যা আছে। অনেকগুলি পদ একই জিনিস এবং এমনকী পদগুলিও বিভিন্ন ধারণার জন্য বিনিময়যোগ্য হিসাবে ব্যবহৃত হয়! একটি রূপান্তর স্তরের আউটপুট বর্ণনা করার জন্য ব্যবহৃত পরিভাষাটির উদাহরণ হিসাবে ধরুন: মানচিত্র, চ্যানেল, সক্রিয়করণ, টেনসর, প্লেন ইত্যাদি বৈশিষ্ট্য ...
উইকিপিডিয়া ভিত্তিক, "চিত্র প্রক্রিয়াকরণে, একটি কর্নেল, একটি ছোট ম্যাট্রিক্স"।
উইকিপিডিয়া ভিত্তিক, "একটি ম্যাট্রিক্স একটি আয়তক্ষেত্রাকার অ্যারে যা সারি এবং কলামগুলিতে সজ্জিত"।
ঠিক আছে, আমি তর্ক করতে পারি না যে এটি সেরা পরিভাষা, তবে কেবল "কার্নেল" এবং "ফিল্টার" পদটি বিনিময়যোগ্যভাবে ব্যবহার করার চেয়ে ভাল। তদতিরিক্ত, একটি ফিল্টার গঠন করে স্বতন্ত্র 2D অ্যারেগুলির ধারণাটি বর্ণনা করার জন্য আমাদের একটি শব্দ প্রয়োজন ।
বিদ্যমান উত্তরগুলি দুর্দান্ত এবং ব্যাপকভাবে প্রশ্নের উত্তর দেয়। কেবল যুক্ত করতে চাই যে কনভলিউশনাল নেটওয়ার্কগুলিতে ফিল্টারগুলি পুরো চিত্র জুড়ে ভাগ করা হয় (যেমন, ফ্রাঙ্কের উত্তরে ভিজ্যুয়ালাইজড হিসাবে ফিল্টারটি দিয়ে ইনপুটটি বোঝানো হয়)। ধারণক্ষম ক্ষেত্র একটি নির্দিষ্ট স্নায়ুর সমস্ত ইনপুট ইউনিট যে প্রশ্নে স্নায়ুর প্রভাবিত হয়। একটি Convolutional নেটওয়ার্কের মধ্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র সাধারণত ভাগ ফিল্টার (নামেও একটি ঘন নেটওয়ার্ক সৌজন্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র চেয়ে ছোট প্যারামিটার শেয়ারিং )।
প্যারামিটার ভাগ করে নেওয়া সিএনএনগুলিতে একটি নির্দিষ্ট সুবিধা প্রদান করে, যথা একটি সম্পত্তি অনুবাদ হিসাবে সমানতাকে বলে । এর অর্থ এই যে ইনপুটটি বিশৃঙ্খলা বা অনুবাদ করা থাকলে আউটপুটটিও একই পদ্ধতিতে পরিবর্তিত হয়। ইয়ান গুডফেলো ডিপ লার্নিং বইয়ে সিএনএন-তে সমতা নিয়ে কীভাবে অনুধাবন করতে পারে সে সম্পর্কে একটি দুর্দান্ত উদাহরণ প্রদান করেছেন:
সময়-সিরিজের ডেটা প্রক্রিয়াকরণের সময়, এর অর্থ হ'ল বোঝাটি এক ধরণের টাইমলাইন তৈরি করে যা দেখায় যে ইনপুটটিতে ডায়ারেন্ট বৈশিষ্ট্যগুলি উপস্থিত হয় we ঠিক পরে একইভাবে চিত্রগুলির সাথে, রূপান্তরটি একটি 2-ডি মানচিত্র তৈরি করে যেখানে নির্দিষ্ট বৈশিষ্ট্যগুলি ইনপুটটিতে উপস্থিত হয়। যদি আমরা বস্তুকে ইনপুটটিতে স্থানান্তর করি তবে এর উপস্থাপনাটি আউটপুটে একই পরিমাণে সরানো হবে। এটি যখন আমরা জানি যে একাধিক ইনপুট অবস্থানগুলিতে প্রয়োগ করা হয় তখন অল্প সংখ্যক প্রতিবেশী পিক্সেলের কিছু কাজ কার্যকর হয় for উদাহরণস্বরূপ, চিত্রগুলি প্রক্রিয়া করার সময়, কনভোলশনাল নেটওয়ার্কের প্রথম স্তরের প্রান্তগুলি সনাক্ত করা কার্যকর। একই প্রান্তটি চিত্রের কম-বেশি সর্বত্র প্রদর্শিত হয়, তাই পুরো চিত্র জুড়ে প্যারামিটারগুলি ভাগ করে নেওয়া কার্যকর।