সিএনএন-তে "কার্নেল" এবং "ফিল্টার" এর মধ্যে পার্থক্য

37

কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে "কার্নেল" এবং "ফিল্টার" পদগুলির মধ্যে পার্থক্য কী?

— ryguy
সূত্র

5

তারা একই! ফিল্টার বা কার্নেল হল সমস্ত ইনপুট স্পেসে ভাগ করা ওজনের একটি সহজ গ্রুপ।

— yasin.yazici

42

কনভোলশনাল নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে, কার্নেল = ফিল্টার = বৈশিষ্ট্য সনাক্তকারী।

এখানে স্ট্যানফোর্ডের গভীর শিক্ষার টিউটোরিয়াল ( ড্যানি ব্রিটজ দ্বারা সুন্দরভাবে ব্যাখ্যা করেছেন ) থেকে একটি দুর্দান্ত চিত্রণ দেওয়া হয়েছে ।

ফিল্টার হলুদ স্লাইডিং উইন্ডো এবং এর মান হ'ল:

[\begin{matrix} 1 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 1 \end{matrix}]

$\begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 1 \end{bmatrix}$

— ফ্রাঙ্ক ডারনকোর্ট
সূত্র

2

ফিল্টারটির জন্য কোনও নির্দিষ্ট নাম আছে? একটি "অস্পষ্ট" বা "এজ সনাক্তকরণ" এর মতো

— প্রতীক খাদলোয়া

2

প্রতীকখাদলোয়া না, ফিল্টার সনাক্ত করতে দেখা যাচ্ছে তার উপর ভিত্তি করে গবেষকরা এই নামগুলি সাবজেক্টিভভাবে দিয়েছেন।

— শ্যাডএলকার

1

@Frank Dernoncourt এই লিঙ্কে অনুযায়ী towardsdatascience.com/... তারা যখন আমরা চ্যানেল একটি দম্পতি আছে ভিন্ন। প্রকৃতপক্ষে যখন একাধিক চ্যানেল থাকে তখন প্রতিটি ফিল্টার আসলে কর্নেলগুলির সংগ্রহ হিসাবে ঘটে থাকে, যেখানে প্রতিটি একক ইনপুট চ্যানেলের স্তরে প্রতিটি কার্নেল থাকে এবং প্রতিটি কার্নেলটি অনন্য হয়ে থাকে। আপনার ধারণাটি পেয়ে আমি খুশি

— হব

6

একটি বৈশিষ্ট্য মানচিত্র এই নির্দিষ্ট প্রসঙ্গে ফিল্টার বা "কার্নেল" এর সমান। ফিল্টারের ওজনগুলি নির্দিষ্ট বৈশিষ্ট্যগুলি সনাক্ত করা হয় তা নির্ধারণ করে।

সুতরাং উদাহরণস্বরূপ, ফ্রাঙ্ক একটি দুর্দান্ত ভিজ্যুয়াল সরবরাহ করেছেন। লক্ষ্য করুন যে তার ফিল্টার / বৈশিষ্ট্য-সনাক্তকারীটির তির্যক উপাদানগুলির সাথে x1 এবং অন্যান্য সমস্ত উপাদানগুলির সাথে x0 রয়েছে। এই কার্নেল ওজনটি এইভাবে চিত্রের ত্রিভুজগুলির সাথে ইমেজের পিক্সেলগুলি সনাক্ত করতে পারে যার মান 1 রয়েছে।

লক্ষ্য করুন যে ফলস্বরূপ দ্রবীভূত বৈশিষ্ট্যটি 3x3 ফিল্টারের তির্যক মানগুলির সাথে চিত্রের যেখানে "1" রয়েছে সেখানে 4 টির মান দেখায় (এইভাবে চিত্রটির নির্দিষ্ট 3x3 বিভাগে ফিল্টারটি সনাক্ত করা যায়) এবং এর ক্ষেত্রগুলিতে 2 এর নিম্ন মানের যে ফিল্টারটি দৃ strongly়তার সাথে মেলে না।

— JohnnyUtah
সূত্র

4

$k \times k \times C$ $C$ $C$ $H_{in} \times H_{in} \times C$ $32 \times 32$ আরজিবি চিত্র)। ওজনের 2D অ্যারে এবং ওজনগুলির 3 ডি কাঠামোর জন্য পৃথক করার জন্য একটি আলাদা শব্দ ব্যবহার করা বোধগম্য হয়, যেহেতু 2D অ্যারেগুলির মধ্যে গুণটি ঘটে এবং তারপরে ফলাফলগুলি 3 ডি অপারেশন গণনা করার জন্য সংক্ষিপ্ত করা হয়।

বর্তমানে এই ক্ষেত্রের নামকরণ নিয়ে সমস্যা আছে। অনেকগুলি পদ একই জিনিস এবং এমনকী পদগুলিও বিভিন্ন ধারণার জন্য বিনিময়যোগ্য হিসাবে ব্যবহৃত হয়! একটি রূপান্তর স্তরের আউটপুট বর্ণনা করার জন্য ব্যবহৃত পরিভাষাটির উদাহরণ হিসাবে ধরুন: মানচিত্র, চ্যানেল, সক্রিয়করণ, টেনসর, প্লেন ইত্যাদি বৈশিষ্ট্য ...

উইকিপিডিয়া ভিত্তিক, "চিত্র প্রক্রিয়াকরণে, একটি কর্নেল, একটি ছোট ম্যাট্রিক্স"।

উইকিপিডিয়া ভিত্তিক, "একটি ম্যাট্রিক্স একটি আয়তক্ষেত্রাকার অ্যারে যা সারি এবং কলামগুলিতে সজ্জিত"।

$k_1 \times k_2 \times C$

ঠিক আছে, আমি তর্ক করতে পারি না যে এটি সেরা পরিভাষা, তবে কেবল "কার্নেল" এবং "ফিল্টার" পদটি বিনিময়যোগ্যভাবে ব্যবহার করার চেয়ে ভাল। তদতিরিক্ত, একটি ফিল্টার গঠন করে স্বতন্ত্র 2D অ্যারেগুলির ধারণাটি বর্ণনা করার জন্য আমাদের একটি শব্দ প্রয়োজন ।

— জিম
সূত্র

1

বিদ্যমান উত্তরগুলি দুর্দান্ত এবং ব্যাপকভাবে প্রশ্নের উত্তর দেয়। কেবল যুক্ত করতে চাই যে কনভলিউশনাল নেটওয়ার্কগুলিতে ফিল্টারগুলি পুরো চিত্র জুড়ে ভাগ করা হয় (যেমন, ফ্রাঙ্কের উত্তরে ভিজ্যুয়ালাইজড হিসাবে ফিল্টারটি দিয়ে ইনপুটটি বোঝানো হয়)। ধারণক্ষম ক্ষেত্র একটি নির্দিষ্ট স্নায়ুর সমস্ত ইনপুট ইউনিট যে প্রশ্নে স্নায়ুর প্রভাবিত হয়। একটি Convolutional নেটওয়ার্কের মধ্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র সাধারণত ভাগ ফিল্টার (নামেও একটি ঘন নেটওয়ার্ক সৌজন্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র চেয়ে ছোট প্যারামিটার শেয়ারিং )।

প্যারামিটার ভাগ করে নেওয়া সিএনএনগুলিতে একটি নির্দিষ্ট সুবিধা প্রদান করে, যথা একটি সম্পত্তি অনুবাদ হিসাবে সমানতাকে বলে । এর অর্থ এই যে ইনপুটটি বিশৃঙ্খলা বা অনুবাদ করা থাকলে আউটপুটটিও একই পদ্ধতিতে পরিবর্তিত হয়। ইয়ান গুডফেলো ডিপ লার্নিং বইয়ে সিএনএন-তে সমতা নিয়ে কীভাবে অনুধাবন করতে পারে সে সম্পর্কে একটি দুর্দান্ত উদাহরণ প্রদান করেছেন:

সময়-সিরিজের ডেটা প্রক্রিয়াকরণের সময়, এর অর্থ হ'ল বোঝাটি এক ধরণের টাইমলাইন তৈরি করে যা দেখায় যে ইনপুটটিতে ডায়ারেন্ট বৈশিষ্ট্যগুলি উপস্থিত হয় we ঠিক পরে একইভাবে চিত্রগুলির সাথে, রূপান্তরটি একটি 2-ডি মানচিত্র তৈরি করে যেখানে নির্দিষ্ট বৈশিষ্ট্যগুলি ইনপুটটিতে উপস্থিত হয়। যদি আমরা বস্তুকে ইনপুটটিতে স্থানান্তর করি তবে এর উপস্থাপনাটি আউটপুটে একই পরিমাণে সরানো হবে। এটি যখন আমরা জানি যে একাধিক ইনপুট অবস্থানগুলিতে প্রয়োগ করা হয় তখন অল্প সংখ্যক প্রতিবেশী পিক্সেলের কিছু কাজ কার্যকর হয় for উদাহরণস্বরূপ, চিত্রগুলি প্রক্রিয়া করার সময়, কনভোলশনাল নেটওয়ার্কের প্রথম স্তরের প্রান্তগুলি সনাক্ত করা কার্যকর। একই প্রান্তটি চিত্রের কম-বেশি সর্বত্র প্রদর্শিত হয়, তাই পুরো চিত্র জুড়ে প্যারামিটারগুলি ভাগ করে নেওয়া কার্যকর।

— প্রণব ভেম্পাটি
সূত্র