সিএনএন-তে "কার্নেল" এবং "ফিল্টার" এর মধ্যে পার্থক্য


37

কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে "কার্নেল" এবং "ফিল্টার" পদগুলির মধ্যে পার্থক্য কী?


5
তারা একই! ফিল্টার বা কার্নেল হল সমস্ত ইনপুট স্পেসে ভাগ করা ওজনের একটি সহজ গ্রুপ।
yasin.yazici

উত্তর:


42

কনভোলশনাল নিউরাল নেটওয়ার্কগুলির প্রসঙ্গে, কার্নেল = ফিল্টার = বৈশিষ্ট্য সনাক্তকারী।


এখানে স্ট্যানফোর্ডের গভীর শিক্ষার টিউটোরিয়াল ( ড্যানি ব্রিটজ দ্বারা সুন্দরভাবে ব্যাখ্যা করেছেন ) থেকে একটি দুর্দান্ত চিত্রণ দেওয়া হয়েছে ।

এখানে চিত্র বর্ণনা লিখুন

ফিল্টার হলুদ স্লাইডিং উইন্ডো এবং এর মান হ'ল:

[101010101]

2
ফিল্টারটির জন্য কোনও নির্দিষ্ট নাম আছে? একটি "অস্পষ্ট" বা "এজ সনাক্তকরণ" এর মতো
প্রতীক খাদলোয়া

2
প্রতীকখাদলোয়া না, ফিল্টার সনাক্ত করতে দেখা যাচ্ছে তার উপর ভিত্তি করে গবেষকরা এই নামগুলি সাবজেক্টিভভাবে দিয়েছেন।
শ্যাডএলকার

1
@Frank Dernoncourt এই লিঙ্কে অনুযায়ী towardsdatascience.com/... তারা যখন আমরা চ্যানেল একটি দম্পতি আছে ভিন্ন। প্রকৃতপক্ষে যখন একাধিক চ্যানেল থাকে তখন প্রতিটি ফিল্টার আসলে কর্নেলগুলির সংগ্রহ হিসাবে ঘটে থাকে, যেখানে প্রতিটি একক ইনপুট চ্যানেলের স্তরে প্রতিটি কার্নেল থাকে এবং প্রতিটি কার্নেলটি অনন্য হয়ে থাকে। আপনার ধারণাটি পেয়ে আমি খুশি
হব

6

একটি বৈশিষ্ট্য মানচিত্র এই নির্দিষ্ট প্রসঙ্গে ফিল্টার বা "কার্নেল" এর সমান। ফিল্টারের ওজনগুলি নির্দিষ্ট বৈশিষ্ট্যগুলি সনাক্ত করা হয় তা নির্ধারণ করে।

সুতরাং উদাহরণস্বরূপ, ফ্রাঙ্ক একটি দুর্দান্ত ভিজ্যুয়াল সরবরাহ করেছেন। লক্ষ্য করুন যে তার ফিল্টার / বৈশিষ্ট্য-সনাক্তকারীটির তির্যক উপাদানগুলির সাথে x1 এবং অন্যান্য সমস্ত উপাদানগুলির সাথে x0 রয়েছে। এই কার্নেল ওজনটি এইভাবে চিত্রের ত্রিভুজগুলির সাথে ইমেজের পিক্সেলগুলি সনাক্ত করতে পারে যার মান 1 রয়েছে।

লক্ষ্য করুন যে ফলস্বরূপ দ্রবীভূত বৈশিষ্ট্যটি 3x3 ফিল্টারের তির্যক মানগুলির সাথে চিত্রের যেখানে "1" রয়েছে সেখানে 4 টির মান দেখায় (এইভাবে চিত্রটির নির্দিষ্ট 3x3 বিভাগে ফিল্টারটি সনাক্ত করা যায়) এবং এর ক্ষেত্রগুলিতে 2 এর নিম্ন মানের যে ফিল্টারটি দৃ strongly়তার সাথে মেলে না।


4

××সিসিসিএইচআমিএন×এইচআমিএন×সি32×32আরজিবি চিত্র)। ওজনের 2D অ্যারে এবং ওজনগুলির 3 ডি কাঠামোর জন্য পৃথক করার জন্য একটি আলাদা শব্দ ব্যবহার করা বোধগম্য হয়, যেহেতু 2D অ্যারেগুলির মধ্যে গুণটি ঘটে এবং তারপরে ফলাফলগুলি 3 ডি অপারেশন গণনা করার জন্য সংক্ষিপ্ত করা হয়।

বর্তমানে এই ক্ষেত্রের নামকরণ নিয়ে সমস্যা আছে। অনেকগুলি পদ একই জিনিস এবং এমনকী পদগুলিও বিভিন্ন ধারণার জন্য বিনিময়যোগ্য হিসাবে ব্যবহৃত হয়! একটি রূপান্তর স্তরের আউটপুট বর্ণনা করার জন্য ব্যবহৃত পরিভাষাটির উদাহরণ হিসাবে ধরুন: মানচিত্র, চ্যানেল, সক্রিয়করণ, টেনসর, প্লেন ইত্যাদি বৈশিষ্ট্য ...

উইকিপিডিয়া ভিত্তিক, "চিত্র প্রক্রিয়াকরণে, একটি কর্নেল, একটি ছোট ম্যাট্রিক্স"।

উইকিপিডিয়া ভিত্তিক, "একটি ম্যাট্রিক্স একটি আয়তক্ষেত্রাকার অ্যারে যা সারি এবং কলামগুলিতে সজ্জিত"।

1×2×সি

ঠিক আছে, আমি তর্ক করতে পারি না যে এটি সেরা পরিভাষা, তবে কেবল "কার্নেল" এবং "ফিল্টার" পদটি বিনিময়যোগ্যভাবে ব্যবহার করার চেয়ে ভাল। তদতিরিক্ত, একটি ফিল্টার গঠন করে স্বতন্ত্র 2D অ্যারেগুলির ধারণাটি বর্ণনা করার জন্য আমাদের একটি শব্দ প্রয়োজন


1

বিদ্যমান উত্তরগুলি দুর্দান্ত এবং ব্যাপকভাবে প্রশ্নের উত্তর দেয়। কেবল যুক্ত করতে চাই যে কনভলিউশনাল নেটওয়ার্কগুলিতে ফিল্টারগুলি পুরো চিত্র জুড়ে ভাগ করা হয় (যেমন, ফ্রাঙ্কের উত্তরে ভিজ্যুয়ালাইজড হিসাবে ফিল্টারটি দিয়ে ইনপুটটি বোঝানো হয়)। ধারণক্ষম ক্ষেত্র একটি নির্দিষ্ট স্নায়ুর সমস্ত ইনপুট ইউনিট যে প্রশ্নে স্নায়ুর প্রভাবিত হয়। একটি Convolutional নেটওয়ার্কের মধ্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র সাধারণত ভাগ ফিল্টার (নামেও একটি ঘন নেটওয়ার্ক সৌজন্যে একটি স্নায়ুর ধারণক্ষম ক্ষেত্র চেয়ে ছোট প্যারামিটার শেয়ারিং )।

প্যারামিটার ভাগ করে নেওয়া সিএনএনগুলিতে একটি নির্দিষ্ট সুবিধা প্রদান করে, যথা একটি সম্পত্তি অনুবাদ হিসাবে সমানতাকে বলে । এর অর্থ এই যে ইনপুটটি বিশৃঙ্খলা বা অনুবাদ করা থাকলে আউটপুটটিও একই পদ্ধতিতে পরিবর্তিত হয়। ইয়ান গুডফেলো ডিপ লার্নিং বইয়ে সিএনএন-তে সমতা নিয়ে কীভাবে অনুধাবন করতে পারে সে সম্পর্কে একটি দুর্দান্ত উদাহরণ প্রদান করেছেন:

সময়-সিরিজের ডেটা প্রক্রিয়াকরণের সময়, এর অর্থ হ'ল বোঝাটি এক ধরণের টাইমলাইন তৈরি করে যা দেখায় যে ইনপুটটিতে ডায়ারেন্ট বৈশিষ্ট্যগুলি উপস্থিত হয় we ঠিক পরে একইভাবে চিত্রগুলির সাথে, রূপান্তরটি একটি 2-ডি মানচিত্র তৈরি করে যেখানে নির্দিষ্ট বৈশিষ্ট্যগুলি ইনপুটটিতে উপস্থিত হয়। যদি আমরা বস্তুকে ইনপুটটিতে স্থানান্তর করি তবে এর উপস্থাপনাটি আউটপুটে একই পরিমাণে সরানো হবে। এটি যখন আমরা জানি যে একাধিক ইনপুট অবস্থানগুলিতে প্রয়োগ করা হয় তখন অল্প সংখ্যক প্রতিবেশী পিক্সেলের কিছু কাজ কার্যকর হয় for উদাহরণস্বরূপ, চিত্রগুলি প্রক্রিয়া করার সময়, কনভোলশনাল নেটওয়ার্কের প্রথম স্তরের প্রান্তগুলি সনাক্ত করা কার্যকর। একই প্রান্তটি চিত্রের কম-বেশি সর্বত্র প্রদর্শিত হয়, তাই পুরো চিত্র জুড়ে প্যারামিটারগুলি ভাগ করে নেওয়া কার্যকর।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.