আমার নিউরাল নেটওয়ার্কটি কী শিখেছে? এটি কোন বৈশিষ্ট্যগুলির যত্ন করে এবং কেন?


30

একটি নিউরাল নেট কিছু লক্ষ্য অর্জনের মাধ্যম হিসাবে ডেটা সেটের বৈশিষ্ট্যগুলি শেখে। এটি সম্পন্ন হয়ে গেলে, আমরা জানতে চাইতে পারি যে নিউরাল নেটটি কী শিখেছে। বৈশিষ্ট্যগুলি কী ছিল এবং কেন এটি সেগুলি যত্ন করে। কেউ কি এই সমস্যার উদ্বেগ নিয়ে কাজ করার শরীরে কিছু রেফারেন্স দিতে পারেন?

উত্তর:


28

এটি সত্য যে নিউরাল নেটওয়ার্ক কী শিখছে তা বোঝা শক্ত তবে সেই ফ্রন্টে অনেক কাজ হয়েছে। আমাদের নেটওয়ার্ক কী খুঁজছে সে সম্পর্কে আমরা অবশ্যই কিছু ধারণা পেতে পারি।

আসুন ইমেজগুলির জন্য একটি কনভোলশনাল নিউরাল নেট এর বিষয়টি বিবেচনা করুন। আমাদের প্রথম স্তরটির জন্য আমাদের ব্যাখ্যা রয়েছে যে আমরা চিত্রের উপরে ফিল্টারগুলি স্লাইড করছি , সুতরাং আমাদের প্রথম লুকানো স্তরটি চিত্রের ছোট অংশ এবং আমাদের বিভিন্ন ফিল্টারগুলির মধ্যে চুক্তির সাথে মিলে যায়। আমাদের প্রতিনিধিত্বের প্রথম স্তরটি কী তা দেখতে আমরা এই ফিল্টারগুলি ভিজ্যুয়ালাইজ করতে পারি:কে

অ্যালেক্সনেট স্তর 1

এই ছবিটি একটি অ্যালেক্সনেট থেকে ফিল্টারগুলির প্রথম স্তরের এবং এই দুর্দান্ত টিউটোরিয়ালটি থেকে নেওয়া হয়েছে: http://cs231n.github.io/ বোঝंडर-cnn / । এটি আমাদের কাঁচা পিক্সেল সমন্বিত চিত্রটি উপস্থাপন করতে শেখার হিসাবে প্রথম লুকানো স্তরটিকে ব্যাখ্যা করতে দেয় যেখানে প্রতিটি সমন্বয়কৃত চিত্রটির একটি ছোট অঞ্চল সহ একটি ফিল্টারের চুক্তি t তারপরে পরবর্তী স্তরটি এই ফিল্টার অ্যাক্টিভেশনগুলির সাথে কাজ করছে।

[0101-41010]

0

এরহান এট আল (২০০৯) এর এই কাগজটি এর সাথে একমত: তারা বলে যে প্রথম লুকানো স্তরটির দৃশ্যায়নগুলি সাধারণ (এবং এটি ২০০৯ সালে ফিরে এসেছিল) তবে গভীর স্তরগুলিকে দৃশ্যমান করা শক্ত অংশ the সেই কাগজ থেকে:

এই তদন্তের প্রধান পরীক্ষামূলক অনুসন্ধানটি অত্যন্ত আশ্চর্যজনক: চিত্রের ইনপুটগুলিতে কোনও অভ্যন্তরীণ ইউনিটের প্রতিক্রিয়া, চিত্রের স্থান হিসাবে একটি ফাংশন হিসাবে, সর্বনিম্ন বলে মনে হয় বা কমপক্ষে পরীক্ষা করা সমস্ত এলোমেলো প্রাথমিককরণের জন্য সর্বাধিক নির্ভরযোগ্য ও ধারাবাহিকভাবে পাওয়া যায় that । এটি আকর্ষণীয় কারণ এই প্রভাবশালী মোডটি সন্ধান করা তুলনামূলকভাবে সহজ এবং এরপরে প্রদর্শন করা ইউনিট কী করে তার একটি ভাল বৈশিষ্ট্য সরবরাহ করে।

ক্রিস ওলাহ এট আল ( https://distill.pub/2017/feature-visualization/ ) এটিকে নিয়ে আলোচনা করুন এবং সাধারণভাবে আপনি কীভাবে (1) এমন চিত্র তৈরি করতে পারেন যা নেটওয়ার্ককে উপলব্ধি করার জন্য বৃহত্তর সক্রিয়করণের দিকে পরিচালিত করে খোঁজ করা; অথবা (২) প্রকৃত ইনপুট চিত্রগুলি নিয়ে যান এবং দেখুন যে চিত্রটির বিভিন্ন অংশ কীভাবে নেটওয়ার্ককে সক্রিয় করে। এই পোস্টে (1) উপর দৃষ্টি নিবদ্ধ করা হয়েছে।

নীচে চিত্রটিতে ওলা এট আল দ্বারা সংযুক্ত নিবন্ধটি থেকে নেওয়া, লেখকরা আপনি যে নেটওয়ার্কটি পরিদর্শন করতে পারেন তার বিভিন্ন দিক নিয়ে আলোচনা করেন। বাম-সর্বাধিক চিত্রটি ইনপুট চিত্রের স্থানের উপরে কোনও নির্দিষ্ট নিউরনের সক্রিয়করণের অনুকূলকরণের ফলাফল প্রদর্শন করে।

সি ওলাহ এট আল

আমি এই নিবন্ধটি সম্পূর্ণরূপে পড়ার পরামর্শ দিচ্ছি যদি আপনি এটির আরও গভীর ধারণা বুঝতে চান এবং এর রেফারেন্সগুলি পড়ে আপনার কী করা হয়েছে তার একটি দুর্দান্ত উপলব্ধি থাকা উচিত।

এখন অবশ্যই এটি ছিল কেবল চিত্রগুলির জন্য যেখানে আমরা মানুষ হিসাবে ইনপুটগুলি উপলব্ধি করতে পারি। আপনি যদি সংখ্যার একটি বৃহত্তর ভেক্টরের মতো ব্যাখ্যা করার জন্য আরও শক্ত করে কিছু নিয়ে কাজ করে থাকেন তবে আপনি এ জাতীয় শীতল দৃশ্যায়ন করতে পারবেন না, তবে নীতিগতভাবে আপনি এখনও বিভিন্ন নিউরন, স্তর এবং ইত্যাদি মূল্যায়নের জন্য এই কৌশলগুলি বিবেচনা করতে পারেন principle ।


2
+1 বিশেষত চূড়ান্ত অনুচ্ছেদের জন্য। আমি ব্যক্তিগতভাবে মনে করি এই বিশাল সংখ্যক পরামিতিগুলিতে ভিজ্যুয়ালাইজেশন করা লোকেরা বেশি করে।
হাইটাও ডু

বিশ্বাসযোগ্য রেফারেন্স সহ ভাল লিখিত দীর্ঘ উত্তর জন্য অবশ্যই +1।
হাইটাও ডু

1
@ hxd1011 আপনাকে ধন্যবাদ, এবং আমি মনে করি যে ওলাহ এট আল এই নিবন্ধটিতে একটি দুর্দান্ত পয়েন্ট দিয়েছেন যে স্তরটি কেবল একটি নিউরনকে সর্বাধিক করে তোলে কেবল তা দেখার পক্ষে সত্যিই ন্যায়সঙ্গত নয় যেহেতু স্তরটি একটি ভিত্তির মতো এবং এটি স্তরটি যে স্থানটি প্রতিনিধিত্ব করে তার চেয়ে বেশি সঠিক ভিত্তি ভেক্টর। মজা দেখার সময়, যদিও এই
দৃশ্যগুলির মধ্যে অনেকগুলি

1
এছাড়াও একটি সাধারণ ভুল ধারণাটি হ'ল প্রথম স্তর ফিল্টারগুলি নেওয়ার সময়, কোনও প্যাচ চিত্র যা কোনও প্রদত্ত নিউরনের আউটপুটকে সর্বাধিক করে তোলে will ফিল্টারটির মতো দেখতে। প্রকৃতপক্ষে নয়, নিউরনের আউটপুটকে সর্বাধিকীকরণকারী একটি প্যাচ ফিল্টারটির সংখ্যাসূচক মানগুলির মতো দেখতে কিছুই লাগে না, কারণ এটির সমাবর্তন, টেমপ্লেট মিল নয়। আমি বিশ্বাস করি যে এখানে বিদ্বেষমূলক উদাহরণ রয়েছে।
লুগি

ওলাহ এট আল। ব্লগ পোস্টটি দুর্দান্ত, তবে তারা ভুল করে - তারা "সর্বাধিক সক্রিয়করণের জন্য অনুকূলিত করে" (ঠিক তেমন নয়, তবে বন্ধ), এমন একটি ছবি খুঁজে পায় যা প্রশিক্ষণের সেট থেকে পাওয়া ছবির মতো দেখতে কিছুই লাগে না এবং এই সিদ্ধান্তে পৌঁছে যে সিএনএনগুলি আমাদের থেকে আলাদাভাবে "দেখায়"। উপসংহারটি স্পষ্টত সত্য হলেও যুক্তি ত্রুটিযুক্ত - একটি উচ্চ-মাত্রিক বিতরণের মোড সেই বিতরণ থেকে সাধারণ নমুনার মতো কিছু দেখায় না। অন্য কথায়, এটি ঠিক কারণ সিএনএনগুলিকে বিড়ালদের শ্রেণীবদ্ধ করা দরকার, যে বিতরণের মোডটি বিড়াল নয়, বরং "দুঃস্বপ্নের বিড়াল" হতে পারে।
ডেল্টাআইভ

7

নিউরাল নেটওয়ার্ক এমন একটি ব্ল্যাক বক্স মডেল যা "বোঝা সহজ" নিয়মগুলি দেয় না / বা যা শিখেছে।

বিশেষত, যা শিখেছে তা হ'ল মডেলের পরামিতিগুলি, তবে পরামিতিগুলি বড় হতে পারে: কয়েক লক্ষ পরামিতি খুব স্বাভাবিক very

তদ্ব্যতীত, শিখে নেওয়া গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি সম্পর্কেও এটি পরিষ্কার নয়, আপনি বুঝতে পারবেন মডেলটি সমস্ত বৈশিষ্ট্য ব্যবহার করে ফলাফলগুলি বের করার জন্য অনেকগুলি জটিল ক্রিয়াকলাপ, যেখানে সরল ইংরেজিতে বলা সহজ নয় যে মডেলটি প্রতিটি বৈশিষ্ট্যকে কীভাবে রূপান্তর করে তা ব্যবহার করে।


আসলে, অ্যাক্টিভেশন ফাংশন হিসাবে লজিস্টিক ফাংশন সহ ওয়ান লেয়ার নিউরাল নেটওয়ার্ক (লুকানো স্তর ছাড়াই) লজিস্টিক রিগ্রেশন-এর সমান। লজিস্টিক রিগ্রেশন ব্যাখ্যায় খুব সমৃদ্ধ। এখানে একটি উদাহরণ। তবে জটিল নিউরাল নেটওয়ার্ক / আরও গোপন স্তরগুলির সাথে, এই ধরনের ব্যাখ্যা প্রযোজ্য হবে না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.