আসলে আমার ধারণা প্রশ্নটি কিছুটা বিস্তৃত! যাই হোক।
কনভলিউশন জাল বোঝা
যা শিখেছে তা ConvNets
শ্রেণিবদ্ধকরণ কার্যগুলিতে ইনপুটগুলি সঠিকভাবে শ্রেণিবদ্ধ করতে ব্যয় ফাংশনটি হ্রাস করার চেষ্টা করে। সমস্ত পরামিতি পরিবর্তন এবং শিখেছি ফিল্টার উল্লিখিত লক্ষ্য অর্জনের জন্য হয়।
বিভিন্ন স্তরের বৈশিষ্ট্যগুলি শিখেছি
তারা নিম্ন স্তরের শিখিয়ে ব্যয় হ্রাস করার চেষ্টা করে, কখনও কখনও অর্থহীন, তাদের প্রথম স্তরগুলিতে অনুভূমিক এবং উল্লম্ব রেখার মতো বৈশিষ্ট্যগুলি এবং তারপরে বিমূর্ত আকার তৈরি করতে তাদের স্ট্যাক করে, যার প্রায়শই অর্থ থাকে, তাদের শেষ স্তরগুলিতে। এই ডুমুর চিত্রিত করার জন্য। 1, যা এখান থেকে ব্যবহৃত হয়েছে , তা বিবেচনা করা যেতে পারে। ইনপুটটি বাস এবং গার্ডটি প্রথম স্তরের বিভিন্ন ফিল্টারের মাধ্যমে ইনপুট পাস করার পরে অ্যাক্টিভেশনগুলি দেখায়। এটি যেমন দেখা যায় যে লাল ফ্রেমটি ফিল্টারটির সক্রিয়করণ, যা এর পরামিতিগুলি শিখেছে, অপেক্ষাকৃত অনুভূমিক প্রান্তগুলির জন্য সক্রিয় করা হয়েছে। তুলনামূলকভাবে উল্লম্ব প্রান্তগুলির জন্য নীল ফ্রেমটি সক্রিয় করা হয়েছে। এটা সম্ভবConvNets
অজানা ফিল্টারগুলি দরকারী যা শিখুন এবং আমরা যেমন কম্পিউটার ভিশন অনুশীলনকারীরা আবিষ্কার করি নি যে সেগুলি কার্যকর হতে পারে। এই জালগুলির সর্বোত্তম অংশটি হ'ল তারা নিজেরাই উপযুক্ত ফিল্টারগুলি সন্ধান করার চেষ্টা করে এবং আমাদের সীমাবদ্ধ আবিষ্কারকৃত ফিল্টারগুলি ব্যবহার করে না। তারা ব্যয় কার্যকারিতার পরিমাণ হ্রাস করতে ফিল্টারগুলি শিখেছে। উল্লিখিত হিসাবে এই ফিল্টারগুলি অগত্যা জানা যায় না।
গভীর স্তরগুলিতে, পূর্ববর্তী স্তরগুলিতে শিখে নেওয়া বৈশিষ্ট্যগুলি একত্রিত হয়ে আকার তৈরি করে যার প্রায়শ অর্থ হয়। ইন এই কাগজ এটা আলোচনা করা হয়েছে এই তিনটি স্তরের সক্রিয়করণব্যবস্থা যা আমাদের বা ধারণা যা আমাদের কাছে অর্থ আছে মানুষ হিসেবে, এর অর্থপূর্ণ হয় থাকতে পারে, অন্যান্য সক্রিয়করণব্যবস্থা মধ্যে বিতরণ করা যেতে পারে। ডুমুর মধ্যে। 2 সবুজ ফ্রেম এ এর পঞ্চম স্তরটিতে একটি ফিল্টারটির অ্যাক্টিভ্যাটিনগুলি দেখায়ConvNet
। এই ফিল্টারটি মুখগুলি সম্পর্কে যত্নশীল। মনে করুন যে লাল চুলটি যত্ন করে। এগুলির অর্থ রয়েছে। যেমন দেখা যায় যে অন্যান্য সক্রিয়তা রয়েছে যা ডানদিকে ইনপুটটিতে সাধারণত চেহারাগুলির অবস্থানের সাথে সক্রিয় করা হয়েছে, সবুজ ফ্রেম তাদের মধ্যে একটি; নীল ফ্রেম এগুলির আরও একটি উদাহরণ। তদনুসারে, আকারগুলির বিমূর্ততা একটি ফিল্টার বা অসংখ্য ফিল্টার দ্বারা শিখতে পারে। অন্য কথায়, প্রতিটি ধারণা, যেমন মুখ এবং এর উপাদানগুলি ফিল্টারগুলির মধ্যে বিতরণ করা যায়। যে ধারণাগুলি বিভিন্ন স্তরের মধ্যে বিতরণ করা হয়েছে সেখানে যদি কেউ তাদের প্রতিটিটির দিকে নজর দেয় তবে সেগুলি পরিশীলিত হতে পারে। তথ্যগুলি তাদের মধ্যে বিতরণ করা হয়েছে এবং সেই তথ্যগুলি বোঝার জন্য সেই সমস্ত ফিল্টার এবং তাদের ক্রিয়াকলাপগুলি বিবেচনা করতে হবে যদিও এগুলি এত জটিল বলে মনে হচ্ছে।
CNNs
একেবারে কালো বক্স হিসাবে বিবেচনা করা উচিত নয়। Zeiler এবং সব মধ্যে এই আশ্চর্যজনক কাগজ আলোচনা করেছি ভাল মডেলের উন্নয়ন শুদ্ধাশুদ্ধি কমিয়ে আনা কি আপনি এই জাল ভিতরে সম্পন্ন করা হয় বোঝার না থাকলে। এই কাগজটি বৈশিষ্ট্য মানচিত্রের মধ্যে কল্পনা করার চেষ্টা করে ConvNets
।
সাধারণকরণের জন্য বিভিন্ন রূপান্তর পরিচালনা করার ক্ষমতা Hand
ConvNets
ব্যবহার pooling
স্তর না শুধুমাত্র পরামিতি সংখ্যা কমাতে কিন্তু সামর্থ্য প্রতিটি বৈশিষ্ট্য সঠিক অবস্থানে অবশ হতে আছে। এছাড়াও এগুলির ব্যবহার স্তরগুলি বিভিন্ন বৈশিষ্ট্যগুলি শিখতে সক্ষম করে যার অর্থ প্রথম স্তরগুলি নিম্ন নিম্ন স্তরের বৈশিষ্ট্যগুলি যেমন প্রান্ত বা আর্কসগুলি শেখায় এবং গভীর স্তরগুলি চোখ বা ভ্রুয়ের মতো আরও জটিল বৈশিষ্ট্যগুলি শিখবে। Max Pooling
যেমন একটি বিশেষ অঞ্চলে একটি বিশেষ বৈশিষ্ট্য বিদ্যমান কিনা তা খতিয়ে দেখার চেষ্টা করে। pooling
স্তরগুলির ধারণাটি এত দরকারী তবে এটি অন্যান্য রূপান্তরগুলির মধ্যে রূপান্তর পরিচালনা করতে সক্ষম। যদিও বিভিন্ন স্তরগুলিতে ফিল্টারগুলি বিভিন্ন ধরণের সন্ধান করার চেষ্টা করে, যেমন একটি ঘোরানো মুখ স্বাভাবিক মুখের চেয়ে বিভিন্ন স্তর ব্যবহার করে শিখে নেওয়া হয়,CNNs
নিজস্ব রূপে অন্যান্য রূপান্তরগুলি পরিচালনা করার জন্য কোনও স্তর নেই। এই উদাহরণস্বরূপ উদাহরণস্বরূপ, ধরুন আপনি কোনও ন্যূনতম নেট দিয়ে কোনও আবর্তন ছাড়াই সাধারণ মুখগুলি শিখতে চান। এই ক্ষেত্রে আপনার মডেল এটি পুরোপুরি করতে পারে। মনে করুন যে আপনাকে নির্বিচারে মুখের আবর্তনের সাথে সমস্ত ধরণের মুখ শিখতে বলা হয়েছে। এক্ষেত্রে আপনার মডেলটি আগের শিখে নেওয়া নেট থেকে অনেক বেশি বড় হতে হবে। কারণ হ'ল ইনপুটটিতে এই ঘূর্ণনগুলি শিখতে ফিল্টার থাকতে হবে। দুর্ভাগ্যক্রমে এগুলি সমস্ত রূপান্তর নয়। আপনার ইনপুটটিও বিকৃত হতে পারে। এই মামলাগুলি ম্যাক্স জ্যাডারবার্গ এবং সমস্তকেই ক্ষুব্ধ করেছিল। তারা এই কাগজটি এই সমস্যাগুলি মোকাবিলার জন্য রচনা করেছিল যাতে তাদের ক্ষোভকে তাদের হিসাবে সমাধান করতে পারে।
কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি কাজ করে
অবশেষে এই পয়েন্টগুলি উল্লেখ করার পরে, তারা কাজ করে কারণ তারা ইনপুট ডেটাতে নিদর্শনগুলি সন্ধান করার চেষ্টা করে। তারা কনভলিউশন স্তরগুলি দ্বারা বিমূর্ত ধারণা তৈরি করতে তাদের স্তুপ করে। ইনপুট ডেটাটি কোন শ্রেণীর অন্তর্ভুক্ত তা নির্ধারণ করার জন্য ইনপুট ডেটাতে এই ধারণাগুলির প্রত্যেকটি রয়েছে কি না সেখানে ঘন স্তরগুলির মধ্যে রয়েছে কিনা তা অনুসন্ধান করার চেষ্টা করছেন তারা।
আমি কিছু লিঙ্ক যুক্ত করছি যা সহায়ক: