আমরা যে প্রকল্পে কাজ করছি তার উপর ভিত্তি করে আমার একটি আকর্ষণীয় আলোচনা উপস্থিত হয়েছিল: অ্যালগরিদমের সাথে টেমপ্লেটের সাথে মিল রেখে সিএনএন ভিজ্যুয়াল ইন্সপেকশন সিস্টেমটি কেন ব্যবহার করবেন?
পটভূমি: আমি একটি সাধারণ সিএনএন ভিশন সিস্টেম (ওয়েবক্যাম + ল্যাপটপ) এর একটি ডেমো দেখিয়েছি যা সনাক্ত করেছে যে কোনও নির্দিষ্ট ধরণের অবজেক্টটি "ভাঙ্গা" / ত্রুটিযুক্ত কিনা - এই ক্ষেত্রে, একটি পিসিবি সার্কিট বোর্ড। আমার সিএনএন মডেলটিকে স্থির পটভূমিতে সঠিক এবং ভাঙ্গা সার্কিট বোর্ডগুলির (প্রতিটিগুলির প্রায় 100 টি চিত্র) উদাহরণ দেখানো হয়েছিল। আমাদের মডেল প্রি-প্রশিক্ষিত ভিজিজি 16 (ইমেজনেটে) এর প্রথম কয়েকটি কুন / ম্যাকপুল স্তর ব্যবহার করেছিল এবং তারপরে আমরা কয়েকটি ঘন ঘন দিয়ে আরও কয়েকটি প্রশিক্ষণযোগ্য কনস / পুল যুক্ত করেছি, যার ফলে শ্রেণিবিন্যাসের জন্য একটি ডিমে -3 এক হট এনকোডযুক্ত ভেক্টর আউটপুট তৈরি করা হয়েছে : (is_empty, has_good_product, has_defective_product)।
মডেলটি খুব সহজে প্রশিক্ষিত হয়েছে এবং 99% এর বৈধতা কোনও সমস্যা নেই; আমরা জানি যে আমাদের ডেটাসেটটি ছোট ছিল তাই আমরা বিভিন্ন ডেটা বৃদ্ধির প্রশিক্ষণও দিয়েছি। অনুশীলনে, এটি 10 এর মধ্যে প্রায় 9 বার কাজ করেছে, তবে একই সার্কিট বোর্ডের কয়েকটি এলোমেলো অনুবাদ / ঘূর্ণন মাঝে মাঝে এটিকে বিপরীত শ্রেণিতে ফেলে দেয়। সম্ভবত আরও আক্রমণাত্মক ডেটা বৃদ্ধি সাহায্য করবে helped যাইহোক, একটি প্রোটোটাইপ ধারণা প্রকল্পের জন্য আমরা খুশি।
এখন আমরা অন্য প্রকৌশলী এবং তার সহকর্মীর কাছে উপস্থাপন করছিলাম, এবং তিনি এই যুক্তিটি উপস্থিত করলেন যে এনএনগুলি এর জন্য বেশি পরিমাণে চলাফেরা করছে, কেবল টেমপ্লেট মেলানো উচিত, কেন কোনও সিএনএন করতে চাইবে?
আমাদের অ্যাপ্লিকেশন কেন নির্দিষ্ট অ্যাপ্লিকেশনগুলিতে (যেমন পরিদর্শন করার জন্য অন্যান্য অংশ) আরও ভাল হতে পারে তার জন্য আমাদের কাছে দুর্দান্ত উত্তর নেই। আমরা কিছু বিষয় তুলে ধরেছি:
1) আক্রমণকারীদের কাছে আরও শক্তিশালী (যেমন ডেটা বর্ধনের মাধ্যমে)
2) সিস্টেমটি উন্নত করতে অনলাইনে শেখা যায় (উদাহরণস্বরূপ মানুষ সফ্টওয়্যারটিকে বলতে পারে যে এটির উদাহরণগুলি কী ভুল হয়েছে)
3) ক্লাসিকাল কম্পিউটার ভিশন অ্যালগরিদমগুলির মতো থ্রেশহোল্ডগুলি সেট করার দরকার নেই আপনি ছেলেরা কী মনে করেন, এই জাতীয় পরিদর্শন কাজের জন্য সিএনএন সিস্টেমের আরও সুবিধা রয়েছে কি? কোন ক্ষেত্রে এটি টেমপ্লেট মিলের চেয়ে ভাল হবে?
ডিপ এনএনএস যখন কাজের জন্য প্রযুক্তি হতে পারে তার জন্য আরও কয়েকটি এলোমেলো ধারণা: যে সিস্টেমগুলির জন্য ইনপুটটির অংশ হিসাবে 3 ডি গভীরতা সংবেদনের প্রয়োজন হয়, বা যে কোনও ধরণের অবজেক্ট যা বিকৃত / প্রসারিত / স্কুইড হতে পারে তবে এখনও "ভাল" হতে পারে এবং ত্রুটিযুক্ত নয় (যেমন একটি স্টাফ করা প্রাণী, তার, ইত্যাদি)। আপনার চিন্তা শুনতে আগ্রহী :)