লোগো সনাক্তকরণের জন্য এআই বা নিউরাল নেটওয়ার্ক ব্যবহার করুন


10

আমি একটি ভিডিও ফাইলের অভ্যন্তরে একটি টিভি চ্যানেলের লোগো সনাক্ত করার চেষ্টা করছি, তাই কেবল একটি ইনপুট .mp4ভিডিও দেওয়া হয়েছে , এটিতে নির্দিষ্ট ফ্রেমে সেই লোগো উপস্থিত রয়েছে কিনা তা সনাক্ত করুন , প্রথম ফ্রেম বলুন বা না।

আমাদের কাছে সেই লোগো আগাম রয়েছে (যদিও এটি% 100 একই আকারের নাও হতে পারে) এবং অবস্থানটি সর্বদা স্থির থাকে।

আমি ইতিমধ্যে একটি প্যাটার্ন ম্যাচিং-ভিত্তিক পদ্ধতির আছে। তবে এর জন্য প্যাটার্নটি% 100 একই আকারের হওয়া দরকার। আমি এটি অর্জনের জন্য ডিপ লার্নিং এবং নিউরাল নেটওয়ার্ক ব্যবহার করতে চাই। আমি এটা কিভাবে করবো? আমি বিশ্বাস করি সিএনএন এর উচ্চ দক্ষতা থাকতে পারে?


1
এআই তে আপনাকে স্বাগতম! দুর্দান্ত বিষয়।
ডিউকঝো

1
পুনঃটুইট আমি আশা করি কিছু নমুনা কোডের পয়েন্টার সহ সঠিক উত্তর পেয়েছি।
টিনা জে

উত্তর:


5

চিত্র সনাক্তকরণ সম্পাদন করতে আপনাকে নির্দিষ্ট বৈশিষ্ট্য সহ কোনও চিত্র উপস্থাপনের জন্য একটি উপায় খুঁজে বের করতে হবে।

একটি ভাল চিত্র স্বীকৃতি অ্যালগরিদমের একটি নির্দিষ্ট বৈশিষ্ট্য হ'ল এটি প্রধান অঞ্চলগুলি সনাক্ত করার ক্ষমতা, যা সর্বাধিক তথ্য রয়েছে এমন অঞ্চলগুলি সনাক্ত করার ক্ষমতা

এই মুহূর্তে বিষয়বস্তু-ভিত্তিক চিত্রের শ্রেণিবিন্যাসের জন্য গভীর শিক্ষার দিকে অনেক বেশি মনোযোগ রয়েছে। সিএনএন এর তিন বা ততোধিক স্তর রয়েছে যেখানে প্রতিটি স্তর চিত্রের এক বা একাধিক বৈশিষ্ট্য আহরণের জন্য দায়বদ্ধ সেখানে গভীর শিক্ষার প্রয়োগ করে আপনি সুনির্দিষ্ট ফলাফল অর্জন করতে পারেন।


ধন্যবাদ। আমি নিজে সিএনএন লোক নই। কিন্তু কোনও সোর্স কোডের কোনও পয়েন্টার রয়েছে যা একটি লোগো চিত্র দেয়, এটি সনাক্ত করতে পারে যে এটি বিদ্যমান কিনা না?
টিনা জে

3
আরে, দয়া করে সাতোজ কোভিকের গিথুবে ডিপলোগোটি দেখুন। এটি পাইথনে লেখা এবং ব্র্যান্ড লোগোগুলি সনাক্ত করতে সিএনএন ব্যবহার করে। আমি নীচের লিঙ্কটি পোস্ট করেছি। চিয়ার্স। github.com/satojkovic/ প্রদীপ লোগো
শেঠ সিম্বা

3

কারণ এটি ভিডিও ইনপুট এবং লোগোগুলি সাধারণত স্থির থাকে কারণ তারা হার্ডওয়্যার বা সফ্টওয়্যার দ্বারা লাইভ বা রেকর্ড করা ফ্রেমগুলির উপরে স্তরযুক্ত, কাজটি কঠিন নয়। লোগোতে সাধারণত রঙিন প্যালেট এবং খাস্তা প্রান্ত থাকে। তাদের হরফগুলির বৈশিষ্ট্যগুলি যখন তারা শব্দ বা সংক্ষিপ্ত শব্দটি বানান করে তবে সাধারণত সুসংগত হয়। এগুলি এমন সাধারণত্ব যা গভীর শিক্ষায় কাজে লাগানো যায়।

এই লেখকের পোস্ট করা অন্যান্য অনুরূপ প্রশ্নের মতো, এলএসটিএম এবং সিএনএন স্তরগুলির সংমিশ্রণটি লোগোটি সন্ধান এবং বিচ্ছিন্ন করার প্রশিক্ষণ দেওয়া যেতে পারে। কিছু চিত্র কৌশল সহ, লোগোটির পিছনের চিত্রটি একই ধরণের শেখার কৌশলগুলির মাধ্যমে লোগোর চারপাশে পিক্সেল থেকে যুক্তিসঙ্গত নির্ভুলতা এবং নির্ভরযোগ্যতার সাথে পুনর্গঠন করা যেতে পারে।

এগুলি উন্নয়নের জন্য কয়েকটি প্রাথমিক পয়েন্ট।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.