নিউরাল নেটওয়ার্ক কীভাবে চিত্রগুলি চিনতে পারে?


25

আমি কীভাবে নিউরাল নেটওয়ার্ক চিত্র স্বীকৃতিতে কাজ করে তা জানার চেষ্টা করছি। আমি কিছু উদাহরণ দেখেছি এবং আরও বিভ্রান্ত হয়ে পড়েছি। একটি 20x20 চিত্রের চিঠি স্বীকৃতির উদাহরণে, প্রতিটি পিক্সেলের মানগুলি ইনপুট স্তর হয়ে যায়। সুতরাং 400 নিউরন। তারপরে নিউরন এবং 26 আউটপুট নিউরনের একটি লুকানো স্তর। তারপরে নেটওয়ার্কটি প্রশিক্ষণ দিন এবং তারপরে এটি কার্যকর হয়।

নিউরাল নেটওয়ার্ক সম্পর্কে আমাকে কী বিভ্রান্ত করেছে তা হল, এটি একটি চিত্রের মধ্যে কী আছে তা কীভাবে শিখবে। আপনার থ্রোহোল্ডিং বা বিভাগকরণ বা পরিমাপ করার দরকার নেই, কোনওভাবে নেটওয়ার্ক চিত্রগুলির তুলনা করতে এবং সনাক্ত করতে শেখে। এটা এখন আমার কাছে ম্যাজিকের মতো। স্নায়ুর নেটওয়ার্ক শিখতে কোথায়?


1
যদি আমি সঠিকভাবে বুঝতে পারি তবে একটি নিউরাল নেটওয়ার্ক কিছু বিমূর্ত জায়গায় কেবলমাত্র একটি বহুমাত্রিক পৃষ্ঠ যা স্থানীয় চূড়ান্ত সম্ভাব্য পছন্দগুলিতে নিয়ে যায়। নিউরাল নেটওয়ার্ক শেখানো কেবল এই বিমূর্ত পৃষ্ঠটিকে তার কাজটিতে সামঞ্জস্য করছে। এটা আমার নুবিশ বোঝা।

সুতরাং আপনি এনএনএস নিয়ে কাজ শুরু করার জন্য ব্যাখ্যা বা সংস্থানগুলি চান? এটি স্পষ্ট করে বলতে হবে।

2
আপনার প্রশ্নের জন্য উত্সর্গীকৃত কোর্সে একটি দুর্দান্ত ফ্রি কোর্স রয়েছে (বর্তমানে)। coursera.org/course/neuralnets
pat

কোর্সেরা এনএন ক্লাসটি দেখে মনে হচ্ছে এটি উন্নত হবে, পরিচিতির মতো এত ভাল নয়। অ্যান্ড্রু এনগের আরও কিছু মৃদু পরিচয় রয়েছে যা আপনি ইউটিউবে উদাহরণস্বরূপ খুঁজে পেতে পারেন।
ডগলাস জারে

আসলে, কোর্সেরা কোর্সটি উন্নত হয় তবে এটি অবশ্যই তৈরি হয় এবং ওপির প্রশ্নের উত্তরটি বেশ ভালভাবেই দেয়। অঙ্ক স্বীকৃতিতেও এর প্রচুর উদাহরণ রয়েছে।
ক্রিস এ।

উত্তর:


24

স্নাতক নেটওয়ার্ক কীভাবে জটিল কিছুকে শ্রেণিবদ্ধ করতে শিখতে পারে তার একটি বড় অন্তর্দৃষ্টি মাত্র উদাহরণ এবং সঠিক উত্তর দেওয়া 1980 এর দশকে নব্যপরিচয় সম্পর্কে প্রফেসর কুনিহিকো ফুকুশিমার কাজ অধ্যয়নকালে আমার কাছে এসেছিল। তার নেটওয়ার্ককে কেবল একগুচ্ছ চিত্র দেখানোর পরিবর্তে এবং নিজের মতো করে জিনিসগুলি চিহ্নিত করতে ব্যাক-প্রসারণ ব্যবহার করার পরিবর্তে, তিনি একটি ভিন্ন পদ্ধতির গ্রহণ করেছিলেন এবং তার নেটওয়ার্ক স্তরটিকে স্তর দ্বারা প্রশিক্ষণ দিয়েছিলেন, এমনকি নোড দ্বারা নোডও রেখেছিলেন। তিনি নেটওয়ার্কের প্রতিটি স্বতন্ত্র নোডের কার্যকারিতা এবং পরিচালনা বিশ্লেষণ করেছেন এবং উদ্দেশ্যমূলক উপায়ে প্রতিক্রিয়া জানানোর জন্য সেগুলির অংশগুলি উদ্দেশ্যমূলকভাবে সংশোধন করেছিলেন।

উদাহরণস্বরূপ, তিনি জানতেন যে তিনি চান যে নেটওয়ার্কটি লাইনগুলি সনাক্ত করতে সক্ষম হবে, তাই তিনি তিনটি পিক্সেল অনুভূমিক রেখা, 3 পিক্সেল উল্লম্ব রেখা এবং সমস্ত কোণে তির্যক রেখার নির্দিষ্ট প্রকরণগুলি সনাক্ত করতে নির্দিষ্ট স্তর এবং নোডকে প্রশিক্ষণ দিয়েছিলেন। এটি করার মাধ্যমে তিনি জানতেন যে কাঙ্ক্ষিত নিদর্শনগুলির অস্তিত্ব থাকলে নেটওয়ার্কের কোন অংশগুলিতে আগুন লাগতে পারে। তারপরে, যেহেতু প্রতিটি স্তর অত্যধিক সংযুক্ত, সামগ্রিকভাবে পুরো নিউকগনিট্রন ইমেজটিতে উপস্থিত প্রতিটি যৌগিক অংশগুলি তাদের শারীরিকভাবে বিদ্যমান কিনা তা চিহ্নিত করতে পারে। সুতরাং যখন নির্দিষ্ট রেখার বিভাগটি কোথাও চিত্রের কোথাও বিদ্যমান ছিল, সেখানে সর্বদা একটি নির্দিষ্ট নোড থাকত যা আগুন ধরিয়ে দেয়।

এই চিত্রটিকে সদা উপস্থিত রেখে, লিনিয়ার রিগ্রেশন বিবেচনা করুন যা কেবল স্কোয়ার ত্রুটির যোগফলের মাধ্যমে একটি সূত্র (বা একটি লাইন) সন্ধান করছে যা আপনার ডেটা দিয়ে সর্বাধিক কাছাকাছি চলে যায়, এটি বুঝতে যথেষ্ট সহজ। বাঁকানো "লাইনগুলি" সন্ধান করতে আমরা একই পরিমাণে পণ্য গণনা করতে পারি, এখন বাদে আমরা x ^ 2 বা x ^ 3 বা আরও উচ্চতর অর্ডার পলিনোমিয়ালগুলির কয়েকটি পরামিতি যুক্ত করি। এখন আপনার কাছে একটি লজিস্টিক রিগ্রেশন শ্রেণিবদ্ধ রয়েছে। এই শ্রেণিবদ্ধকারী এমন সম্পর্ক খুঁজে পেতে পারেন যা প্রকৃতির লিনিয়ার নয়। আসলে লজিস্টিক রিগ্রেশন এমন সম্পর্ক প্রকাশ করতে পারে যা নির্বিচারে জটিল, তবে আপনাকে এখনও ডেটা পূর্বাভাস দেওয়ার জন্য ভাল কাজ করার জন্য ম্যানুয়ালি পাওয়ার বৈশিষ্ট্যগুলির সঠিক সংখ্যা চয়ন করতে হবে।

নিউরাল নেটওয়ার্কটি ভাবার একটি উপায় হ'ল শেষ স্তরটিকে লজিস্টিক রিগ্রেশন শ্রেণিবদ্ধ হিসাবে বিবেচনা করা এবং তারপরে লুকানো স্তরগুলি স্বয়ংক্রিয় "বৈশিষ্ট্য নির্বাচনকারী" হিসাবে বিবেচনা করা যেতে পারে । এটি ম্যানুয়ালি ইনপুট বৈশিষ্ট্যগুলির সঠিক সংখ্যা এবং শক্তি চয়ন করার কাজটি সরিয়ে দেয়। সুতরাং, এনএন একটি স্বয়ংক্রিয় শক্তি বৈশিষ্ট্য নির্বাচক হয়ে ওঠে এবং কোনও লিনিয়ার বা অ-লিনিয়ার সম্পর্ক খুঁজে পেতে পারে বা নির্বিচারে জটিল সেটগুলির শ্রেণিবদ্ধ হিসাবে পরিবেশন করতে পারে ** (এটি কেবল ধরে নিচ্ছে, এর জটিলতার প্রতিনিধিত্ব করার জন্য পর্যাপ্ত গোপন স্তর এবং সংযোগ রয়েছে) মডেলটি শিখতে হবে) শেষ পর্যন্ত, একটি ভাল কার্যক্ষম এনএন আশা করে যে ইনপুট এবং আউটপুটগুলির মধ্যে কেবল "সম্পর্ক" শিখবে না, পরিবর্তে আমরা একটি বিমূর্ততা বা একটি মডেলের জন্য চেষ্টা করি যাজেনারালাইজেশন ভাল।

থাম্বের নিয়ম হিসাবে, নিউরাল নেটওয়ার্ক তাত্ত্বিকভাবে একই ডেটা থেকে পর্যাপ্ত সময় না শিখতে পারে না যুক্তিযুক্ত বুদ্ধিমান মানুষ এমন কিছু শিখতে পারে না,

  • এটি এখনও কেউ খুঁজে পায়নি এমন কিছু কিছু জানতে সক্ষম হতে পারে
  • বড় সমস্যার জন্য কম্পিউটার ব্যাংক প্রসেসিং নিউরাল নেটওয়ার্ক একটি দলের লোকের চেয়ে অনেক দ্রুত (খুব কম ব্যয়ে) সত্যিই ভাল সমাধান খুঁজে পেতে পারে
  • একবার প্রশিক্ষণ প্রাপ্ত এনএনগুলি তাদের প্রশিক্ষণ প্রাপ্ত ইনপুটগুলির সাথে একমত হওয়ার ফলাফল তৈরি করবে এবং সঠিকভাবে টুইট করা হলে ভাল করা উচিত
  • এনএন কখনও বিরক্ত বা বিচলিত হয় না

1
লুকানো স্তরের বৈশিষ্ট্য নির্বাচনের শীর্ষে শেষ স্তরটি কীভাবে লজিস্টিক রিগ্রেশন করে তা সম্পর্কে অনুচ্ছেদের জন্য +1। এনএনএস সম্পর্কে চিন্তাভাবনা করার এটি দুর্দান্ত উপায়।
jlund3

ধন্যবাদ, তবে আমার স্পষ্ট করে বলা উচিত যে আমি ঠিক বলতে পারছি না যে প্রতিটি এএনএন এর শেষ স্তরটি আসলে একটি লজিস্টিক রিগ্রেশন স্তর, তবে কেবল এটিই একটি সম্ভাব্য কনফিগারেশন যা অনেক সমস্যার সমাধান করতে পারে। বেশিরভাগ এলোমেলো উপায়ে আমরা সাধারণত এএনএন-এর প্রশিক্ষণপ্রাপ্ত সম্ভবত কোনও রেজেন্টাল রিগ্রেশন অনেক নোড এবং স্তরগুলিতে খুব এলোমেলোভাবে ছড়িয়ে পড়ে। কেউ উপ-নেটওয়ার্কগুলিকে নির্দিষ্ট উপায়ে প্রতিক্রিয়া জানাতে প্রশিক্ষণ দিতে পারে এবং তারপরে নির্দিষ্ট সমস্যার জন্য কারুকর্ম বিশেষায়িত নেটওয়ার্কগুলি হস্তান্তর করার জন্য সেগুলির আউটপুটটিকে রিগ্রেশন লেয়ারে পাম্প করতে পারে। এএনএন মেমরি এবং গতিতে অত্যন্ত দক্ষ করে তোলা।
এমসিস্টার

1
এই উত্তরটি দর্শন পেতে থাকে, তাই আমি ভেবেছিলাম যে আমি এখন এটি 5 বছরেরও বেশি পুরানো হয়েছি এবং কেবলমাত্র সম্পূর্ণরূপে সংযুক্ত নেটওয়ার্কদের ফিড বিবেচনা করে। যদিও এখানে ধারণাগত অন্তর্দৃষ্টি এখনও বৈধ, তারা চিকিত্সককে গভীর এনএন ধারণাগুলি বুঝতে যথেষ্ট পরিমাণে দেয় না যা গত দশকে স্ট্যান্ডার্ড হয়ে গেছে। সিএনএন (কনভ্যুশনাল নিউরাল নেটওয়ার্ক) একটি অত্যন্ত গুরুত্বপূর্ণ আধুনিক অভিযোজন যা গভীর নেটওয়ার্কগুলিকে প্রান্ত, বৈসাদৃশ্য, তীক্ষ্ণতা, রঙের স্পেস, ছায়া গো এবং আরও অনেক কিছু সনাক্ত করতে এবং নিম্ন স্তরের বৈশিষ্ট্যগুলির প্রসঙ্গ নির্ধারণের জন্য এটি ব্যবহার করার মাধ্যমে গভীর ক্ষমতা সরবরাহ করে।
এমসিস্টার

10

আপনি শুনে থাকতে পারেন যে নিউরাল নেটওয়ার্কগুলি " সার্বজনীন ফাংশন আনুমানিক " ima সংক্ষেপে, সাইবেঙ্কো উপপাদ্য বলেছেন যে কোনও ফাংশনের জন্য বাস্তবের ম্যাপিংয়ের জন্য, আপনি সিগময়েড অ্যাক্টিভেশন ফাংশন সহ একটি নিউরাল নেটওয়ার্ক দিয়ে এটি আনুমানিক করতে পারেন। প্রকৃতপক্ষে, এটি দেখা গেছে যে নিউরাল নেটওয়ার্কগুলি আপনাকে কোনও ট্যুরিং মেশিনের দ্বারা গণ্যযোগ্য কোনও ফাংশন গণনা করার অনুমতি দেয় (অর্থাত্ যে কোনও কিছুই আপনি গণনা করার জন্য অ্যালগরিদম লিখতে পারেন)। দুর্ভাগ্যক্রমে, এই প্রমাণগুলি কেবলমাত্র বলে যে নিউরন এবং ওজনের কিছু সীমাবদ্ধ কনফিগারেশনের জন্য, আপনি কোনও ফাংশন আনুমানিক করতে পারেন।

তত্ত্বটি সমস্ত সুন্দর এবং জঘন্য, তবে আপনার প্রশ্নটি কীভাবে কিছু ফাংশনের গণনাটিকে নিউরন এবং ওজনগুলির একটি সেটে প্রকৃতপক্ষে এনকোড করতে পারে তার প্রান্তে আরও বেশি বলে মনে হচ্ছে। উদাহরণস্বরূপ, একটি সাধারণ উদাহরণ বিবেচনা করুন - একচেটিয়া-বা। এক্সওআর দুটি ইনপুট নেয়, সেই ইনপুটগুলি পাস করে। যখন এক এবং কেবল একটি ইনপুট সক্রিয় হয়, তখন আউটপুট নোড সক্রিয় হয় activ উভয় বা কোনও ইনপুট সক্রিয় না হলে আউটপুট নোড সক্রিয় হয় না ated

উইকিপিডিয়া থেকে ধার করা এক্সওআর গণনা করতে সক্ষম একটি তিন স্তর পার্সেপট্রন নেট।

লক্ষ্য করুন যে তিনটি লুকানো নোড বিভিন্ন কাজ করে। বাম সর্বাধিক এবং ডান সর্বাধিক নোডগুলি কেবল সম্মান ইনপুট নোডগুলির ক্রিয়াকলাপ দিয়ে যায়। মাঝারি নিউরন দুটি ইনপুট নেয় এবং কোনওভাবে তারা উভয় চালু থাকলে তা এড়িয়ে যায়। এই চতুর সংমিশ্রণ এবং ইনপুটগুলির পুনরায় সমন্বয় করা মূলত কীভাবে নিউরাল নেটওয়ার্কে কাজ করা হয়।

স্পষ্টতই আরও জটিল ফাংশনগুলির জন্য সংমিশ্রণ এবং পুনরায় সংযুক্তি অবশ্যই আরও চতুর এবং জটিল উপায়ে করা উচিত, তবে এটি সংক্ষেপে যা নিম্ন স্তরে ঘটে at পাগল জিনিসটি হ'ল যে কোনও গণনীয় ফাংশন গণনা করার জন্য এটি আপনার কেবল প্রয়োজন! তারপরে, টিউরিং মেশিনগুলিও বিভ্রান্তিকরভাবে সরল হয়ে উঠল ...

সমস্যাটি হ'ল আমাদের কাছে সত্যই কোনও জালিকভাবে নিউরাল জেনারেট করার উপায় নেই যা কিছু স্বেচ্ছাসেবী ফাংশন গণনা করে। প্রমাণগুলি কেবল আমাদের জানায় যে সেখানে কিছু নেটওয়ার্ক রয়েছে যা এটি করতে পারে। যখন আমরা আমাদের নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দিই, আমরা কেবল এমন একটি নেটওয়ার্ক অনুসন্ধান করার চেষ্টা করি যা বেশ কাছাকাছি is

চিত্রের স্বীকৃতি প্রসঙ্গে আপনি নেটওয়ার্কে এনকোডিং নিদর্শনগুলি কল্পনা করতে পারেন। উদাহরণস্বরূপ, '1' নম্বরটি সনাক্ত করতে, আপনি এমন একটি লুকানো নোড কল্পনা করতে পারেন যা পিক্সেলের কলামটি বেশিরভাগ বা সমস্ত সক্রিয় হওয়ার আশা করে, প্রতিবেশী পিক্সেল বন্ধ থাকবে। এই লুকানো নোডটি নির্দিষ্ট কলামে একটি সরল রেখা সনাক্ত করতে মোটামুটি ভাল হতে পারে। এগুলি যথেষ্ট পরিমাণে একসাথে রেখে দিন এবং খুব শীঘ্রই আপনার কাছে এমন একটি নোড রয়েছে যা এটি আপনার চিত্রের পর্যাপ্ত জায়গাগুলিতে করে যে আমি যদি নেটওয়ার্কটিকে একটি দেখায় তবে যথেষ্ট 'সরলরেখার গোপন নোডগুলি সক্রিয় হবে, এটি একটি' 1 'নির্দেশ করে। অবশ্যই সমস্যাটি নেটওয়ার্ককে সাধারণীকরণে পরিণত করে যাতে এটি বিভিন্ন ইনপুটগুলির সেটটি সনাক্ত করতে পারে।

আশা করি এটি আপনাকে নিউরাল নেটওয়ার্ক কীভাবে গণনা সম্পাদন করতে পারে তার ধারণাগুলি কমবেশি বুঝতে সহায়তা করে। তবে, আপনি এমন একটি বিন্দুটি আঘাত করেছেন যা নিউরাল নেটওয়ার্কগুলি সম্পর্কে গুরুত্বপূর্ণ: সাধারণভাবে বোঝা মুশকিল কেন নেটওয়ার্কটি একটি নির্দিষ্ট আউটপুট ছিটিয়ে দেয়, বিশেষত যখন আপনি ইমেজ স্বীকৃতির মতো কিছু বিবেচনা করেন, তখন নেটওয়ার্কগুলি সাধারণত মানুষের পক্ষে মেশিনের প্রতিটি চলমান অংশ বোঝার পক্ষে যথেষ্ট সময় রয়েছে। বিষয়টি আরও জটিল করে তুলে ধরা হচ্ছে যে সাধারণভাবে বেশিরভাগ নিউরাল নেটওয়ার্কগুলির প্রতিটি সামান্য বৈশিষ্ট্যের জন্য নেটওয়ার্কের ডেটা সম্পর্কে জানতে পারে এমন একটি গোপন নোড থাকে না। পরিবর্তে, '1' সংখ্যাটিকে শ্রেণিবদ্ধ করার জন্য একটি সরল রেখার মতো কিছু সনাক্ত করা অনেকগুলি গোপন নোডের উপর একটি কেন্দ্র-বিনীত পদ্ধতিতে ঘটবে। অন্যান্য অ্যালগরিদম,

আপনি যদি আরও পড়ার সন্ধান করছেন তবে আমি এই টিউটোরিয়ালের মাধ্যমে আই জাঙ্কিতে আরও পড়ার পরামর্শ দিচ্ছি । এটি আপনাকে নিউরাল নেটওয়ার্ক কীভাবে কাজ করে তার বুনিয়াদিগুলি সম্পর্কে কথা বলে এবং এমনকি কোনও লক্ষ্যের দিকে ট্যাঙ্ক চালানোর জন্য নিউরাল নেটওয়ার্কগুলি পাওয়ার জন্য একটি সাধারণ কোড উদাহরণ দেয়। টিউটোরিয়ালটি ব্যাকপ্রোপেজেশনটি কভার করে না, যা স্নায়ু নেটওয়ার্কগুলির প্রশিক্ষণের সবচেয়ে সাধারণ উপায় এবং পরিবর্তে একটি সাধারণ জেনেটিক অ্যালগরিদম ব্যবহার করে। তিনি একবার জেনেটিক্স বলতে শুরু করলে, আমার ধারণা আপনি পড়া বন্ধ করতে পারেন ...


এই সমস্ত শব্দ এবং চিন্তা একসাথে রাখার সব সময় এবং প্রচেষ্টার জন্য ধন্যবাদ। চিত্র স্বীকৃতির জন্য আমি কনভলিউশনাল এনএন-তে বিশেষ আগ্রহী। আমি ওপেনসিভি লাইব্রেরিতে মুখ শনাক্তকরণের উদাহরণটি চেষ্টা করে দেখেছি, তবে পাওয়া গেছে যে এটি কেবল অনমনীয় বস্তুগুলিতেই ভাল। নিউরাল নেটওয়ার্কের প্যাটার সনাক্তকরণের জন্য কি একই সীমা রয়েছে, অর্থাত্, কেবল অনমনীয় বিষয়গুলিতেই এটি ভাল?
ব্যবহারকারী1731927

এনএন (বা সেই বিষয়ে সিএনএন) এর প্যাটার্ন স্বীকৃতির সীমা থাকবে কেন এমন কোনও তাত্ত্বিক কারণ নেই তবে আপনি ইতিমধ্যে আবিষ্কার করেছেন যে কিছু সমস্যা অন্যদের চেয়ে শিখতে সহজ। মেশিন লার্নিংয়ের অনেক সমস্যার মতো আপনার সম্ভবত আপনার মডেলটিকে কিছুটা টুইট করতে হবে যাতে আপনি যে নির্দিষ্ট ধরণের সমস্যার সমাধান করতে চাইছেন তা এটি ভাল করতে পারে এবং এনএন এর ব্যতিক্রমও নয়।
jlund3

1
চিত্রের শ্রেণিবদ্ধকরণের মতো 2 ডি গ্রিড সমস্যা সমাধানের জন্য এনএন এর কীভাবে আরও ভাল কাঠামো করা যায় সে সম্পর্কে এখানে একটি আকর্ষণীয় কাগজ রয়েছে। axon.cs.byu.edu/~martinez/class/678/Papers/s
विज्ञान.

1
স্পর্শকাতরভাবে, "অ-অনমনীয়" ভিজ্যুয়াল অবজেক্টগুলিকে সঠিকভাবে শ্রেণিবদ্ধকরণে অসুবিধা, বা অন্যভাবে বলা হয়েছে, যে বিষয়গুলির প্রান্তগুলিতে পরিষ্কার লাইন নেই, ঠিক সে কারণেই প্রকৃতিও নির্ধারণ করেছে যে ছদ্মবেশটি একটি দুর্দান্ত চুরির কৌশল। চিন্তার জন্য খাদ্য.
এমসিস্টার

2

যা আপনাকে বিভ্রান্ত করেছে

এটি একটি চিত্রের মধ্যে কী আছে তা শিখবে।

একটি চিত্রে যা থাকে তা ডিজিটালভাবে চিত্রের পিক্সেলের মানগুলি দ্বারা উপস্থাপিত হয়। আপনি যদি ছবিতে রঙের উদাহরণ নেন। পিক্সেলের তিনটি মূল রঙ হতে পারে - লাল, সবুজ এবং নীল ( RGB) main ( 10,50,100) সহ একটি পিক্সেল এর অর্থ পিক্সেল ( ) সহ 'কম' নীল রঙের উপাদান রয়েছে 40,50,100। সুতরাং, চিত্রটিতে প্রথম পিক্সেল কম রঙের নীল রঙের একটি অঞ্চলের প্রতিনিধিত্ব করে। এটি সেই তথ্য যা নিউরাল নেটওয়ার্কটি শেখে, চিত্রের এক অবস্থান / অঞ্চল থেকে অন্য অঞ্চলে এবং ইমেজে কী রয়েছে তা 'জেনে' শেষ হয়। একই নীতিটি অন্যান্য চিত্র বৈশিষ্ট্যগুলির জন্য প্রয়োগ করা হয় (রঙ ছাড়াও) যা নিউরাল নেটওয়ার্কে ইনপুট হিসাবে ব্যবহৃত হতে পারে। দেখুন এই , এবং এই মৌলিক ইমেজ ধারণার জন্য এবং তারপর থেকে সরানো এই নিউরাল নেটওয়ার্ক কীভাবে কাজ করে তা শিখতে।


1

সমস্ত মেশিন লার্নিংয়ের সমস্যা একই রকম। আপনার কিছু ট্রেনের ডেটা রয়েছে, এমন একটি মডেল শিখুন যা এই ডেটা উপস্থাপন করে এবং এই জ্ঞানটিকে এইভাবে ক্লাস্টার, শ্রেণিবদ্ধকরণ, বিভিন্ন অ্যালগরিদম দিয়ে শিখার ক্ষেত্রে সাধারণ করার ক্ষমতা রাখে।

চিত্র স্বীকৃতিতে আপনার কাছে আবার জানতে ইচ্ছুক এমন একটি চিত্র রয়েছে।

  1. এই চিত্রগুলি প্রথমে প্রক্রিয়াজাত করা হয় এবং আপনি পিক্সেল এবং তাদের মানগুলি ব্যবহার করে এমন কিছু চিত্র (যেমন SIFT, ব্যাগ অফ ডাব্লুডএসের মতো প্রচুর সম্ভাব্য চিত্র বৈশিষ্ট্য স্কিম) থেকে বের করা হয়।
  2. আপনার এমএল অ্যালগরিদমের (নিউরাল নেট, এসভিএম বা অন্যদের) সম্পর্কিত বৈশিষ্ট্যযুক্ত ভেক্টরগুলির সাথে এই চিত্রগুলি দিন।
  3. একটি মডেল শিখুন
  4. প্রশিক্ষণ ডেটাতে পর্যাপ্ত পরিমাণে দেখা যায় এমন জিনিসগুলি সনাক্ত করতে এই মডেলটি ব্যবহার করুন।

আপনি যদি একের বেশি জিনিস চিনতে চান তবে প্রত্যেকটির জন্য একাধিক শ্রেণিবদ্ধ ব্যবহার করুন।


1

আমি চিত্র স্বীকৃতি কনভোলশনাল নিউরাল নেটওয়ার্কগুলির জন্য খুব জনপ্রিয় উল্লেখ করতে চাই। এখানে একটি সরলীকৃত ব্যাখ্যা একটি লিঙ্ক সিএনএন

সংক্ষেপে, সিএনএন চিত্রটি প্রথমে প্রান্ত, আকার, আকারের সংগ্রহের মতো বৈশিষ্ট্যগুলিতে বিভক্ত হয়। তারপরে এই বৈশিষ্ট্যগুলিকে একটি 'নিয়মিত' সম্পূর্ণ-সংযুক্ত মাল্টি-লেয়ার নিউরাল নেটওয়ার্ক (মাল্টি-লেয়ার পারসেপ্ট্রন) এ 'খাওয়ানো' হয়।

আরও বিশদে বিশদ মানচিত্রের আকারে বৈশিষ্ট্যগুলি নিষ্কাশন করতে ফিল্টারগুলির একটি সেট প্রয়োগ করা হয়। ফিল্টারটি কেবলমাত্র একটি ম্যাট্রিক্স (শুরুতে এলোমেলো) যা মূল চিত্রটিতে প্রয়োগ করা হয় যাতে মূল চিত্রের ম্যাট্রিক্স এবং ফিল্টার ম্যাট্রিক্সের ডট পণ্য গণনা করা হয় এবং ফলাফলটি সংক্ষিপ্ত করা হয়। ফিল্টারটি একবারে মূল চিত্রের সাথে এক পিক্সেল (পদক্ষেপ) ধরে সরানো হয় এবং বৈশিষ্ট্য মানচিত্রের ম্যাট্রিক্স ভরাট করা হয়। প্রতিটি ফিল্টারের জন্য একটি বৈশিষ্ট্য মানচিত্র তৈরি করা হয়। তারপরে প্রতিটি বৈশিষ্ট্য মানচিত্রে প্রতিটি পিক্সেলের জন্য আরএইলইউ (রেকটিফাইড লিনিয়ার ইউনিট) এর সাথে অ-লিনিয়ারিটি চালু করা হয়েছে। পুলিং, সর্বাধিক (), যোগফল () বা গড় () এর প্রয়োগের মাধ্যমে সমঝোতার পরে সম্পন্ন হয়। অবশেষে, এই উপায়ে নেওয়া বৈশিষ্ট্যগুলি মূল চিত্রের 'ম্যাগনিফাইড' টুকরাগুলির মতো দেখায়। এই বৈশিষ্ট্যগুলি একটি সম্পূর্ণ সংযুক্ত (সমস্ত ইউনিট সংযুক্ত) নিউরাল নেটওয়ার্কের ইনপুট এবং প্রতিটি চিত্রের সম্ভাবনাগুলি (যাক আমরা গাড়ি, গাছ এবং নৌকাগুলির চিত্রগুলিতে আমাদের নেটওয়ার্ককে প্রশিক্ষণ দিয়েছি) প্রতিটি ফিডফোরওয়ার্ড নেটওয়ার্কের মধ্য দিয়ে যাওয়ার পরে গণনা করা হয়। নেটওয়ার্কটি প্রশিক্ষণপ্রাপ্ত, যার অর্থ ব্যাকপ্রপ্যাগেশন (ভুল শ্রেণিবদ্ধকরণ ত্রুটির হ্রাস) এর মাধ্যমে প্যারামিটারগুলি (ওজন) এবং ফিল্টার ম্যাট্রিকগুলি অনুকূলিত হয়। যখন কোনও নতুন চিত্র প্রশিক্ষণপ্রাপ্ত নেটওয়ার্কে ইনপুট হয় কেবল তখনই চিত্রটি সনাক্ত করতে ফিডফোর্ডের প্রয়োজন হয় (শর্ত দেওয়া হয় যে নেটওয়ার্কটি যথেষ্ট সঠিক, যেমন আমরা এটি যথেষ্ট উদাহরণ দিয়ে প্রশিক্ষিত করেছি ইত্যাদি)) যার অর্থ ব্যাকপ্রপ্যাগেশন (ভুল সংশোধন ত্রুটির হ্রাস) এর মাধ্যমে প্যারামিটারগুলি (ওজন) এবং ফিল্টার ম্যাট্রিকগুলি অনুকূলিত হয়। যখন কোনও নতুন চিত্র প্রশিক্ষণপ্রাপ্ত নেটওয়ার্কে ইনপুট হয় কেবল তখনই চিত্রটি সনাক্ত করতে ফিডফোর্ডের প্রয়োজন হয় (শর্ত দেওয়া হয় যে নেটওয়ার্কটি যথেষ্ট সঠিক, যেমন আমরা এটি যথেষ্ট উদাহরণ দিয়ে প্রশিক্ষিত করেছি ইত্যাদি)) যার অর্থ ব্যাকপ্রপ্যাগেশন (ভুল সংশোধন ত্রুটির হ্রাস) এর মাধ্যমে প্যারামিটারগুলি (ওজন) এবং ফিল্টার ম্যাট্রিকগুলি অনুকূলিত হয়। যখন কোনও নতুন চিত্র প্রশিক্ষণপ্রাপ্ত নেটওয়ার্কে ইনপুট হয় কেবল তখনই চিত্রটি সনাক্ত করতে ফিডফোর্ডের প্রয়োজন হয় (শর্ত দেওয়া হয় যে নেটওয়ার্কটি যথেষ্ট সঠিক, যেমন আমরা এটি যথেষ্ট উদাহরণ দিয়ে প্রশিক্ষিত করেছি ইত্যাদি))


0

এএনএন যে বিষয়ে যে কোনও ফাংশন (এক্স) বা এফ (এক্স, ওয়াই, জেড, ..) বা কোনও মাল্টি ফাংশন তৈরি করতে পারে তা জেনে রাখা ভাল। তবে এটি আরও জেনে রাখাও গুরুত্বপূর্ণ যে ফাংশনগুলিতে তারা কীভাবে ডেটা শ্রেণিবদ্ধ করতে পারে তার সীমাবদ্ধতা রয়েছে ... অবজেক্টের পাওয়ারেটসগুলির আরও জটিল সম্পর্কের সাবসেট রয়েছে, যা শ্রেণিবদ্ধকরণে গুরুত্বপূর্ণ এবং এগুলিকে একটি মার্জিত বা প্রাকৃতিক উপায়ে বর্ণনা করা হয়নি, তবে ভাষা এবং শ্রেণিবদ্ধকরণের বিষয়গুলিতে গুরুত্বপূর্ণ। এএনএন এটি পাশাপাশি সম্পাদন করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.