সিএনএনগুলির প্যাটার্ন স্বীকৃতি ক্ষমতা কি চিত্র প্রক্রিয়াকরণের মধ্যে সীমাবদ্ধ?


21

গ্রাফিকভাবে অ্যাবস্ট্রাক্ট ডেটা উপস্থাপন করে বলুন যে কোনও সমস্যা ডোমেনে প্যাটার্ন স্বীকৃতির জন্য কনভলিউশনাল নিউরাল নেটওয়ার্ক ব্যবহার করা যেতে পারে? সবসময় কি কম দক্ষ হবে?

এই বিকাশকারী বলছেন যে বর্তমানের বিকাশ আরও এগিয়ে যেতে পারে তবে চিত্রের স্বীকৃতির বাইরে কোনও সীমা থাকে না তবে।


1
আমি এখানে কমপক্ষে দুটি প্রশ্ন দেখছি। আপনি কীভাবে বিচ্ছেদ সম্পর্কে ভাবেন? এছাড়াও, শিরোনাম প্রশ্নটি আপনি কী অনুসন্ধান করেছেন তার উপর যদি আপনি প্রসারিত করতে পারেন তবে প্রশ্নের উচ্চতর মানের উপায় থাকবে।
এরিক প্লাটনের

@ এরিকপ্ল্যাটন এটি কিছুটা শক্ত করে তুললেন। আমার মূল প্রশ্নটি সিএনএন এবং চিত্রগুলির মধ্যে সম্পর্কের প্রকৃতি সম্পর্কে। দ্বিতীয় প্রশ্নের জন্য আপনার পরামর্শ কী হবে?
ডাইরেনপেসিস

ধন্যবাদ, প্রশ্নটি আমার কাছে ভাল (যদিও এখন আমার উত্তরটি মুছে ফেলা উচিত ~)। দ্বিতীয় প্রশ্ন হিসাবে, কিভাবে একটি "ধরা হয়" পদ্ধতির সম্পর্কে? "এটি কি সর্বদা কম দক্ষ?" যদি কেউ কাউন্টার-উদাহরণ দিয়ে আসতে পারে তবে এখনও ঠিক আছে।
এরিক প্লাটন

"কোনও কনভলিউশনাল নিউরাল নেটওয়ার্ক কোনও সমস্যা ডোমেনে প্যাটার্ন স্বীকৃতির জন্য ব্যবহার করা যেতে পারে যেখানে প্রাক-বিদ্যমান চিত্র নেই, গ্রাফিকভাবে অ্যাবস্ট্রাক্ট ডেটা উপস্থাপন করে বলুন?" আপনি কি জিজ্ঞাসা করছেন যে আমরা কোনও চিত্র কোনও চিত্র হিসাবে উপস্থাপন করতে এবং সিএনএন প্রয়োগ করতে পারি কিনা? একটি 100-বৈশিষ্ট্যযুক্ত ডেটাসেট পড়ার মতো এবং এটি 10x10 চিত্র হিসাবে উপস্থাপন করছেন?
rcpinto

উত্তর:


10

কনভলিউশনাল নেটস (সিএনএন) গাণিতিক কনভলিউশন (যেমন 2D বা 3 ডি কনভোলিউশনস) এর উপর নির্ভর করে, যা সাধারণত সিগন্যাল প্রসেসিংয়ের জন্য ব্যবহৃত হয়। চিত্রগুলি এক ধরণের সিগন্যাল, এবং সমঝোতা শব্দ, কম্পন ইত্যাদিতে সমানভাবে ব্যবহার করা যেতে পারে, সুতরাং নীতিগতভাবে, সিএনএন কোনও সংকেতের জন্য অ্যাপ্লিকেশনগুলি খুঁজে পেতে পারে এবং সম্ভবত আরও কিছু।

অনুশীলনে, এনএলপিতে ইতিমধ্যে কাজ রয়েছে (যেমন ম্যাথু গ্রেভস উল্লেখ করেছেন), যেখানে কিছু লোক পুনরাবৃত্ত নেটওয়ার্কগুলির পরিবর্তে সিএনএন দিয়ে পাঠ্য প্রক্রিয়া করে। কিছু অন্যান্য কাজ সাউন্ড প্রসেসিংয়ের জন্য প্রযোজ্য (এখানে কোনও রেফারেন্স নেই, তবে আমার এখনও অপ্রকাশিত কাজ চলছে)।


মূল বিষয়বস্তু: মূল শিরোনাম প্রশ্নের উত্তরে যা এখন পরিবর্তিত হয়েছে। সম্ভবত এটি মুছতে হবে

অ্যাডভারসিয়াল নেটওয়ার্কগুলির উপর গবেষণা (এবং সম্পর্কিত) দেখায় যে এমনকি গভীর নেটওয়ার্কগুলিও সহজেই বোকা বানানো যায় , যার ফলে কোনও কুকুর (বা যে কোনও বস্তু) এলোমেলো গোলমাল দেখা যায় যা এটিকে দেখায় (নিবন্ধটির স্পষ্ট উদাহরণ রয়েছে)।

আর একটি ইস্যু হ'ল নিউরাল নেটওয়ার্কের জেনারালাইজেশন পাওয়ার। কনভোলিউশনাল জাল তাদের কৌশলকে অন্যান্য কৌশলগুলির চেয়ে আরও ভালভাবে সাধারণকরণের ক্ষমতা দিয়ে বিশ্বকে অবাক করে দিয়েছে। তবে নেটওয়ার্কটি যদি কেবল বিড়ালের চিত্র খাওয়ানো হয় তবে এটি কেবল বিড়ালকেই চিনতে পারে (এবং সম্ভবত বিড়ালগুলি সর্বত্র দেখতে পাবেন, যেমন বিপরীতমুখী নেটওয়ার্ক ফলাফল হিসাবে)। অন্য কথায়, এমনকি CNS একটি কঠিন সময় খুব বেশী দূরে সরলীকরণ আছে পরলোক তারা যা থেকে শিখেছি।

স্বীকৃতি সীমাটি সুনির্দিষ্টভাবে সংজ্ঞা দেওয়া শক্ত is আমি কেবল এটুকু বলতে পারি যে শেখার তথ্যের বৈচিত্রতা সীমাটিকে ঠেলে দেয় (আমি ধারণা করি আরও বিশদ আলোচনার জন্য আরও উপযুক্ত স্থানের দিকে নিয়ে যেতে হবে)।


5

এর সহজ উত্তরটি "না, তারা কেবল চিত্রগুলিতে সীমাবদ্ধ নয়": সিএনএনগুলি প্রাকৃতিক ভাষা প্রক্রিয়াকরণের জন্যও ব্যবহৃত হচ্ছে। ( একটি পরিচিতির জন্য এখানে দেখুন ।)

আমি তাদের গ্রাফিকাল ডেটাতে প্রয়োগ করতে দেখিনি, তবে আমি সন্ধান করি নি; চেষ্টা করার মতো কিছু সুস্পষ্ট জিনিস রয়েছে এবং তাই আমি আশাবাদী যে এটি কার্যকর হবে।


3

কনভোলিউশনাল নিউরাল নেটওয়ার্ক কেবল চিত্রের স্বীকৃতির জন্যই নয়, ভিডিও বিশ্লেষণ এবং স্বীকৃতি, প্রাকৃতিক ভাষা প্রসেসিং, গেমসে (যেমন গো ) বা এমনকি অণু এবং জৈবিক প্রোটিন উইকির মধ্যে মিথস্ক্রিয়া সম্পর্কে ভবিষ্যদ্বাণী করে ড্রাগ আবিষ্কারের জন্য প্রয়োগ করা যেতে পারে ।

সুতরাং এটি আরও সম্পূর্ণরূপে সংযুক্ত স্তরগুলির সাথে সংযুক্ত কনভোলজিনাল এবং সাবম্যাপলিং স্তরগুলি ব্যবহার করে বিভিন্ন সমস্যার জন্য ব্যবহার করা যেতে পারে। এগুলি প্রশিক্ষণ সহজ, কারণ একই সংখ্যার গোপন ইউনিটগুলির সাথে সম্পূর্ণ সংযুক্ত নেটওয়ার্কের চেয়ে কম পরামিতি রয়েছে। UFLDL


3

স্থানীয়ভাবে সম্পর্কিত নিখরচায় এবং অনুবাদযোগ্য যেখানে (স্থানান্তরযোগ্য) তেমন একটি কনভোলশনাল নিউরাল নেটওয়ার্ক ব্যবহার করা যেতে পারে। এটি কেস কারণ সিএনএনগুলিতে এমন ফিল্টার রয়েছে যা ইনপুটটিতে সর্বত্র নির্দিষ্ট স্থানীয় নিদর্শনগুলির সন্ধান করে। আপনি ছবি, পাঠ্য, সময় সিরিজ ইত্যাদিতে স্থানীয় এবং অনুবাদযোগ্য নিদর্শনগুলি খুঁজে পাবেন etc.

আপনার ডেটা যদি অপ্রাসঙ্গিক অর্ডার সহ বৈশিষ্ট্যগুলির একটি ব্যাগের মতো হয় তবে সিএনএন ব্যবহার করা ততটা অর্থবোধ করে না। সেক্ষেত্রে আপনার ইনপুট ভেক্টর থেকে আরও দূরে থাকা বৈশিষ্ট্যগুলি রয়েছে এমন নিদর্শনগুলি সনাক্ত করতে আপনার সমস্যা হতে পারে। আপনি যদি তথ্য না হারিয়ে ইনপুট ভেক্টরের ডেটা পয়েন্টগুলি পুনরায় অর্ডার করতে পারেন তবে আপনি আপনার ডেটাতে স্থানীয় এবং অনুবাদযোগ্য নিদর্শনগুলি খুঁজে পাবেন না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.