আমরা জেনারেটরি অ্যাডভারসিয়াল নেটওয়ার্কগুলির সাথে বিশাল ডেটাसेट তৈরি করতে পারি?


14

আমি এমন একটি সমস্যার মুখোমুখি হচ্ছি যেখানে প্রশিক্ষণের জন্য আমার গভীর স্নায়বিক নেটওয়ার্কের জন্য যথেষ্ট পরিমাণে ডেটাসেট (চিত্রগুলি) খুঁজে পেল না।

স্কট রেড এট আল দ্বারা প্রকাশিত জেনেরেটাল অ্যাডভারসিয়াল টেক্সট টু ইমেজ সংশ্লেষের মাধ্যমে আমি এতটাই অনুপ্রাণিত হয়েছি । জেনারেটর অ্যাডভারসিয়াল নেটওয়ার্কগুলিতে।

আমি জানতে আগ্রহী ছিলাম, আমি কি কোনও জ্যান মডেলকে ইনপুট হিসাবে উপলব্ধ ছোট ডেটাसेट ব্যবহার করতে পারি এবং গভীর নেটওয়ার্ক মডেলগুলির সাথে মোকাবিলা করার জন্য আরও বড় ডেটাসেট তৈরি করতে পারি?

এটা কি যথেষ্ট ভাল হবে?


আমরা নন-চিত্রের ডেটাসেটের জন্য জিএন ব্যবহার করতে পারি?
মোহাম্মদ ইএল-কাদ্দুরী

@ MohamedEL-KADDOURY হ্যাঁ অবশ্যই শুনব, অডিও সঙ্গে arxiv.org/abs/1802.04208 , পাঠ্য সহ arxiv.org/abs/1801.07736 ইত্যাদি
Alwyn ম্যাথু

উত্তর:


9

এটি আপনার সরাসরি তথ্য সংগ্রহের প্রচেষ্টার বাইরে অনেক কিছু যুক্ত হওয়ার সম্ভাবনা নেই।

বর্তমান জিএএন আউটপুটগুলির গুণমান (2017 হিসাবে) পর্যাপ্ত পরিমাণে হবে না। কোনও জ্যান দ্বারা উত্পাদিত চিত্রগুলি সাধারণত ছোট এবং এগুলি অস্বাভাবিক / অস্পষ্ট বিবরণ এবং বিজোড় বিকৃতি থাকতে পারে। আপনি যে কাগজটি লিঙ্ক করেছেন তাতে কোনও বাক্য থেকে সিস্টেমের দ্বারা উত্পাদিত চিত্রগুলিকে বিষয়বস্তু প্রদত্ত রঙের বিশ্বাসযোগ্য ব্লক রয়েছে তবে বাক্যটি ছাড়াই আপনাকে বেশিরভাগের কাছে কী আশা করা উচিত তা কোনও নির্দিষ্ট বিষয় হিসাবে স্বীকৃত নয় ।

বাক্যগুলি থেকে চিত্র উত্পন্ন করার চেয়ে কম উচ্চাভিলাষী উদ্দেশ্য সম্পন্ন জিএএনদের (যা আমার উপরে সমালোচনা সত্ত্বেও, সত্যই একটি উল্লেখযোগ্য কৃতিত্ব আইএমও) ফটো-রিয়েলিস্টিক চিত্রগুলির আরও কাছাকাছি উত্পন্ন করা উচিত। তবে তাদের সুযোগ কম হবে এবং সম্ভবত আপনার পছন্দসই চিত্রের ধরণটি অন্তর্ভুক্ত থাকবে না। এছাড়াও, সাধারণত আউটপুট আকার ছোট হয় যেমন eg৪x64৪ বা ১২৮x128 *, এবং এখনও যথেষ্ট পরিমাণে বিকৃতি এবং অস্পষ্টতা রয়েছে যে মূল গ্রাউন্ড সত্যের চিত্রগুলি আরও বেশি পছন্দনীয় হবে।

প্রশিক্ষণ গ্রন্থাগারটি উপলব্ধ জ্যান নিজেই সীমাবদ্ধ - আপনি যদি এর প্রশিক্ষণের ডেটার আওতার বাইরে চিত্র তৈরি করার চেষ্টা করেন তবে এটি ভাল হবে না। অবশ্যই গবেষণামূলক গবেষণাপত্রে প্রদর্শিত ফলাফল প্রশিক্ষণের ডেটা দ্বারা সরবরাহিত ডোমেনের উপর ফোকাস করে। তবে আপনি কেবল এই মডেলটিতে কোনও বাক্য খাওয়াতে পারবেন না এবং এমন ফলাফল আশা করতে পারেন যা অন্য কোথাও কার্যকর হবে।

যদি আপনি এমন কোনও জিএন খুঁজে পান যা আপনার সমস্যার জন্য উপযুক্ত ডেটা সেট সম্পর্কে প্রশিক্ষণপ্রাপ্ত হয়েছে, তবে আপনি সম্ভবত আপনার প্রকল্পের জন্য একই ডেটা উত্স করার চেষ্টা করা থেকে ভাল।

যদি আপনি সীমিত স্থল সত্যের ডেটা নিয়ে কোনও সমস্যার মুখোমুখি হন তবে GAN ব্যবহারের জন্য সম্ভবত আরও ভাল পদ্ধতির একটি প্রাক-প্রশিক্ষিত শ্রেণিবদ্ধ যেমন যেমন ভিজিজি -19 বা ইনসেপশন ভি 5 ব্যবহার করা হবে, শেষের কয়েকটি সম্পূর্ণ সংযুক্ত স্তরগুলি প্রতিস্থাপন করা এবং জরিমানা এটি আপনার ডেটাতে টিউন করুন। পাইথনে কেরাস লাইব্রেরিটি ব্যবহার করার উদাহরণ এখানে - অন্যান্য উদাহরণগুলি "ফাইন টিউন সিএনএন চিত্র শ্রেণিবদ্ধ" এর মতো অনুসন্ধানগুলির সাথে পাওয়া যেতে পারে।


* আমি এই উত্তরটি পোস্ট করার পর থেকে অত্যাধুনিক জিএনএস আরও ভাল হয়েছে। এনভিডিয়ায় একটি গবেষণা দল 1024x1024 ফটো-রিয়েলস্টিক ইমেজ তৈরিতে অসাধারণ সাফল্য পেয়েছে । যাইহোক, এটি আমার উত্তরের অন্যান্য পয়েন্টগুলি পরিবর্তন করে না। GAN ইমেজ শ্রেণিবদ্ধকরণ কার্যগুলির জন্য চিত্রগুলির একটি নির্ভরযোগ্য উত্স নয়, তবে GAN ইতিমধ্যে প্রশিক্ষণপ্রাপ্ত এবং সাবধানে (বা আরও তুচ্ছভাবে, "অন্যান্য" বিভাগগুলিতে উত্স ডেটা সরবরাহ করতে সক্ষম হয়ে থাকে যা উপ-কাজগুলির জন্য ব্যতীত ক্লাসিফায়ার)।


3

আমি বর্তমানে যে ডিএনএন তৈরি করছি তার সাথে আমার একই সমস্যা রয়েছে। আমার ডেটা সেটটি গ্রহণ এবং একটি জিএএন এর সাথে নতুন ডেটা সংশ্লেষ করা একটি দুর্দান্ত ধারণা বলে মনে হচ্ছে। তবে জিএএন নিজেই প্রশিক্ষণের সেটে যেমন শিখেছে একই চিত্রের বৈচিত্র এবং মানক বিচ্যুতির সাথে চিত্রগুলি আউটপুট করতে শিখবে। সুতরাং আপনার নতুন উত্পন্ন ডেটা কেবল একই নমুনা বিতরণের আরও অনুমোদনের প্রতিনিধিত্ব করবে। এটি আপনার এনএন ট্রেনকে একই বিতরণে আরও ভালভাবে সহায়তা করবে, সুতরাং এটি প্রশিক্ষণের চেয়েও বেশি হতে পারে।


3

খাঁটি তাত্ত্বিক দৃষ্টিকোণ থেকে এটি সম্ভব হতে পারে না।

যে কোনও প্রশিক্ষণ ডেটাসেট নির্দিষ্ট স্থানের কাঠামো সম্পর্কে নির্দিষ্ট পরিমাণের তথ্যের প্রতিনিধিত্ব করে। আপনি যদি এই ডেটাসেটে কোনও জিএন প্রশিক্ষণ দেন তবে এটি কেবল সেই ডেটাসেটের উপস্থাপন করা তথ্য থেকে শিখবে। জিএএন দ্বারা সংশ্লেষিত ডেটা কখনই মূল কারণের চেয়ে বেশি বড় স্থান হতে পারে না, এই কারণটি থেকে: এই তথ্যটি কোথা থেকে আসবে বলে মনে করা হবে? যদি এটি মূল ডেটাসেটে না ছিল, তবে এটি GAN থেকে সংশ্লেষিত ডেটাতেও থাকতে পারে না।

আপনি যদি কোনও ডেটাসেটে রূপান্তরকরণের জন্য নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেন তবে সেই স্নায়বিক নেটওয়ার্কটি ডেটাসেটের যে কোনও কাঠামোতে রয়েছে তা শিখবে। কোনও জিএন দ্বারা সংশ্লেষিত কোনও কৃত্রিম প্রশিক্ষণের ডেটা কোনও নতুন তথ্য যুক্ত করবে না। সেই ধারণাটি সরাসরি করা উচিত।


2

প্রকৃত পক্ষে এটি সম্ভব, এটির উন্নতি করতে জিএএনএসের সাথে একটি ছোট্ট ডেটাসেট বৃদ্ধি করা এবং এটি এখানে শ্রেণিবদ্ধকরণ নেটওয়ার্কগুলির পারফরম্যান্স বাড়িয়ে তুলবে কারণ আপনি এখানে https://arxiv.org/pdf/1803.01229.pdf পড়তে পারেন । জিএএনরা যেমন মধ্যবর্তী আকারগুলি মূল ডেটসেটের সাথে জড়িত নয় তবে এখনও বৈধ হয় তা শেখার পক্ষে সক্ষম। সুতরাং সিন্থেটিক চিত্রগুলি ডেটাসেটের আকারটি উন্নত করতে পারে এবং সিএনএন শ্রেণিবদ্ধকরণের যথার্থতাকে উন্নত করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.