এটি আপনার সরাসরি তথ্য সংগ্রহের প্রচেষ্টার বাইরে অনেক কিছু যুক্ত হওয়ার সম্ভাবনা নেই।
বর্তমান জিএএন আউটপুটগুলির গুণমান (2017 হিসাবে) পর্যাপ্ত পরিমাণে হবে না। কোনও জ্যান দ্বারা উত্পাদিত চিত্রগুলি সাধারণত ছোট এবং এগুলি অস্বাভাবিক / অস্পষ্ট বিবরণ এবং বিজোড় বিকৃতি থাকতে পারে। আপনি যে কাগজটি লিঙ্ক করেছেন তাতে কোনও বাক্য থেকে সিস্টেমের দ্বারা উত্পাদিত চিত্রগুলিকে বিষয়বস্তু প্রদত্ত রঙের বিশ্বাসযোগ্য ব্লক রয়েছে তবে বাক্যটি ছাড়াই আপনাকে বেশিরভাগের কাছে কী আশা করা উচিত তা কোনও নির্দিষ্ট বিষয় হিসাবে স্বীকৃত নয় ।
বাক্যগুলি থেকে চিত্র উত্পন্ন করার চেয়ে কম উচ্চাভিলাষী উদ্দেশ্য সম্পন্ন জিএএনদের (যা আমার উপরে সমালোচনা সত্ত্বেও, সত্যই একটি উল্লেখযোগ্য কৃতিত্ব আইএমও) ফটো-রিয়েলিস্টিক চিত্রগুলির আরও কাছাকাছি উত্পন্ন করা উচিত। তবে তাদের সুযোগ কম হবে এবং সম্ভবত আপনার পছন্দসই চিত্রের ধরণটি অন্তর্ভুক্ত থাকবে না। এছাড়াও, সাধারণত আউটপুট আকার ছোট হয় যেমন eg৪x64৪ বা ১২৮x128 *, এবং এখনও যথেষ্ট পরিমাণে বিকৃতি এবং অস্পষ্টতা রয়েছে যে মূল গ্রাউন্ড সত্যের চিত্রগুলি আরও বেশি পছন্দনীয় হবে।
প্রশিক্ষণ গ্রন্থাগারটি উপলব্ধ জ্যান নিজেই সীমাবদ্ধ - আপনি যদি এর প্রশিক্ষণের ডেটার আওতার বাইরে চিত্র তৈরি করার চেষ্টা করেন তবে এটি ভাল হবে না। অবশ্যই গবেষণামূলক গবেষণাপত্রে প্রদর্শিত ফলাফল প্রশিক্ষণের ডেটা দ্বারা সরবরাহিত ডোমেনের উপর ফোকাস করে। তবে আপনি কেবল এই মডেলটিতে কোনও বাক্য খাওয়াতে পারবেন না এবং এমন ফলাফল আশা করতে পারেন যা অন্য কোথাও কার্যকর হবে।
যদি আপনি এমন কোনও জিএন খুঁজে পান যা আপনার সমস্যার জন্য উপযুক্ত ডেটা সেট সম্পর্কে প্রশিক্ষণপ্রাপ্ত হয়েছে, তবে আপনি সম্ভবত আপনার প্রকল্পের জন্য একই ডেটা উত্স করার চেষ্টা করা থেকে ভাল।
যদি আপনি সীমিত স্থল সত্যের ডেটা নিয়ে কোনও সমস্যার মুখোমুখি হন তবে GAN ব্যবহারের জন্য সম্ভবত আরও ভাল পদ্ধতির একটি প্রাক-প্রশিক্ষিত শ্রেণিবদ্ধ যেমন যেমন ভিজিজি -19 বা ইনসেপশন ভি 5 ব্যবহার করা হবে, শেষের কয়েকটি সম্পূর্ণ সংযুক্ত স্তরগুলি প্রতিস্থাপন করা এবং জরিমানা এটি আপনার ডেটাতে টিউন করুন। পাইথনে কেরাস লাইব্রেরিটি ব্যবহার করার উদাহরণ এখানে - অন্যান্য উদাহরণগুলি "ফাইন টিউন সিএনএন চিত্র শ্রেণিবদ্ধ" এর মতো অনুসন্ধানগুলির সাথে পাওয়া যেতে পারে।
* আমি এই উত্তরটি পোস্ট করার পর থেকে অত্যাধুনিক জিএনএস আরও ভাল হয়েছে। এনভিডিয়ায় একটি গবেষণা দল 1024x1024 ফটো-রিয়েলস্টিক ইমেজ তৈরিতে অসাধারণ সাফল্য পেয়েছে । যাইহোক, এটি আমার উত্তরের অন্যান্য পয়েন্টগুলি পরিবর্তন করে না। GAN ইমেজ শ্রেণিবদ্ধকরণ কার্যগুলির জন্য চিত্রগুলির একটি নির্ভরযোগ্য উত্স নয়, তবে GAN ইতিমধ্যে প্রশিক্ষণপ্রাপ্ত এবং সাবধানে (বা আরও তুচ্ছভাবে, "অন্যান্য" বিভাগগুলিতে উত্স ডেটা সরবরাহ করতে সক্ষম হয়ে থাকে যা উপ-কাজগুলির জন্য ব্যতীত ক্লাসিফায়ার)।