কোনও সিএনএন প্রশিক্ষণের জন্য শ্রেণি প্রতি কতগুলি চিত্র যথেষ্ট


12

আমি এমন একটি প্রকল্প শুরু করছি যেখানে কাজটি ইমেজগুলি থেকে স্নিকারের প্রকারগুলি সনাক্ত করা। আমি বর্তমানে টেনসরফ্লো এবং মশাল প্রয়োগগুলি পড়ছি । আমার প্রশ্ন: ক্লাসে কতগুলি চিত্রের যুক্তিসঙ্গত শ্রেণিবিন্যাসের পারফরম্যান্সে পৌঁছানোর প্রয়োজন হয়?


"যুক্তিসঙ্গত" সংজ্ঞায়িত করবেন? আপনার লক্ষ্যটি কী কোনও নির্ভুলতায় পৌঁছাবেন যা একটি প্রোডাকশন সিস্টেমে ব্যবহার করা যেতে পারে? আপনার লক্ষ্য কি অন্য কিছু? প্রাক-প্রশিক্ষণ এবং আধা-তত্ত্বাবধানে প্রশিক্ষণে কিছু প্রকারভেদ রয়েছে যা আপনার প্রচেষ্টা রক্ষা করতে পারে, তাই আপনার উদ্বেগ লেবেল ইমেজগুলিতে রয়েছে কিনা বা কেবল কোনও চিত্র উত্সাহিত করার বিষয়টি আপনি পরিষ্কার করতে পারেন । অবশেষে, আপনার টার্গেটের চিত্রগুলি কতটা পরিষ্কার এবং সহজ? যে চিত্রগুলি আলোক এবং পোজ স্থির করা হয়েছে সেখানে স্নিকারগুলি পরা হওয়ার সাথে "রিয়েল ওয়ার্ল্ড" ফটোগ্রাফগুলির চেয়ে প্রশিক্ষণ দেওয়া আরও সহজ হবে।
নিল স্লেটার

হ্যাঁ, এটি উত্পাদনে ব্যবহৃত হবে। আমি বর্তমানে জানি না যে এখানে কতগুলি শ্রেণি থাকবে তা যেহেতু আমি জানি না যে ইমেজ লাইব্রেরিতে বিভিন্ন ধরণের স্নিকার প্রকার রয়েছে। আমার সেরা অনুমানটি 50-100 এর ক্রম অনুসারে হবে তবে স্নিকারের বর্ণনাটি যত কম, ক্লাসগুলি তত কম (যেমন এয়ার-জর্ডান বনাম এয়ার-জর্ডান-আল্ট্রাফিট)। দুর্ভাগ্যক্রমে, ইমেজ লাইব্রেরি হ'ল স্নিকারের পরা এবং স্নিকারগুলির একটি সাদা ব্যাকড্রপ সহ স্থির আইটেম হিসাবে পোজ দেওয়া একটি মিশ্রণ।
Feynman27

উত্তর:


2

থেকে কিভাবে কয়েক প্রশিক্ষণ উদাহরণ খুব অল্প একটি স্নায়ুর নেটওয়ার্ক প্রশিক্ষণ হয়? সিভিতে:

এটি সত্যিই আপনার ডেটাসেট এবং নেটওয়ার্ক আর্কিটেকচারের উপর নির্ভর করে। আমি (2) পড়ে থাকা থাম্বের একটি নিয়মটি ছিল নিউরাল নেটওয়ার্কটির খুব ভাল পারফরম্যান্স শুরু করার জন্য ক্লাসে কয়েক হাজার নমুনা। অনুশীলনে, লোকেরা চেষ্টা করে দেখে।


আরও প্রশিক্ষণের নমুনাগুলি অর্জন করা কতটা উপকারী হতে পারে তার মোটামুটি মূল্যায়নের একটি ভাল উপায় হ'ল প্রশিক্ষণ সংস্থার আকারের বিপরীতে নিউরাল নেটওয়ার্কের পারফরম্যান্সের পরিকল্পনা করা, যেমন (1) থেকে:

এখানে চিত্র বর্ণনা লিখুন


  • (1) ডারননকোর্ট, ফ্রাঙ্ক, জি ইয়ং লি, ওজলেম উজুনার এবং পিটার সলোভিতস। " পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির সাথে রোগী নোটগুলির সনাক্তকরণ " আরএক্সিব প্রিপ্রিন্ট আরএক্সিভি: 1606.03475 (2016)।
  • (২) কিরেয়ান, ড্যান সি।, ইউেলি মেয়ার এবং জর্জেন শ্মিধুবার। "গভীর স্নায়ুবহুল নেটওয়ার্কগুলির সাথে লাতিন এবং চীনা অক্ষরের জন্য শিখন স্থানান্তর করুন।" নিউরাল নেটওয়ার্কস ২০১২-এর আন্তর্জাতিক যৌথ সম্মেলনে (আইজেসিএনএন), পৃষ্ঠা 1-6। আইইইই, ২০১২. https://scholar.google.com/scholar?cluster=7452424507909578812&hl=en&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :

    ক্লাসে কয়েক হাজার নমুনা সহ শ্রেণিবদ্ধকরণের কাজের জন্য (নিরীক্ষণযোগ্য বা তদারকি করা) প্রাক-প্রশিক্ষণের সুবিধাটি প্রদর্শন করা সহজ নয়।


0

আরামদায়ক যতটা ডেটা সংগ্রহ করা সর্বোত্তম পন্থা। তারপরে প্রকল্পটি শুরু করুন এবং একটি ডেটা মডেল তৈরি করুন।

এখন আপনি আপনার মডেলটির উচ্চ বায়াস বা উচ্চ বৈকল্পিকতা আছে কিনা তা মূল্যায়ন করতে পারেন

উচ্চতর বৈকল্পিক : এই পরিস্থিতিতে আপনি দেখতে পাবেন যে ক্রস-বৈধকরণ ত্রুটি কনভার্জ হওয়ার পরে প্রশিক্ষণের ত্রুটির চেয়ে বেশি।

হাই বায়াস : এই পরিস্থিতিতে ট্রেনিং ডেটা আকারের বিরুদ্ধে চক্রান্ত করার সময় ট্রেনিং ত্রুটির তুলনায় ক্রস-বৈধকরণ ত্রুটিটি কিছুটা বেশি। এবং প্লট ত্রুটি।

আপনি যদি দেখেন যে আপনার মডেলটির উচ্চতর বৈকল্পিকতা (ওভারফিট) রয়েছে, আরও ডেটা যুক্ত করা সাধারণত উচ্চ পক্ষপাত (আন্ডারফিট) মডেলের বিপরীতে সহায়তা করবে যেখানে নতুন প্রশিক্ষণের ডেটা যুক্ত করা কোনও উপকারে আসে না।

এছাড়াও প্রতি ক্লাসে আপনাকে একই সংখ্যক চিত্র পেতে চেষ্টা করতে হবে অন্যথায় ডেটাসেটগুলি স্কিউড (এক ধরণের আরও বেশি) হয়ে যেতে পারে ।

এছাড়াও আমি আপনাকে পরামর্শ দিচ্ছি যদি আপনি ব্যবহার করছেন TensorFlow , সম্বন্ধে আরও পড়তে GOOGLE এর এর শুরু ভাবমূর্তি ক্লাসিফায়ার। এটি ইতিমধ্যে গুগলের ইমেজ ডাটাবেসে শ্রেণিবদ্ধ প্রশিক্ষণপ্রাপ্ত এবং আপনি এটি আপনার চিত্রগুলির জন্য ব্যবহার করতে পারেন, এই ধরণের চিত্রের জন্য প্রয়োজনীয়তাগুলি খুব কমে আসে।


আমি ইতিমধ্যে টেনসরফ্লো এর ইনসেপশন-ভি 3 ব্যবহার করে একটি দ্রুত পরীক্ষা করেছি। এটি যা করতে পারে তা হ'ল আমাকে "চলমান জুতো" এর মতো একটি খুব কোর্সের শ্রেণিবদ্ধকরণ দেওয়া হয়েছে তবে আমার "এয়ার জর্ডান-আল্ট্রাফিট" এর মতো আরও কিছুটা দানাদার কিছু দরকার। এই কারণেই আমি ইনসেপশনের সাথে ব্যবহার করার জন্য একটি নতুন প্রশিক্ষণ সেট তৈরি করছি।
Feynman27

এটি "কিছুটা আরও দানাদার" এর একটি অদ্ভুত সংজ্ঞা।
জীবন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.