আমি এমন একটি প্রকল্প শুরু করছি যেখানে কাজটি ইমেজগুলি থেকে স্নিকারের প্রকারগুলি সনাক্ত করা। আমি বর্তমানে টেনসরফ্লো এবং মশাল প্রয়োগগুলি পড়ছি । আমার প্রশ্ন: ক্লাসে কতগুলি চিত্রের যুক্তিসঙ্গত শ্রেণিবিন্যাসের পারফরম্যান্সে পৌঁছানোর প্রয়োজন হয়?
আমি এমন একটি প্রকল্প শুরু করছি যেখানে কাজটি ইমেজগুলি থেকে স্নিকারের প্রকারগুলি সনাক্ত করা। আমি বর্তমানে টেনসরফ্লো এবং মশাল প্রয়োগগুলি পড়ছি । আমার প্রশ্ন: ক্লাসে কতগুলি চিত্রের যুক্তিসঙ্গত শ্রেণিবিন্যাসের পারফরম্যান্সে পৌঁছানোর প্রয়োজন হয়?
উত্তর:
থেকে কিভাবে কয়েক প্রশিক্ষণ উদাহরণ খুব অল্প একটি স্নায়ুর নেটওয়ার্ক প্রশিক্ষণ হয়? সিভিতে:
এটি সত্যিই আপনার ডেটাসেট এবং নেটওয়ার্ক আর্কিটেকচারের উপর নির্ভর করে। আমি (2) পড়ে থাকা থাম্বের একটি নিয়মটি ছিল নিউরাল নেটওয়ার্কটির খুব ভাল পারফরম্যান্স শুরু করার জন্য ক্লাসে কয়েক হাজার নমুনা। অনুশীলনে, লোকেরা চেষ্টা করে দেখে।
আরও প্রশিক্ষণের নমুনাগুলি অর্জন করা কতটা উপকারী হতে পারে তার মোটামুটি মূল্যায়নের একটি ভাল উপায় হ'ল প্রশিক্ষণ সংস্থার আকারের বিপরীতে নিউরাল নেটওয়ার্কের পারফরম্যান্সের পরিকল্পনা করা, যেমন (1) থেকে:
(২) কিরেয়ান, ড্যান সি।, ইউেলি মেয়ার এবং জর্জেন শ্মিধুবার। "গভীর স্নায়ুবহুল নেটওয়ার্কগুলির সাথে লাতিন এবং চীনা অক্ষরের জন্য শিখন স্থানান্তর করুন।" নিউরাল নেটওয়ার্কস ২০১২-এর আন্তর্জাতিক যৌথ সম্মেলনে (আইজেসিএনএন), পৃষ্ঠা 1-6। আইইইই, ২০১২. https://scholar.google.com/scholar?cluster=7452424507909578812&hl=en&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :
ক্লাসে কয়েক হাজার নমুনা সহ শ্রেণিবদ্ধকরণের কাজের জন্য (নিরীক্ষণযোগ্য বা তদারকি করা) প্রাক-প্রশিক্ষণের সুবিধাটি প্রদর্শন করা সহজ নয়।
আরামদায়ক যতটা ডেটা সংগ্রহ করা সর্বোত্তম পন্থা। তারপরে প্রকল্পটি শুরু করুন এবং একটি ডেটা মডেল তৈরি করুন।
এখন আপনি আপনার মডেলটির উচ্চ বায়াস বা উচ্চ বৈকল্পিকতা আছে কিনা তা মূল্যায়ন করতে পারেন ।
উচ্চতর বৈকল্পিক : এই পরিস্থিতিতে আপনি দেখতে পাবেন যে ক্রস-বৈধকরণ ত্রুটি কনভার্জ হওয়ার পরে প্রশিক্ষণের ত্রুটির চেয়ে বেশি।
হাই বায়াস : এই পরিস্থিতিতে ট্রেনিং ডেটা আকারের বিরুদ্ধে চক্রান্ত করার সময় ট্রেনিং ত্রুটির তুলনায় ক্রস-বৈধকরণ ত্রুটিটি কিছুটা বেশি। এবং প্লট ত্রুটি।
আপনি যদি দেখেন যে আপনার মডেলটির উচ্চতর বৈকল্পিকতা (ওভারফিট) রয়েছে, আরও ডেটা যুক্ত করা সাধারণত উচ্চ পক্ষপাত (আন্ডারফিট) মডেলের বিপরীতে সহায়তা করবে যেখানে নতুন প্রশিক্ষণের ডেটা যুক্ত করা কোনও উপকারে আসে না।
এছাড়াও প্রতি ক্লাসে আপনাকে একই সংখ্যক চিত্র পেতে চেষ্টা করতে হবে অন্যথায় ডেটাসেটগুলি স্কিউড (এক ধরণের আরও বেশি) হয়ে যেতে পারে ।
এছাড়াও আমি আপনাকে পরামর্শ দিচ্ছি যদি আপনি ব্যবহার করছেন TensorFlow , সম্বন্ধে আরও পড়তে GOOGLE এর এর শুরু ভাবমূর্তি ক্লাসিফায়ার। এটি ইতিমধ্যে গুগলের ইমেজ ডাটাবেসে শ্রেণিবদ্ধ প্রশিক্ষণপ্রাপ্ত এবং আপনি এটি আপনার চিত্রগুলির জন্য ব্যবহার করতে পারেন, এই ধরণের চিত্রের জন্য প্রয়োজনীয়তাগুলি খুব কমে আসে।