গুগল থেকে আমি এর সন্তোষজনক উত্তর খুঁজে পাইনি ।
অবশ্যই আমার কাছে থাকা ডেটা যদি কয়েক মিলিয়ন ক্রমের হয় তবে গভীর শেখার উপায়।
এবং আমি পড়েছি যে যখন আমার কাছে বড় ডেটা নেই তখন সম্ভবত মেশিন লার্নিংয়ে অন্যান্য পদ্ধতি ব্যবহার করা ভাল। প্রদত্ত কারণটি হ'ল অতিরিক্ত মানানসই। মেশিন লার্নিং: যেমন ডেটা, ফিচার এক্সট্রাকশন, কী সংগ্রহ করা হয় তা থেকে নতুন বৈশিষ্ট্যগুলি তৈরি করা ইত্যাদি বিষয়গুলি যেমন ভারী সংযুক্তিযুক্ত ভেরিয়েবলগুলি মুছে ফেলা ইত্যাদি পুরো মেশিনটি 9 গজ শেখা।
এবং আমি ভাবছিলাম: কেন এটি হ'ল একটি লুকানো স্তরযুক্ত নিউরাল নেটওয়ার্কগুলি মেশিন লার্নিংয়ের সমস্যাগুলির নিরাময়ে নয়? এগুলি সর্বজনীন অনুমানকারী, ওভার-ফিটিং ড্রপআউট, এল 2 নিয়মিতকরণ, এল 1 নিয়মিতকরণ, ব্যাচ-নরমালাইজেশন সহ পরিচালনা করা যায়। প্রশিক্ষণের গতি সাধারণভাবে সমস্যা হয় না যদি আমাদের কাছে কেবল 50,000 প্রশিক্ষণের উদাহরণ থাকে। এগুলি এলোমেলো বনগুলির চেয়ে পরীক্ষার সময়ে আরও ভাল।
সুতরাং কেন নয় - ডেটা পরিষ্কার করুন, নিখোঁজ মানগুলি যেমন আপনি করেন ঠিক তেমনই করেন না, তথ্যকে কেন্দ্র করে, তথ্যকে মানিক করে তোলেন, একে একটি লুকানো স্তরের সাথে নিউরাল নেটওয়ার্কের একটি ঝাঁকিতে ফেলে দিন এবং নিয়মিতকরণ প্রয়োগ করুন যতক্ষণ না আপনি কোনও অতিরিক্ত ফিট না দেখেন এবং তারপরে প্রশিক্ষণ দিন শেষ পর্যন্ত তাদের। গ্রেডিয়েন্ট বিস্ফোরণ বা গ্রেডিয়েন্ট নিখোঁজ হওয়ার কোনও সমস্যা নেই কারণ এটি মাত্র একটি 2 স্তরযুক্ত নেটওয়ার্ক। যদি গভীর স্তরগুলির প্রয়োজন হয়, তার অর্থ হায়ারার্কিকাল বৈশিষ্ট্যগুলি শিখতে হবে এবং তারপরে অন্যান্য মেশিন লার্নিং অ্যালগরিদমগুলিও ভাল নয়। উদাহরণস্বরূপ, এসভিএম হ'ল একমাত্র কব্জি ক্ষতি সহ একটি নিউরাল নেটওয়ার্ক।
উদাহরণস্বরূপ যেখানে অন্য কিছু মেশিন লার্নিং অ্যালগরিদম সতর্কতার সাথে নিয়মিত 2 স্তরযুক্ত (সম্ভবত 3?) নিউরাল নেটওয়ার্ককে ছাড়িয়ে যাবে appreciated আপনি আমাকে সমস্যার লিঙ্কটি দিতে পারেন এবং আমি যে সেরা নিউরাল নেটওয়ার্কটি করতে পারি তার প্রশিক্ষণ দেব এবং আমরা দেখতে পাচ্ছি যে 2 স্তরযুক্ত বা 3 স্তরের নিউরাল নেটওয়ার্ক অন্য কোনও বেঞ্চমার্ক মেশিন লার্নিং অ্যালগরিদমের চেয়ে কম পড়ে কিনা।