"ড্রপআউট" কৌশল কী?


10

"ড্রপআউট" পদ্ধতিটি কোন উদ্দেশ্যে পরিবেশন করে এবং কীভাবে এটি নিউরাল নেটওয়ার্কের সামগ্রিক কর্মক্ষমতা উন্নত করে?

উত্তর:


7

ড্রপআউট মানে প্রতিটি পৃথক ডেটা পয়েন্ট কেবলমাত্র নিউরনের একটি এলোমেলো উপসেট ফিট করতে ব্যবহৃত হয়। এটি নিউরাল নেটওয়ার্কটিকে আরও একটি এনসেম্বল মডেলের মতো করে তুলতে করা হয়।

এটি, যেমন একটি এলোমেলো বন অনেকগুলি পৃথক সিদ্ধান্ত গাছের ফলাফলকে একসাথে গড়ে তোলে, আপনি ড্রপআউট ব্যবহার করে প্রশিক্ষিত একটি নিউরাল নেটওয়ার্ক দেখতে পাচ্ছেন অনেকগুলি পৃথক নিউরাল নেটওয়ার্কের ফলাফলকে একসাথে গড়ে তোলার জন্য ('ফলাফলগুলি' প্রতিটি স্তরের ক্রিয়াকলাপ বোঝার জন্য বোঝা যায়) পরিবর্তে কেবল আউটপুট স্তর)।


4

নিউরাল নেটওয়ার্ক ড্রপআউটের প্রস্তাব দেওয়া মূল পেপার 1 এর শিরোনাম: ড্রপআউট: নিউরাল নেটওয়ার্কগুলিকে অতিরিক্ত ফিট করা থেকে রোধ করার একটি সহজ উপায় । এই শিরোনাম ড্রপআউট কী করে তা একটি বাক্যে বেশ ব্যাখ্যা করে। প্রশিক্ষণ পর্বের সময় নিউরোনগুলিতে এলোমেলোভাবে নির্বাচন এবং অপসারণের মাধ্যমে ড্রপআউট কাজ করে। নোট করুন যে পরীক্ষার সময় ড্রপআউট প্রয়োগ করা হয় না এবং ফলস্বরূপ নেটওয়ার্কটি ভবিষ্যদ্বাণী করার অংশ হিসাবে ড্রপআউট হয় না।

নিউরনের এই এলোমেলো অপসারণ / ড্রপআউট নিউরনের অত্যধিক সহ-অভিযোজন প্রতিরোধ করে এবং এর ফলে নেটওয়ার্কের ওভারফাইটিংয়ের সম্ভাবনা হ্রাস পায়

প্রশিক্ষণের সময় নিউরনগুলি এলোমেলোভাবে অপসারণের অর্থ হ'ল যে কোনও সময়, মূল নেটওয়ার্কের কেবল একটি অংশই প্রশিক্ষিত। এটির প্রভাব রয়েছে যে আপনি একাধিক সাব-নেটওয়ার্ক প্রশিক্ষণ শেষ করেছেন, উদাহরণস্বরূপ:

একটি দোসর হিসাবে droup

এটি সাব-নেটওয়ার্কগুলির এই পুনরাবৃত্তি প্রশিক্ষণ থেকে পুরো নেটওয়ার্কের বিপরীতে যেখানে নিউরাল নেটওয়ার্ক ড্রপআউটকে একজাতীয় কৌশল হিসাবে বিবেচনা করা হয় I অর্থ উপ-নেটওয়ার্কগুলির প্রশিক্ষণ অসংখ্য, অপেক্ষাকৃত দুর্বল অ্যালগরিদম / মডেলগুলি এবং তাদের একত্রিত করে একটি পৃথক অ্যালগরিদম গঠন করে যা পৃথক অংশগুলির চেয়ে বেশি শক্তিশালী।

তথ্যসূত্র:

1 : শ্রীবাস্তব, নীতীশ, ইত্যাদি। "ড্রপআউট: স্নায়বিক নেটওয়ার্কগুলিকে অত্যধিক মানসিক চাপ থেকে রোধ করার একটি সহজ উপায়।" জার্নাল অফ মেশিন লার্নিং রিসার্চ 15.1 (2014): 1929-1958।


"ড্রপআউট একটি নিউরাল নেটওয়ার্কে এলোমেলোভাবে নিউরন নির্বাচন করে এবং অপসারণ করে কাজ করে"। সত্যই, কেবলমাত্র একটি নিউরাল নেটওয়ার্কের সম্পূর্ণ সংযুক্ত অংশ।
মনিকা হেডনেক

2

আমি জেফ্রি হিন্টনের ধারণাগুলি ড্রপআউট পেপার এবং তার কোরাসেরা ক্লাসে ব্যবহার করে আপনার প্রশ্নের উত্তর দেওয়ার চেষ্টা করব।

"ড্রপআউট" পদ্ধতিটি কী উদ্দেশ্যে কাজ করে?

বিপুল সংখ্যক প্যারামিটার সহ গভীর নিউরাল নেটগুলি খুব শক্তিশালী মেশিন লার্নিং সিস্টেম। তবে এই জাতীয় নেটওয়ার্কগুলিতে ওভারফিটিং একটি গুরুতর সমস্যা। বড় নেটওয়ার্কগুলি ব্যবহারেও ধীর হয়, পরীক্ষার সময় বিভিন্ন বড় বড় নিউরাল জালগুলির ভবিষ্যদ্বাণীগুলির সংমিশ্রণ করে ওভারফিটিংয়ের সাথে মোকাবিলা করতে অসুবিধা হয়। ড্রপআউট এই সমস্যাটি সমাধানের একটি কৌশল।

সুতরাং এটি একটি নিয়মিতকরণ কৌশল যা ওভারফিটিংয়ের সমস্যা (উচ্চতর বৈকল্পিকতা) এর সমাধান করে।

কীভাবে এটি সামগ্রিক কর্মক্ষমতা উন্নত করে?
ভাল জেনারালাইজেশন দ্বারা এবং ওভার ফিটিংয়ের ফাঁদে না পড়ে।


2

এখানে কিছু দুর্দান্ত উত্তর আছে। ড্রপআউটের জন্য আমি যে সহজ ব্যাখ্যা দিতে পারি তা হ'ল এটি প্রশিক্ষণকালে কিছু নিউরন এবং তাদের সংযোগগুলি নেটওয়ার্ক থেকে এলোমেলোভাবে বাদ দেয়, প্রশিক্ষণের সময়, নিউরনগুলিকে খুব বেশি "কো-অ্যাডাপ্টিং" থেকে থামানো। এটি প্রতিটি নিউরনকে আরও সাধারণভাবে প্রয়োগ করার প্রভাব ফেলে এবং বৃহত নিউরাল নেটওয়ার্কগুলির জন্য ওভারফিটিং বন্ধ করার জন্য দুর্দান্ত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.