ডিপ নিউরাল নেটওয়ার্কগুলিতে ব্যাগিং বনাম ড্রপআউট


17

ব্যাগিং একাধিক পূর্বাভাসকারীদের প্রজন্ম যা একক পূর্বাভাসকারী হিসাবে অভ্যাসযোগ্য। ড্রপআউট হ'ল এমন একটি কৌশল যা স্নায়ুবিক নেটওয়ার্কগুলিকে সমস্ত সম্ভাব্য সাবনেটওয়ার্কের গড় গড় শেখায়। সর্বাধিক গুরুত্বপূর্ণ কাগল এর প্রতিযোগিতা দেখে মনে হচ্ছে যে এই দুটি কৌশলগুলি প্রায়শই একসাথে ব্যবহৃত হয়। প্রকৃত বাস্তবায়ন ছাড়া আমি কোনও তাত্ত্বিক পার্থক্য দেখতে পাচ্ছি না। আমাদের দু'জনকে কেন কোনও বাস্তব প্রয়োগে ব্যবহার করা উচিত তা কে আমাকে ব্যাখ্যা করতে পারে? এবং কেন আমরা উভয় ব্যবহার করি কর্মক্ষমতা উন্নত?

উত্তর:


21

ব্যাগিং এবং ড্রপআউট মোটামুটি একই জিনিস অর্জন করতে পারে না, যদিও উভয়ই মডেলের গড় গড়।

ব্যাগিং আপনার সম্পূর্ণ ডেটাসেট জুড়ে এমন একটি ক্রিয়াকলাপ যা প্রশিক্ষণ ডেটার একটি উপসেটে মডেলদের প্রশিক্ষণ দেয়। এইভাবে কয়েকটি প্রশিক্ষণের উদাহরণ দেওয়া মডেলকে দেখানো হয় না।

বিপরীতে, ড্রপআউট প্রতিটি প্রশিক্ষণের উদাহরণের বৈশিষ্ট্যগুলিতে প্রয়োগ করা হয়। এটি সত্য যে ফলাফলটি কার্যকরভাবে অনেকগুলি নেটওয়ার্ককে (ভাগ করা ওজন সহ!) প্রশিক্ষণের সমতুল্য এবং তারপরে তাদের আউটপুটগুলির সমানভাবে ওজন করে। তবে ড্রপআউটটি বৈশিষ্ট্যের জায়গাতে কাজ করে, নির্দিষ্ট বৈশিষ্ট্যগুলি নেটওয়ার্কের জন্য অনুপলব্ধ হয়ে যায়, সম্পূর্ণ উদাহরণ নয়। যেহেতু প্রতিটি নিউরন সম্পূর্ণরূপে একটি ইনপুটের উপর নির্ভর করতে পারে না, এই নেটওয়ার্কগুলিতে উপস্থাপনাগুলি বেশি বিতরণ করা হয় এবং নেটওয়ার্কের উপকারের সম্ভাবনা কম থাকে।


একটি সুন্দর ব্যাখ্যা জন্য +1। পাইথন বাস্তবায়ন সম্পন্ন হয়েছে এমন কোনও লিঙ্ক সম্পর্কে আপনি কি জানেন? কোনও ব্লগ বা সম্ভবত গিথুব?
দাওয়ানি 33

এখানে একটি শালীন রয়েছে: ডিপলাইরনিং ডটকম / টিউটোরিয়াল / প্লেনটি এইচটিএমএল , যদিও আমি এটির স্টাইলটি পছন্দ করি: নিউরালনেটওয়ার্কস এবংডিপ্লিয়ারিং / চ্যাপ .h এইচটিএমএল । বাস্তবায়ন এবং দুর্দান্ত ডেমোসের
জেমসএমফ

2

আমি ম্যাক্স আউট নেটওয়ার্কগুলিতে দুটি ধরণের জালের তুলনা পেয়েছি যা বলে:

ড্রপআউট প্রশিক্ষণ ব্যাগিংয়ের মতো (ব্রেইম্যান, 1994), যেখানে বিভিন্ন বিভিন্ন মডেলের উপাত্তের বিভিন্ন সাবটায় প্রশিক্ষণ দেওয়া হয়। ড্রপআউট প্রশিক্ষণ ব্যাগিংয়ের থেকে পৃথক যে প্রতিটি মডেল কেবল একটি পদক্ষেপের জন্য প্রশিক্ষিত হয় এবং সমস্ত মডেল ভাগ করে পরামিতি করে। এই প্রশিক্ষণ পদ্ধতির (ড্রপআউট) এমন আচরণ করার জন্য যেন এটি কোনও একক মডেলের পরিবর্তে কোনও নকশাকার প্রশিক্ষণ দিচ্ছে, প্রতিটি আপডেটের অবশ্যই একটি বৃহত প্রভাব থাকতে হবে, যাতে এটি উপ-মডেলটিকে প্রেরণা দেয় current বর্তমান ইনপুটটি ভালভাবে ফিট করে।

আশা করি এটি কার্যকর হবে।


0

ড্রপআউট হ'ল নিয়মিতকরণের কৌশল যা ট্রেনিংয়ের পরে লুকানো স্তরগুলিতে কিছু নিউরোনকে ফেলে রেখে (তাই বাম আউট নিউরনের জন্য নাম ড্রপআউট) বিশেষত বড় নিউরাল নেটওয়ার্কগুলিতে অতিরিক্ত চাপ এড়াতে ব্যবহৃত হয়। মূলত যদি প্রশিক্ষণ চলাকালীন নেটওয়ার্কটি সত্যই কিছু শিখে থাকে তবে কিছু নিউরন বাদ দিয়ে ভবিষ্যদ্বাণীগুলির যথার্থতাটিকে নেতিবাচকভাবে প্রভাবিত করা উচিত নয়।

ব্যাগিং প্রশিক্ষণের ডেটা থেকে ভিন্নতা হ্রাস করতে এবং প্রাথমিক / বৃহত্তর প্রশিক্ষণ ডেটাসেট থেকে বিভিন্ন উপাত্তের উপর প্রশিক্ষণপ্রাপ্ত এর একাধিক অনুলিপি ব্যবহার করে আপনার মডেলের যথার্থতা উন্নত করার জন্যও কার্যকর নিয়মিতকরণ কৌশল used

এই প্রশ্নটি দেখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.