ড্রপআউট ( কাগজ , ব্যাখ্যা ) কিছু নিউরনের আউটপুট শূন্যে সেট করে। সুতরাং একটি এমএলপি-র জন্য আপনার আইরিস ফুলের ডেটাসেটের জন্য নিম্নলিখিত স্থাপত্য থাকতে পারে :
4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax)
এটি এর মতো কাজ করবে:
সহ , , , , (সরলতার জন্য পক্ষপাতিত্ব উপেক্ষা করা)
সঙ্গে এবং
যেখানে ক্রিয়াকলাপ সাথে পয়েন্ট-ভিত্তিক ( হাদামারড পণ্যটি দেখুন ) গুন করে ।
সুতরাং আমরা প্রতিটি সময় ম্যাট্রিক্স নমুনা এবং এইভাবে ড্রপআউট 0 এর সাথে নোডের গুণে পরিণত হয়।
তবে সিএনএন-র ক্ষেত্রে এটি ঠিক কী বাদ পড়েছে তা আমার কাছে পরিষ্কার নয়। আমি তিনটি সম্ভাবনা দেখতে পাচ্ছি:
- সম্পূর্ণ বৈশিষ্ট্য মানচিত্র বাদ দেওয়া (অতএব একটি কার্নেল)
- কার্নেলের একটি উপাদান বাদ দেওয়া (কার্নেলের একটি উপাদান 0 দ্বারা প্রতিস্থাপন করা)
- বৈশিষ্ট্য মানচিত্রের একটি উপাদান বাদ দেওয়া
আপনার উত্তরে একটি রেফারেন্স / উদ্ধৃতি যোগ করুন।
আমার চিন্তা
আমার মনে হয় লাসাগন (3) ( কোড দেখুন ) করেন। এটি কার্যকর করা সহজ হতে পারে। তবে মূল ধারণার কাছাকাছি হতে পারে (1)।
ক্যাফের জন্য অনুরূপ বলে মনে হচ্ছে ( কোড দেখুন )। টেনসরফ্লোর জন্য, ব্যবহারকারীকে সিদ্ধান্ত নিতে হবে ( কোড - noise_shape=None
পাস করার পরে কী ঘটে তা আমি নিশ্চিত নই )।
কিভাবে এটি করা উচিত
(২) এবং (৩) তেমন কোনও অর্থবোধ করবেন না কারণ এটি নেটওয়ার্ককে স্পেসিয়াল পজিশনে অদম্যতা যোগ করতে পারে, যা সম্ভবত পছন্দসই নয়। সুতরাং (1) একমাত্র বৈকল্পিক যা বোধগম্য হয়। তবে আমি নিশ্চিত নই যে আপনি যদি ডিফল্ট বাস্তবায়ন ব্যবহার করেন তবে কী হয়।