পটভূমি: আমি ইয়ান গুডফেলো এবং যোশুয়া বেনজিও এবং অ্যারন কউরভিলের ডিপ লার্নিংয়ের chapter ষ্ঠ অধ্যায়টি অধ্যয়ন করছি। বিভাগে .2.২.২.২ (183 এর 182 পৃষ্ঠাগুলি যা এখানে দেখা যায় ) সিগময়েডের আউটপুট ব্যবহার অনুপ্রাণিত করা হয়।
কিছু উপাদান সংক্ষিপ্তসার হিসাবে তারা কে একটি অ্যাক্টিভেশন প্রয়োগ করার আগে একটি আউটপুট নিউরন হতে দেয় যেখানে পূর্ববর্তী লুকানো স্তরের আউটপুট, ওয়েটের ভেক্টর এবং একটি স্কেলার বায়াস হয়। ইনপুট ভেক্টরকে (যা এর একটি ফাংশন) চিহ্নিত করা হয় এবং আউটপুট মান যেখানে সিগময়েড ফাংশন। বইটি এর মান ব্যবহার করে উপর সম্ভাব্যতা বন্টনকে de dene করতে চায় । 183 পৃষ্ঠার দ্বিতীয় অনুচ্ছেদ থেকে:h w b x h y = ϕ ( z ) ϕ y z
আমরা মান ব্যবহার করে উপর সম্ভাব্যতা বন্টন কীভাবে করব তা আলোচনা করার জন্য আমরা মুহুর্তের জন্য এর নির্ভরতা বাদ দিই । সিগময়েডকে একটি অস্বাভাবিক সম্ভাবনা বিতরণ টিলডে উদ্বুদ্ধ করা যেতে পারে , যা 1 এর সমষ্টি নয়। আমরা তার পরে বৈধ সম্ভাব্যতা বন্টন পাওয়ার জন্য উপযুক্ত ধ্রুবক দ্বারা ভাগ করতে পারি। যদি আমরা এই অনুমান দিয়ে শুরু করি যে অস্বাভাবিক লগ সম্ভাবনাগুলি এবং এর ক্ষেত্রে লিনিয়ার হয় , তবে আমরা অস্বাভাবিক সম্ভাবনাগুলি পেতে দ্রুততর করতে পারি। তারপরে আমরা দেখতে দেখতে স্বাভাবিক হই যে এটি z এর একটি সিগময়েডাল ট্রান্সফর্মেশন দ্বারা নিয়ন্ত্রিত একটি বের্নোল্লি বিতরণ দেয়: y z ˜ P ( y ) y z লগ ˜ পি (
প্রশ্ন: আমি দুটি বিষয় সম্পর্কে বিভ্রান্ত, বিশেষত প্রথম:
- প্রাথমিক অনুমানটি কোথা থেকে আসছে? এবং কেন অস্বাভাবিক লগ সম্ভাব্যতা রৈখিক ? লেখকরা কীভাবে টিলডে দিয়ে শুরু করেছিলেন সে সম্পর্কে কেউ আমাকে কিছুটা ধারণা দিতে পারেন ?z লগ ˜ P ( y ) = y z
- শেষ লাইনটি কীভাবে অনুসরণ করবে?