অপ্রয়োজনীয় লগ সম্ভাব্যতাকে লিনিয়ার দিয়ে শুরু করে নিউরাল নেটওয়ার্কগুলিতে সিগময়েড আউটপুট ইউনিটকে অনুপ্রাণিত করা


12

পটভূমি: আমি ইয়ান গুডফেলো এবং যোশুয়া বেনজিও এবং অ্যারন কউরভিলের ডিপ লার্নিংয়ের chapter ষ্ঠ অধ্যায়টি অধ্যয়ন করছি। বিভাগে .2.২.২.২ (183 এর 182 পৃষ্ঠাগুলি যা এখানে দেখা যায় ) সিগময়েডের আউটপুট ব্যবহার অনুপ্রাণিত করা হয়।পি(Y=1|এক্স)

কিছু উপাদান সংক্ষিপ্তসার হিসাবে তারা কে একটি অ্যাক্টিভেশন প্রয়োগ করার আগে একটি আউটপুট নিউরন হতে দেয় যেখানে পূর্ববর্তী লুকানো স্তরের আউটপুট, ওয়েটের ভেক্টর এবং একটি স্কেলার বায়াস হয়। ইনপুট ভেক্টরকে (যা এর একটি ফাংশন) চিহ্নিত করা হয় এবং আউটপুট মান যেখানে সিগময়েড ফাংশন। বইটি এর মান ব্যবহার করে উপর সম্ভাব্যতা বন্টনকে de dene করতে চায় । 183 পৃষ্ঠার দ্বিতীয় অনুচ্ছেদ থেকে:h w b x h y = ϕ ( z ) ϕ y z

z- র=Wটি+ +
Wএক্সY=φ(z- র)φYz- র

আমরা মান ব্যবহার করে উপর সম্ভাব্যতা বন্টন কীভাবে করব তা আলোচনা করার জন্য আমরা মুহুর্তের জন্য এর নির্ভরতা বাদ দিই । সিগময়েডকে একটি অস্বাভাবিক সম্ভাবনা বিতরণ টিলডে উদ্বুদ্ধ করা যেতে পারে , যা 1 এর সমষ্টি নয়। আমরা তার পরে বৈধ সম্ভাব্যতা বন্টন পাওয়ার জন্য উপযুক্ত ধ্রুবক দ্বারা ভাগ করতে পারি। যদি আমরা এই অনুমান দিয়ে শুরু করি যে অস্বাভাবিক লগ সম্ভাবনাগুলি এবং এর ক্ষেত্রে লিনিয়ার হয় , তবে আমরা অস্বাভাবিক সম্ভাবনাগুলি পেতে দ্রুততর করতে পারি। তারপরে আমরা দেখতে দেখতে স্বাভাবিক হই যে এটি z এর একটি সিগময়েডাল ট্রান্সফর্মেশন দ্বারা নিয়ন্ত্রিত একটি বের্নোল্লি বিতরণ দেয়: y z ˜ P ( y ) y z লগ ˜ পি (এক্সYz- রপি~(Y)Yz- র

লগপি~(Y)=Yz- রপি~(Y)=মেপুঃ(Yz- র)পি(Y)=মেপুঃ(Yz- র)ΣY'=01মেপুঃ(Y'z- র)পি(Y)=φ((2Y-1)z- র)

প্রশ্ন: আমি দুটি বিষয় সম্পর্কে বিভ্রান্ত, বিশেষত প্রথম:

  1. প্রাথমিক অনুমানটি কোথা থেকে আসছে? এবং কেন অস্বাভাবিক লগ সম্ভাব্যতা রৈখিক ? লেখকরা কীভাবে টিলডে দিয়ে শুরু করেছিলেন সে সম্পর্কে কেউ আমাকে কিছুটা ধারণা দিতে পারেন ?z লগ ˜ P ( y ) = y zYz- রলগপি~(Y)=Yz- র
  2. শেষ লাইনটি কীভাবে অনুসরণ করবে?

উত্তর:


8

সেখানে জন্য দুটি সম্ভাব্য ফলাফল আছে । এটি অত্যন্ত গুরুত্বপূর্ণ, কারণ এই সম্পত্তিটি গুণনের অর্থ পরিবর্তন করে। দুটি সম্ভাব্য কেস রয়েছে:Y{0,1}

লগপি~(Y=1)=z- রলগপি~(Y=0)=0

এছাড়াও লক্ষণীয় গুরুত্বপূর্ণ যে জন্য অস্বাভাবিক লগারিদমিক সম্ভাবনা ধ্রুবক। এই সম্পত্তিটি মূল অনুমান থেকে প্রাপ্ত। ধ্রুবক মানটিতে যে কোনও ডিটারমিনিস্টিক ফাংশন প্রয়োগ করা ধ্রুবক আউটপুট তৈরি করে। এই বৈশিষ্ট্যটি চূড়ান্ত সূত্রটি সহজতর করবে যখন আমরা সম্ভাব্য সমস্ত সম্ভাবনার উপর সাধারণকরণ করব, কারণ আমাদের কেবল y = 1 এবং y = 0 এর জন্য কেবল অস্বাভাবিক সম্ভাবনা জানতে হবে যা সর্বদা স্থির থাকে। এবং অস্বাভাবিক লগারিদমিক সম্ভাবনার মধ্যে নেটওয়ার্ক থেকে আউটপুট যেহেতু আমাদের কেবল একটি আউটপুট প্রয়োজন হবে, কারণ অন্য একটি ধ্রুবক বলে ধরে নিয়েছে।Y=0Y=1Y=0

এর পরে, আমরা অস্বাভাবিকতর সম্ভাবনা পাওয়ার জন্য অস্বাভাবিক লগারিদম সম্ভাব্যতার জন্য ক্ষয়ক্ষতি প্রয়োগ করছি।

পি~(Y=1)=z- রপি~(Y=0)=0=1

এরপরে আমরা সমস্ত সম্ভাব্য অস্বাভাবিক সম্ভাবনার যোগফলের মাধ্যমে প্রতিটি অস্বাভাবিক সম্ভাবনার ভাগ করে নেওয়ার সম্ভাবনাগুলিকে কেবল স্বাভাবিক করি।

পি(Y=1)=z- র1+ +z- রপি(Y=0)=11+ +z- র

আমরা কেবল , কারণ সিগময়েড ফাংশন থেকে সম্ভাব্যতার অর্থ এটি। প্রাপ্ত ফাংশনটি প্রথম চেহারাতে সিগময়েডের মতো দেখাচ্ছে না তবে তারা সমান এবং এটি দেখানো সহজ।পি(Y=1)

পি(Y=1)=এক্স1+ +এক্স=1এক্স+ +1এক্স=11+ +1এক্স=11+ +-এক্স

সর্বশেষ বিবৃতিটি প্রথমে বিভ্রান্তিকর হতে পারে তবে এটি দেখানোর একমাত্র উপায় যে চূড়ান্ত সম্ভাবনা ফাংশনটি একটি সিগময়েড is মান পরিবর্তিত 0 থেকে - 1 এবং 1 থেকে 1 (অথবা আমরা বলতে পারি যে এটা পরিবর্তন ছাড়াই হবে)।(2Y-1)0-111

পি(Y)=σ((2Y-1)z- র)={σ(z- র)=11+ +-z- র=z- র1+ +z- রকখন Y=1σ(-z- র)=11+ +-(-z- র)=11+ +z- রকখন Y=0

যেমন আমরা দেখতে পাচ্ছি, এটি এবং পি ( y ) এর মধ্যে সম্পর্ক দেখানোর একমাত্র উপায়σপি(Y)


"এছাড়াও লক্ষণীয় গুরুত্বপূর্ণ যে জন্য অস্বাভাবিক লগারিদমিক সম্ভাবনা ধ্রুবক। এই সম্পত্তিটি মূল অনুমান থেকে প্রাপ্ত" " অনুমান করা হচ্ছে যে আমরা ইতিমধ্যে সিদ্ধান্ত নিয়েছি যে y = 1 ? Y=0Y=1
এইচবিিল

আমি মনে করি যে আমার বিভ্রান্তি আসল লেবেল নির্বিশেষে এর মডেলটির সম্ভাব্যতাটি দেয় এই সত্য থেকেই এসেছে । ধন্যবাদ! y=1
এইচবিিল

পুরু এখানে হবে মানে না কিন্তু কেমন মধ্যে রৈখিক Y এবং z- র । আমি ফর্মের কিছু আশা একটি Y + + z- র + + । আমি এটা বুঝতে লগ পণ্যের উপর Y z- র একটি সমষ্টি যা আমাকে রৈখিকতা কাছাকাছি গ্রহণ করা হবে কিন্তু যে কি লেখক বলেছেন থেকে সরাসরি হবে বলে মনে হচ্ছে না উত্পাদ হবে। y×zyz- রay+bz+clogyz- র
জেবুলন

আমি দেখছি, এটি আসলে মজাদার প্রশ্ন। আমি যখন প্রথমবার প্রশ্নটি পড়ি তখন আমি এই বক্তব্যের দিকে মনোযোগ দিইনি। এখন এটি আমার কাছেও অদ্ভুত লাগছে। একটি সমস্যা হ'ল y বাইনারি ভেরিয়েবল এবং এই পরিস্থিতিতে লিনিয়ার ফাংশনের বৈশিষ্ট্যগুলি কীভাবে পরীক্ষা করা যায় তা আমি নিশ্চিত নই। আমার ধারণা, আপনি পৃথক প্রশ্ন জিজ্ঞাসা করলে তা বোধগম্য হবে, কারণ কেউ কেন আপনাকে ব্যাখ্যা করতে পারে যে কেন এটি এভাবে লেখা হয়েছে।
itdxer

2

আমি এই বইয়ের এই খণ্ডটি অনুসরণ করা চ্যালেঞ্জীও পেয়েছি এবং এটিডেক্সারের উপরের উত্তরটি এমন কিছু ব্যক্তির পক্ষেও বুঝতে যথেষ্ট সময় পাওয়ার যোগ্য, যিনি সম্ভাব্যতা এবং গণিতের চিন্তাভাবনার সাথে সঠিকভাবে সাবলীল নন। আমি উত্তরটি পিছনে পিছনে পড়ে এটি তৈরি করেছি, তাই z এর সিগময়েড দিয়ে শুরু করুন

পি(Y=1)=z- র1+ +z- র=11+ +-z- র

এবং ফিরে যেতে চেষ্টা করুন।

লগপি~(Y)=Yz- র

তারপরে বোঝা যায় যে তারা yz দিয়ে ব্যাখ্যাটি কেন শুরু করেছিল - এটি নকশা অনুসারে, ফাইনালের মতো

σ((2Y-1)z- র)

নির্মাণ দ্বারা y = 0 এর জন্য -1 এবং y = 1 এর জন্য 1 পাওয়া যায় যা বার্নোলির অধীনে y এর একমাত্র সম্ভাব্য মান।


0

এখানে একটি আরও আনুষ্ঠানিক বাক্যবন্ধ যা পরিমাপ-তাত্ত্বিক পটভূমির সাথে তাদের জন্য আবেদন করবে।

ওয়াইপিওয়াইY{0,1}পিওয়াই(Y)=পি(ওয়াই=Y)পি~ওয়াই

আমাদের অন্তর্ভুক্তগুলির নিম্নলিখিত শৃঙ্খলা রয়েছে:

লগপি~ওয়াই(Y)=Yz- রপি~ওয়াই(Y)=মেপুঃ(Yz- র)পিওয়াই(Y)=Yz- র0z- র+ +1z- র=Yz- র1+ +z- রপিওয়াই(Y)=Yz- র1+ +z- র+ +(1-Y)11+ +z- রপিওয়াই(Y)=Yσ(z- র)+ +(1-Y)σ(-z- র)পিওয়াই(Y)=σ((2Y-1)z- র)

{0,1}{-1,1}

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.