আমি বুঝি যে একটি সেট দেওয়া স্বাধীন পর্যবেক্ষণ সর্বাধিক সম্ভাবনা মূল্নির্ধারক (অথবা এবং, equivalently, ফ্ল্যাট দিয়ে মানচিত্রে / অভিন্ন পূর্বে) যে শনাক্ত পরামিতি যে মডেল বন্টন উত্পাদন যা এই পর্যবেক্ষণগুলির সাথে সবচেয়ে ভাল মেলে পি এম ও ডি ই এল (
বা, আরও সুবিধাজনকভাবে
এবং মাল্টি-ক্লাস গভীর নিউরাল নেটওয়ার্কগুলির জন্য ক্ষতির ফাংশন নির্ধারণে \ mathbf {θ} _ {এমএল} যে ভূমিকা নিতে পারে সেই ভূমিকাটি দেখুন , যেখানে s নেটওয়ার্কের প্রশিক্ষণযোগ্য প্যারামিটারগুলির সাথে সামঞ্জস্য করে (যেমন, এবং পর্যবেক্ষণগুলি ইনপুট ক্রিয়াকলাপগুলির জোড় are mathbf {x} এবং , \ mathbf {o এর সাথে সম্পর্কিত সঠিক শ্রেণির লেবেল y the taking ^ {(i)} = { }, গ্রহণ করে
যা আমি বুঝতে পারি না এটি কীভাবে (ভেক্টরাইজড) সঠিক আউটপুট, , এবং নেটওয়ার্কের সম্পর্কিত আউটপুট ক্রিয়াকলাপগুলির সাথে সম্পর্কিত cross যখন প্রশিক্ষণের সময় এরর / ক্ষতি পরিমাপ যে অনুশীলন ব্যবহার করা হয় । বেশ কয়েকটি সম্পর্কিত সমস্যা রয়েছে:
ক্রিয়াকলাপ "সম্ভাব্যতা হিসাবে"
এমএলই এবং ক্রস এনট্রপির মধ্যে সম্পর্ক স্থাপনের একটি পদক্ষেপ হ'ল আউটপুট অ্যাক্টিভেশনগুলি "যদি" তারা সম্ভাব্যতা ব্যবহার করে তবে তা ব্যবহার করা। তবে এগুলি আমার কাছে বা কমপক্ষে যে তারা তা আমার কাছে পরিষ্কার নয় ।
প্রশিক্ষণ ত্রুটির গণনা করার ক্ষেত্রে - বিশেষত, এটিকে "ক্রস এনট্রপি লোকসান" বলার ক্ষেত্রে - এটি ধরে নেওয়া হয় (ক্রিয়াকলাপগুলিকে 1 এর সমান করে দেওয়ার পরে)
অথবা
যাতে আমরা লিখতে পারি
এবং এগুলো
তবে এটি অবশ্যই সম্ভাবনা তৈরি করে (কিছুতেই যে পরিমাণে রয়েছে), এটি অন্যান্য ক্রিয়াকলাপগুলিতে কোনও বিধিনিষেধ রাখে না।
সেই ক্ষেত্রে th that কে পিএমএফ বলা যেতে পারে? এমন কি এমন কিছু আছে যা বাস্তব সম্ভাবনাগুলিতে নয় (এবং কেবল তাদের মতো "পছন্দ করে" )?
শ্রেণিবদ্ধকরণের সীমাবদ্ধতা
এমএলইকে ক্রস-এন্ট্রপির সাথে সমীকরণের উপরের গুরুত্বপূর্ণ পদক্ষেপটি সম্পূর্ণরূপে one of এর "এক-গরম" কাঠামোর উপর নির্ভর করে যা একটি (একক-লেবেল) বহু-শ্রেণীর শেখার সমস্যাটিকে চিহ্নিত করে। জন্য অন্য কোন কাঠামো এটা অসম্ভব থেকে পেতে হবে থেকে ।
এমএলই এবং ক্রস-এন্ট্রপি মিনিমাইজেশনের সমীকরণটি কি সেই ক্ষেত্রে সীমাবদ্ধ যেখানে "" এক-গরম "?
বিভিন্ন প্রশিক্ষণ এবং পূর্বাভাসের সম্ভাবনা
ভবিষ্যদ্বাণী করার সময়, এটি প্রায় সর্বদা ক্ষেত্রে
যার ফলস্বরূপ সঠিক ভবিষ্যদ্বাণী হওয়ার সম্ভাবনা রয়েছে যা প্রশিক্ষণের সময় শিখে নেওয়া সম্ভাবনার থেকে পৃথক হয় যদি না এটি নির্ভরযোগ্যভাবে হয়
এটি কি কখনও নির্ভরযোগ্যভাবে হয়? এটি সম্ভবত কমপক্ষে সত্য? বা আরও কিছু যুক্তি রয়েছে যা লেবেল পজিশনে শিখে নেওয়া অ্যাক্টিভেশনের মানটির এই সমীকরণকে ন্যায্যতা দেয় যে সম্ভাব্যতার সাথে সেখানে শিখে নেওয়া অ্যাক্টিভেশনের সর্বাধিক মানটি ঘটে?
এন্ট্রপি এবং তথ্য তত্ত্ব
এমনকি অভিমানী যে উপরোক্ত উদ্বেগ সুরাহা করা হয় এবং সক্রিয়করণব্যবস্থা বৈধ PMFs হয় (অথবা করতে অর্থপূর্ণ যেমন চিকিত্সা করা), যাতে ভূমিকা ক্রস এনট্রপি অভিনয় কম্পিউটিং unproblematic হয়, তখন তাতে পরিষ্কার না আমাকে কেন or about) এর এনট্রপি সম্পর্কে কথা বলতে সাহায্য বা অর্থবহ কারণ, শ্যানন এন্ট্রপি একটি নির্দিষ্ট ক্ষেত্রে প্রযোজ্য এ জাতীয় এনকোডিং , যা নেটওয়ার্ক প্রশিক্ষণে ব্যবহৃত হচ্ছে না।
ব্যয় কার্যকারিতা ব্যাখ্যা করার ক্ষেত্রে তথ্য তাত্ত্বিক এনট্রোপি কী ভূমিকা পালন করে, কোনওটিকে গণনা করার জন্য কোনও সরঞ্জাম (ক্রস এনট্রপির আকারে) সরবরাহ করার বিপরীতে (যা এমএলইয়ের সাথে মিলে যায়)?
softmax_cross_entropy_with_logits
: তারা গণনা করে এবং এইভাবে যা একটি নেটওয়ার্ক "সংজ্ঞা দেয়" সম্ভাব্যতা তৈরি করার জন্য ডিজাইন করে (কমপক্ষে লেবেলের স্থানে)। কোন?