প্রত্যাশা-সর্বাধিককরণের বিষয়ে যে কাগজটি আমি স্পষ্ট করে দেখতে পেয়েছি তা হ'ল ওয়েলিং ও কুড়িহার "ম্যাক্সিমাইজেশন-এক্সপেকটেশন" অ্যালগরিদম (পিডিএফ) হিসাবে বায়েশিয়ান কে-মিনস ।
ধরুন আমাদের কাছে এক্স পর্যবেক্ষণ, z লুকানো এলোমেলো ভেরিয়েবল এবং মোট θ পরামিতি সহ একটি সম্ভাব্য মডেল রয়েছে । আমাদের একটি ডেটাসেট ডি দেওয়া হয় এবং p ( z , θ | D ) স্থাপন করতে বাধ্য করা হয় (উচ্চতর শক্তি দ্বারা ) ।p(x,z,θ)xzθDp(z,θ|D)
1. গিবস নমুনা
স্যাম্পলিং করে আমরা আনুমানিক । গীবস নমুনা পর্যায়ক্রমে পি ( জেড , θ | ডি ) দেয় :p(z,θ|D)p(z,θ|D)
θ∼p(θ|z,D)z∼p(z|θ,D)
2. ভেরিয়েন্টাল বয়েস
পরিবর্তে, আমরা একটি ডিস্ট্রিবিউশন এবং q ( z ) স্থাপন করার চেষ্টা করতে পারি এবং p ( θ , z | D ) এর পরে আমরা যে বিতরণ করি তার সাথে পার্থক্য হ্রাস করতে পারি । বিতরণের মধ্যে পার্থক্যটির একটি সুবিধাজনক অভিনব নাম, কেএল-ডাইভারজেন্স রয়েছে। মিনিমাইজ করতে কে এল [ কুই ( θ ) কুই ( z- র ) | | p ( θ , z | D ) ] আমরা আপডেট করি:q( θ )কুই( জেড))p ( θ , z)| ঘ)কেএল [ কিউ( θ ) প্রশ্ন( জেড)) | | p ( θ , z)| ডি)]
কুই( θ ) ∝ Exp( ঙ)[ লগp ( θ , z), ডি ) ]কুই( জেড)))কুই( জেড)) ∝ exp( ঙ)[ লগp ( θ , z), ডি ) ]কুই( θ ))
৩. প্রত্যাশা-সর্বাধিকীকরণ
এবং θ উভয়ের জন্য সম্পূর্ণ সম্ভাব্য বন্টন নিয়ে আসা চরম বলে বিবেচিত হতে পারে। আমরা এর পরিবর্তে এর মধ্যে একটির জন্য একটি বিন্দু অনুমান বিবেচনা করি না এবং অন্যটিকে সুন্দর এবং সংবেদনশীল রাখি। ই.এম. মাপদণ্ড θ (সর্বোচ্চ আরোহী) মান তার মানচিত্রে একটি পূর্ণ বিতরণের এক হচ্ছে মূল্যহীন, এবং সেট হিসাবে স্থাপন করা হয়, θ * ।z- রθθθ∗
θ∗=argmaxθE[logp(θ,z,D)]q(z)q(z)=p(z|θ∗,D)
এখানে আসলে একটি ভাল স্বরলিপি হবে: argmax অপারেটর একাধিক মান ফিরে আসতে পারেন। তবে আসুন নিটপিক করি না। বৈকল্পিক বায়েসের সাথে তুলনা করে আপনি দেখতে পাচ্ছেন যে এক্সপ দ্বারা লগের জন্য সংশোধন করার ফলে ফলাফল পরিবর্তন হয় না, সুতরাং এটি আর প্রয়োজন হয় না।θ∗∈argmaxlogexp
৪. সর্বাধিক-প্রত্যাশা
সেখানে বিবেচনা করার কোন কারণ নেই একটি পয়মাল শিশুর মতো। আমরা শুধু পাশাপাশি বিন্দু অনুমান ব্যবহার করতে পারেন z- র * আমাদের গোপন ভেরিয়েবলের জন্য এবং পরামিতি দিতে θ একটি পূর্ণ বিতরণের বিলাসিতা।zz∗θ
z∗=argmaxzE[logp(θ,z,D)]q(θ)q(θ)=p(θ|z∗,D)
যদি আমাদের লুকানো ভেরিয়েবল নির্দেশক ভেরিয়েবল হয় তবে ক্লাস্টারের সংখ্যার উপর অনুমান করার জন্য আমাদের কাছে হঠাৎ একটি গণনামূলক সস্তা পদ্ধতি রয়েছে। এটি অন্য কথায়: মডেল নির্বাচন (বা স্বয়ংক্রিয় প্রাসঙ্গিক সনাক্তকরণ বা অন্য কোনও অভিনব নাম কল্পনা করুন)।z
5. শর্তযুক্ত মোড পরিলক্ষিত
অবশ্যই, আনুমানিক অনুমান এর পোস্টার শিশু উভয় প্যারামিটার পয়েন্ট হিসেব ব্যবহার করা পর্যবেক্ষণ সেইসাথে z- র ।θz
θ∗=argmaxθp(θ,z∗,D)z∗=argmaxzp(θ∗,z,D)
ম্যাক্সিমাইজেশন-প্রত্যাশা কীভাবে কার্যকর হয় তা দেখার জন্য আমি নিবন্ধটি অত্যন্ত প্রস্তাব দিই। আমার মতে, এই নিবন্ধটির শক্তি তবে কোনও মিয়ানস বিকল্পের জন্য প্রয়োগ নয় , তবে এই সুদৃ .় এবং সংক্ষিপ্ত বিবরণটি সংক্ষেপে প্রকাশ করা হয়েছে।k