এমডিএই পদ্ধতিটি এমন ক্ষেত্রে প্রয়োগ করা যেতে পারে যেখানে কেউ পিডিএফের মূল কার্যকরী ফর্মটি জানেন (যেমন, এটি গাউসিয়ান, বা লগ-নরমাল, বা ক্ষতিকারক, বা যা কিছু) তবে অন্তর্নিহিত পরামিতিগুলি নয়; উদাহরণস্বরূপ, তারা পিডিএফ-এ এবং মানগুলি জানে না : বা অন্য যে কোনও ধরণের পিডিএফ তারা ধরে নিচ্ছে। এমএলই পদ্ধতির কাজ হ'ল যা প্রকৃতপক্ষে পর্যবেক্ষণ করা হয়েছিল নির্দিষ্ট তথ্য পরিমাপের অজানা প্যারামিটারগুলির জন্য সেরা (অর্থাত্ সবচেয়ে প্রশংসনীয়) মানগুলি । সুতরাং আপনার প্রথম প্রশ্নের উত্তর দিতে, হ্যাঁ, কাউকে কী জিজ্ঞাসা করার জন্য আপনি সর্বদা আপনার অধিকারের মধ্যে থাকেনσ f ( x | μ , σ)μσএক্স1,x এর2,x3,।
চ( x | μ , σ)) = 12 πσ2----√মেপুঃ[ - ( এক্স - μ )22 σ2]
এক্স1, এক্স2, এক্স3, । । ।তারা সর্বাধিক সম্ভাবনার প্রাক্কলনের জন্য ধরে নিচ্ছে পিডিএফের
ফর্ম ; প্রকৃতপক্ষে, অনুমানিত প্যারামিটার মানগুলি যা তারা আপনাকে বলে সেগুলি ইতিমধ্যে সেই প্রসঙ্গে যোগাযোগ না করা অবধি অর্থবহ নয়।
ইএম অ্যালগরিদম যেমনটি আমি অতীতে প্রয়োগ করতে দেখেছি তা হ'ল এক ধরণের মেটা অ্যালগরিদম, যেখানে কিছু মেটাডাটা অনুপস্থিত এবং আপনারও এটি অনুমান করতে হবে। সুতরাং, উদাহরণস্বরূপ, সম্ভবত আমার কাছে একটি পিডিএফ রয়েছে যা বেশ কয়েকটি গৌসিয়ানদের মিশ্রণ, যেমন: অতিমাত্রায় বাদে প্রশস্ততা প্যারামিটার of যোগ করা, এটি অনেকটা আগের সমস্যার মতো দেখায়, তবে যদি আমি আপনাকে বলি যে আমরা এমনকি এর মানও জানি না (যেমন, গাউসিয়ান মিশ্রণের মোডের সংখ্যা) এবং আমরা ডেটা পরিমাপ থেকে অনুমান করতে চাইএকেএন
চ( x | এ)1, । । । , এএন, μ1, । । । , μএন, σ1, । । । σএন) = ∑ট = 1এনএকজনট2 πσ2ট----√মেপুঃ[ - ( এক্স - μ)ট)22 σ2ট]
একজনটএনএক্স1, এক্স2, এক্স3, । । । বাড়ছে কি?
এই ক্ষেত্রে, আপনার একটি সমস্যা আছে, কারণ প্রতিটি সম্ভাব্য মান (এটি "মেটা" অংশ যা আমি উপরের দিকে ইঙ্গিত করছিলাম) সত্যিই কিছুটা ভিন্ন ভিন্ন মডেল উত্পন্ন করে। যদি , তবে আপনার তিনটি পরামিতি ( , , ) সহ একটি মডেল রয়েছে যখন , তবে আপনার ছয়টি পরামিতি ( সহ একটি মডেল রয়েছে , , , , , )। আপনি যে সেরা ফিট মানসমূহ ( , , ) এর জন্য পানএন = 1 এ 1 μ 1 σ 1 এন = 2 এ 1 এ 2 2 μ 1 μ 2 σ 1 σ 2 এ 1 μ 1 σএনএন= 1একজন1μ1σ1এন= 2একজন1একজন2μ1μ2σ1σ2একজন1μ1 এন=1এন=2σ1এন= 1 মডেলের সরাসরি তুলনা করা যায় না যে আপনি মডেলের সেই একই পরামিতিগুলির জন্য প্রাপ্ত সেরা ফিট মানগুলির সাথে তুলনা করতে পারেন , কারণ তারা স্বাধীনতার বিভিন্ন সংখ্যক ডিগ্রি সহ বিভিন্ন মডেল ।এন= 2
EM অ্যালগরিদমের ভূমিকা হ'ল এই ধরণের তুলনা করার জন্য একটি পদ্ধতি সরবরাহ করা (সাধারণত একটি "জটিলতার জরিমানা চাপিয়ে " যা ছোট মানকে পছন্দ করে) যাতে আমরা জন্য সর্বোত্তম সামগ্রিক মানটি বেছে নিতে পারি ।এনএনএন
সুতরাং, আপনার আসল প্রশ্নের উত্তর দিতে, ইএম অ্যালগরিদমের পিডিএফ ফর্মটির একটি কম সুনির্দিষ্ট স্পেসিফিকেশন প্রয়োজন; কেউ বলতে পারেন যে এটি বিকল্প বিকল্পগুলির একটি পরিসর বিবেচনা করে (যেমন বিকল্পটি , , , ইত্যাদি) তবে এটি এখনও আপনাকে সেই বিকল্পগুলির মৌলিক গাণিতিক ফর্ম সম্পর্কে কিছু নির্দিষ্ট করতে হবে - আপনাকে এখনও কোনও কোনও অর্থে সম্ভাব্য পিডিএফগুলির একটি "পরিবার" নির্দিষ্ট করতে হবে, যদিও আপনি পরিবারের কোন "সদস্য" ডেটাতে সেরা ফিট করে তা আপনার জন্য অ্যালগরিদমকে সিদ্ধান্ত নিতে দিচ্ছেন।এন = 2 এন = 3এন= 1এন= 2এন= 3