ভেরিয়েশনাল বেয়েস এবং ইএম এর মধ্যে সম্পর্ক


26

আমি কোথাও পড়েছি যে ভেরিয়াল বয়েস পদ্ধতিটি ইএম অ্যালগরিদমের একটি সাধারণীকরণ। আসলে, অ্যালগরিদমের পুনরাবৃত্ত অংশগুলি খুব একই রকম similar EM অ্যালগরিদমটি ভেরিয়াল বেয়েসের একটি বিশেষ সংস্করণ কিনা তা পরীক্ষা করার জন্য, আমি নিম্নলিখিতগুলি চেষ্টা করেছিলাম:

  1. Y হ'ল ডেটা, হ'ল সুপ্ত ভেরিয়েবলের সংগ্রহ এবং হ'ল পরামিতি। ভেরিয়েশনাল বেয়েসে আমরা প্রায় একটি অনুমান করতে পারি । যেখানে গুলি সরল, ট্র্যাকটেবল বিতরণ।XΘP(X,Θ|Y)QX(X)QΘ(Θ)Q

  2. যেহেতু ইএম অ্যালগরিদম কোনও এমএপি পয়েন্টের অনুমানের সন্ধান করে, আমি ভেবেছিলাম যে ভেরিয়েশনাল বয়েস ইএম-তে রূপান্তর করতে পারে যদি আমি একটি ডেল্টা ফাংশন ব্যবহার করি যেমন: । হ'ল পরামিতিগুলির প্রথম অনুমান যা সাধারণত ইএম-তে হয়।QΘ1(Θ)=δΘ1(Θ)Θ1

  3. যখন দেওয়া হয়, কে কেএল ন্যূনতম করে the সূত্রটি দ্বারা পাওয়া যায় উপরের সূত্রটি সরল করে , এই পদক্ষেপটি প্রত্যাশা পদক্ষেপের সমতুল্য হয়ে দাঁড়ায় ইএম অ্যালগোরিদমের!QΘ1(Θ)=δΘ1(Θ)QX1(X)

    QX1(X)=exp(EδΘ1[lnP(X,Y,Θ)])exp(EδΘ1[lnP(X,Y,Θ)])dX
    QX1(X)=P(X|Θ1,Y)

তবে এর ধারাবাহিকতা হিসাবে আমি ম্যাক্সিমাইজেশন পদক্ষেপটি অর্জন করতে পারি না। পরবর্তী পদক্ষেপে আমাদের গণনা করতে হবে এবং বেইস পুনরাবৃত্তির বিধি অনুসারে এটি হ'ল:QΘ2(Θ)

QΘ2(Θ)=exp(EP(X|Θ1,Y)[lnP(X,Y,Θ)])exp(EP(X|Θ1,Y)[lnP(X,Y,Θ)])dΘ

ভিবি এবং ইএম অ্যালগরিদমগুলি কি এইভাবে সংযুক্ত রয়েছে? ভেরিয়াল বেয়েসের একটি বিশেষ কেস হিসাবে আমরা কীভাবে ইএম অর্জন করতে পারি, আমার পদ্ধতির সত্য?


আপনি কোথায় পড়েছেন যে ইএম অ্যালগরিদম একটি এমএপি অনুমানের সন্ধান করে? নীল অ্যান্ড হিন্টন (1998) এর এই গবেষণাপত্রটিতে উপস্থাপিত EM এর দৃষ্টিভঙ্গিটি বুঝতে পারলে ভেরিয়েশনাল ইনফেরেন্স এবং ইএম এর মধ্যে সম্পর্ক স্পষ্ট হয়ে উঠবে । আমার উত্তর এখানে দেখুন
লুকাস

আমি মনে করি আমি ইএম অ্যালগরিদম ঠিক একইভাবে শিখেছি যেমন এই কাগজটি ব্যাখ্যা করেছে, এটি একটি নিম্ন সীমাবদ্ধ সীমাবদ্ধকরণ সমস্যা হিসাবে দেখা হয়। জেনসেনের সাম্যতা এবং তারতম্যের ক্যালকুলাস ব্যবহার করে দেখা যায় যে প্রত্যাশা পদক্ষেপে, হল এমন একটি বিতরণ যা জন্য নিম্ন সর্বাধিক করে তোলে এবং সর্বাধিককরণের পদক্ষেপে, একটি , যা নীচের সীমানায় সর্বাধিক। সুতরাং, এটি ভেরিয়েন্টাল বয়েসের সাথে সমান। (এবং এটি স্থানীয় সর্বাধিক প্রান্তিক পূর্ববর্তী স্থানে রূপান্তরিত করে, তাই P(X|Θt,Y)ΘtΘt+1=argmaxΘ<lnP(X,Y,Θ)>P(X|Θt,Y)
ম্যাপের

1
দুঃখিত, আমি আপনার প্রশ্নটি যথেষ্ট মনোযোগ দিয়ে পড়িনি। আমি বিশ্বাস করি আপনার গণনা করার সর্বাধিকীকরণের পদক্ষেপটি কেবলমাত্র যদি আপনি কোনও বিতরণকে মঞ্জুরি দেন তবে তা বৈধ, যদি আপনি কেবলমাত্র ফ্যাক্টেরাইজেশন অনুমান করেন। তবে আপনি অতিরিক্তভাবে ধরে যে একটি ব-দ্বীপ বিতরণ। স্পষ্টভাবে নিম্ন মুখী বাড়ানোর লক্ষ্যে থেকে সম্মান সঙ্গে চেষ্টা করুন এর প্যারামিটার । QΘ2QΘ2Θ2QΘ2(Θ)=δΘ2(Θ)
লুকাস

আমি উপস্থাপনার 21 পৃষ্ঠায় পেয়েছি cs.cmu.edu/~tom/10-702/Zoubin-702.pdf EM এবং VB এর একটি তুলনা দেখানো হয়েছে, একইভাবে ডায়রাক ফাংশনটি ব্যবহার করে। তবে ভিবি কীভাবে ইএম হ্রাস করে তা দেওয়া হয় না is
ইউফুক বিসিচি ক্যান

উত্তর:


20

আপনার পদ্ধতির সঠিক। EM সীমাবদ্ধতার অধীনে VB এর সমতুল্য যে আনুমানিক পোস্টেরিয়রটি একটি পয়েন্ট ভর হিসাবে সীমাবদ্ধ। (এটি বেইসিয়ান ডেটা অ্যানালাইসিসের 337 পৃষ্ঠায় প্রমাণ ছাড়াই উল্লেখ করা হয়েছে ।) আসুন এই বিন্দুটির অজানা অবস্থান: ভিবি হবে নিম্নোক্ত কেএল-ডাইভারজেন্সটি হ্রাস করুন: সর্বনিম্ন ওভার ইএম এর ই-পদক্ষেপ দেয় এবং সর্বনিম্ন ওভার এম-পদক্ষেপ দেয়। Θ Q Θ ( Θ ) = δ ( Θ - Θ ) কে এল ( প্রশ্ন | | পি ) = কিউ এক্স ( এক্স ) কিউ Θ ( Θ ) এলএন কিউ এক্স ( এক্স ) কিউ Θ ( Θ )ΘΘ

QΘ(Θ)=δ(ΘΘ)
কিউএক্স(এক্স)Θ∗ ∗
KL(Q||P)=QX(X)QΘ(Θ)lnQX(X)QΘ(Θ)P(X,Y,Θ)dXdΘ=QX(X)lnQX(X)QΘ(Θ)P(X,Y,Θ)dX
QX(X)Θ

অবশ্যই, আপনি যদি কেএল ডাইভারজেনেন্সকে প্রকৃত পক্ষে মূল্যায়ন করেন তবে তা অসীম হবে। আপনি যদি ডেল্টা ফাংশনটিকে সীমা হিসাবে বিবেচনা করেন তবে এটি কোনও সমস্যা নয়।


প্রযুক্তিগতভাবে, im আর্ট এমএপি-ইএম এর এম-পদক্ষেপের সাথে সামঞ্জস্য করে (পূর্ববর্তী ) এর সাথে। - বিভাগে 3.1 VBEM কাগজ Θ * পি( Θ * )EQx[lnP(X,Y,Θ)]=EQx[lnP(X,Y|Θ)]+lnP(Θ)ΘP(Θ)
Yibo ইয়াং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.