টস উদাহরণ মুদ্রায় প্রত্যাশা সর্বাধিক প্রয়োগ


18

আমি ইদানীং প্রত্যাশা সর্বাধিকীকরণের স্ব-অধ্যয়ন করেছি এবং নিজেকে প্রক্রিয়াটির কয়েকটি সাধারণ উদাহরণ ধরলাম:

থেকে এখানে : তিনটি কয়েন হয় , এবং সঙ্গে , এবং যখন ক্ষতিগ্রস্থ মাথা বাঁচিয়ে কাজকর্ম জন্য নিজ নিজ সম্ভাবনা। টস । ফলাফলটি যদি প্রধান হয় তবে তিনবার টস করুন, অন্যথায় তিনবার টস করুন । এবং দ্বারা উত্পাদিত পর্যবেক্ষণের ডেটাগুলি হ'ল এইচএইচএইচ, টিটিটি, এইচএইচএইচ, টিটিটি, এইচএইচএইচ। লুকানো ডেটা এর । , এবং অনুমান করুন ।সি 1 সি 2 পি 0 পি 1 পি 2 সি 0 সি 1 সি 2 সি 1 সি 2 সি 0 পি 0 পি 1 পি 2c0c1c2p0p1p2c0c1c2c1c2c0p0p1p2

আর থেকে এখানে : দুটি কয়েন হয় এবং সঙ্গে এবং মাথা বাঁচিয়ে কাজকর্ম যখন ক্ষতিগ্রস্থ জন্য নিজ নিজ সম্ভাব্যতা হচ্ছে। প্রতিটি রাউন্ডে, এলোমেলোভাবে একটি কয়েন নির্বাচন করুন এবং এটি দশবার টস করুন; ফলাফল রেকর্ড করুন। পর্যবেক্ষণ করা ডেটা হ'ল এই দুটি কয়েনের দেওয়া টস ফলাফল। তবে কোন মুদ্রাটি নির্দিষ্ট রাউন্ডের জন্য নির্বাচিত হয়েছিল তা আমরা জানি না। এবং অনুমান করুন ।সি বি পি পি বি পি পি বিcAcBpApBpApB

আমি যখন গণনাগুলি পেতে পারি, তবুও তারা মূল EM তত্ত্বের সাথে যেভাবে সমাধান করা হয় তা সম্পর্কিত করতে পারি না। বিশেষত, উভয় উদাহরণের এম-স্টেপ চলাকালীন, আমি দেখতে পাচ্ছি না যে তারা কীভাবে সর্বোচ্চ কিছু করছে। দেখে মনে হচ্ছে তারা প্যারামিটারগুলি পুনরায় গণনা করছে এবং কোনওভাবে নতুন পরামিতিগুলি পুরানোগুলির চেয়ে ভাল। তদুপরি, দুটি ই-পদক্ষেপ একে অপরের সাথে সাদৃশ্যও দেখায় না, মূল তত্ত্বের ই-পদক্ষেপের উল্লেখ না করে।

সুতরাং এই উদাহরণগুলি ঠিক কীভাবে কাজ করে?


প্রথম উদাহরণে, আমরা একই পরীক্ষার কতটি উদাহরণ পেয়েছি? দ্বিতীয় উদাহরণে, "এলোমেলোভাবে একটি মুদ্রা নির্বাচন করুন" এর আইন কী? আমরা কয়টি দফা পালন করি?
রাফেল

আমি সংযুক্ত পিডিএফ ফাইলগুলি ইতিমধ্যে ধাপে ধাপে এই দুটি উদাহরণ সমাধান করে। তবে, আমি ব্যবহৃত EM অ্যালগরিদমটি সত্যিই বুঝতে পারি না।
আইসিএসনো

@ আইসিস্নো, আপনি কি এলোমেলো পরিবর্তনশীলের প্রত্যাশা এবং শর্তাধীন প্রত্যাশা ধারণাটি বুঝতে পেরেছেন?
নিকোলাস মানকুসো

আমি এলোমেলো পরিবর্তনশীল এবং শর্তসাপেক্ষ সম্ভাবনার প্রাথমিক প্রত্যাশা বুঝতে পারি। তবে আমি শর্তসাপেক্ষ প্রত্যাশার সাথে পরিচিত নই, এর উদ্ভূত এবং পর্যাপ্ত পরিসংখ্যান।
আইসিসনো

উত্তর:


12

(এই উত্তরটি আপনার দেওয়া দ্বিতীয় লিঙ্কটি ব্যবহার করে))

সম্ভাবনার সংজ্ঞাটি পুনরায় স্মরণ করুন: যেখানে আমাদের ক্ষেত্রে সম্ভাব্যতার জন্য অনুমানকারী যে যথাক্রমে A এবং B স্থলভাগের মুদ্রা, আমাদের পরীক্ষার ফলাফল, প্রতিটি 10 টি ফ্লিপ এবং প্রতিটি পরীক্ষায় ব্যবহৃত মুদ্রা হিসাবে গঠিত।θ = ( θ , θ বি ) এক্স = ( এক্স 1 , , এক্স 5 ) এক্স আই জেড = ( জেড 1 , , জেড 5 )

এল[θ|এক্স]=pr[এক্স|θ]=Σজেডpr[এক্স,জেড|θ]
θ=(θএকজন,θবি)এক্স=(এক্স1,...,এক্স5)এক্সআমিজেড=(জেড1,...,জেড5)

আমরা সর্বোচ্চ সম্ভাবনা মূল্নির্ধারক খুঁজতে চান । প্রত্যাশা-বৃহদায়ন (ই.এম.) আলগোরিদিম (অন্তত স্থানীয়) এটি এক ধরনের পদ্ধতি । এটা তোলে শর্তসাপেক্ষ প্রত্যাশা, যা সর্বাধিক ব্যবহৃত হয় খোঁজার করে কাজ করে । ধারণাটি হ'ল ক্রমাগত আরও বেশি সম্ভাবনা (যেমন আরও সম্ভাব্য) প্রতিটি পুনরাবৃত্তির মধ্যে আমরা ক্রমাগত বৃদ্ধি করব যার সম্ভাবনা কার্য বৃদ্ধি করে। EM- ভিত্তিক অ্যালগরিদম ডিজাইনের এগিয়ে যাওয়ার আগে তিনটি জিনিস করা দরকার। θ θθPr[এক্স,টু Z| θ]θ^θ^θθpr[এক্স,জেড|θ]

  1. মডেলটি তৈরি করুন
  2. মডেল (ই-পদক্ষেপ) এর অধীনে গণনা শর্তাধীন প্রত্যাশা
  3. আমাদের বর্তমান অনুমান (এম-স্টেপ) আপডেট করে আমাদের সম্ভাবনাθ

মডেলটি তৈরি করুন

ইএম নিয়ে আমরা আরও আগে যাওয়ার আগে আমাদের কম্পিউটার করা ঠিক কী তা নির্ধারণ করা দরকার। ই-পদক্ষেপে আমরা জন্য প্রত্যাশিত মানটি ঠিক গণনা করছি । তাহলে এই মানটি আসলে কী? লক্ষ্য করুন যে কারণটি হ'ল আমাদের কাছে অ্যাকাউন্টে 5 টি পরীক্ষা-নিরীক্ষা রয়েছে এবং আমরা জানি না যে প্রতিটিতে কোন মুদ্রা ব্যবহৃত হয়েছিল। বৈষম্য কারণে হয়লগ প্রে [ এক্স , জেড | θ ]লগpr[এক্স,জেড|θ]লগ

logPr[X,Z|θ]=i=15logC{A,B}Pr[Xi,Zi=C|θ]=i=15logC{A,B}Pr[Zi=C|Xi,θ]Pr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ]i=15Σসি{একজন,বি}pr[জেডআমি=সি|এক্সআমি,θ]লগpr[এক্সআমি,জেডআমি=সি|θ]pr[জেডআমি=সি|এক্সআমি,θ]
লগঅবতল হওয়া এবং জেনসেনের অসমতা প্রয়োগ করা। আমাদের যে নিম্ন সীমাটির প্রয়োজন তা হ'ল আমরা সরাসরি সমীকরণের সাথে আরগ সর্বাধিক গণনা করতে পারি না। তবে আমরা চূড়ান্ত নিম্ন বাউন্ডের জন্য এটি গণনা করতে পারি।

এখন কী? এটা তোলে সম্ভাব্যতা যে আমরা দেখতে মুদ্রা দেওয়া পরীক্ষা এবং । আমাদের রয়েছে শর্তাধীন সম্ভাবনাগুলি ব্যবহার করে,সি এক্স আমি θ Pr [ জেড আমি = সি | এক্স আই , θ ] = প্র [ এক্স আই , জেড আই = সি | θ ]Pr[Zi=C|Xi,θ]CXআমিθ

Pr[Zi=C|Xi,θ]=Pr[Xi,Zi=C|θ]Pr[Xi|θ].

যখন আমরা কিছু অগ্রগতি করেছি, আমরা এখনও মডেলটি দিয়ে শেষ করি নি। কোনও প্রদত্ত মুদ্রা ক্রম ফ্লিপ করার সম্ভাবনা কী ? লেটিং এখন বা উভয় সম্ভাবনার অধীনে স্পষ্টতই সম্ভাবনা । যেহেতু আমাদের রয়েছে, এইচ আমি = # হেডস  এক্স আই প্রেতে [ এক্স আই , জেড i = সি | θ ] = 1Xihi=#heads in Xi প্র[এক্সআই| θ]জেডi=জেডআই=বিপ্র[জেডআই=]=প্র[জেডআই=বি]=/

Pr[Xi,Zi=C|θ]=12θChi(1θC)10hi,  for  C{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2
pr[এক্সআমি|θ]=1/2(pr[এক্সআমি|জেডআমি=একজন,θ]+ +pr[এক্সআমি|জেডআমি=বি,θ])

ই-পদক্ষেপ

ঠিক আছে ... এটি এত মজা ছিল না তবে আমরা এখন কিছু EM কাজ শুরু করতে পারি। EM অ্যালগরিদমটি জন্য কিছু এলোমেলো অনুমান করে শুরু হয় । এই উদাহরণে আমাদের কাছে । আমরা গণনা করি এই মান কাগজে আছে সঙ্গে লাইন। এখন আমরা মুদ্রা , এর প্রত্যাশিত সংখ্যার অঙ্ক করতে পারিআমরা যে মুদ্রা পেয়েছি তার জন্য একই জিনিস করা , θ 0 = ( 0.6 , 0.5 ) Pr [ জেড 1 = একটি | এক্স 1 , θ ] = 1 / 2 ( 0.6 50.4 5 )θθ0=(0.6,0.5)

pr[জেড1=একজন|এক্স1,θ]=1/2(0.650.45)1/2((0.650.45)+ +(0.550.55))0.45।
এক্স1=(এইচ,টি,টি,টি,এইচ,এইচ,টি,এইচ,টি,এইচ)একজন
[#মুদ্রা দ্বারা মাথা একজন|এক্স1,θ]=1pr[জেড1=একজন|এক্স1,θ]=50.452.2।
বি
[#মুদ্রা দ্বারা মাথা বি|এক্স1,θ]=1pr[জেড1=বি|এক্স1,θ]=50.552.8।
আমরা দ্বারা substituting মুদ্রার উলটা পিঠ সংখ্যার জন্য একই গনা করতে জন্য । এই অন্যান্য সব মান ধরে চলতে এবং । প্রত্যাশা রৈখিকতার জন্য আমরা we 110-1এক্সআমিআমি 1আমি5
[#মুদ্রা দ্বারা মাথা একজন|এক্স,θ]=Σআমি=15[#মুদ্রা দ্বারা মাথা একজন|এক্সআমি,θ]

এম-পদক্ষেপ

হাতে আমাদের প্রত্যাশিত মান, এখন এম পদক্ষেপ যেখানে আমরা সর্বাধিক চান আসে আমাদের প্রত্যাশিত মান দেওয়া। এটি সাধারণ সাধারণীকরণ দ্বারা করা হয়! তেমনিভাবে । এই প্রক্রিয়া ই-পদক্ষেপ এবং আবার শুরু এবং চলতে থাকে যতক্ষণ মান মিলিত (অথবা কিছু alloweable থ্রেশহোল্ড)। এই উদাহরণে আমাদের 10 টি পুনরাবৃত্তি এবং । প্রতিটি পুনরাবৃত্তিতে আরও ভাল অনুমানের কারণে মান বৃদ্ধি পায়θ

θএকজন1=[#মাথা এক্স মুদ্রা দ্বারা একজন|এক্স,θ][#মাথা এবং লেজ উপর এক্স মুদ্রা দ্বারা একজন|এক্স,θ]=21.321.3+ +9.60.71।
বিθ1θθ^=θ10=(0.8,0.52)pr[এক্স,জেড|θ]θ

এখন এক্ষেত্রে মডেলটি মোটামুটি সরল ছিল। থিংস আরো অনেক কিছু প্রশংসনীয় দ্রুত জটিল করতে পারেন, তবে ই.এম. অ্যালগরিদম সবসময় একই বিন্দুতে মিলিত হবে, এবং সবসময় একটি maxmimum সম্ভাবনা মূল্নির্ধারক উত্পাদন করা হবে । এটি কোনও স্থানীয় অনুমানকারী হতে পারে তবে এটিকে ঘুরে দেখার জন্য আমরা ইএম প্রক্রিয়াটি অন্য কোনও সূচনা দিয়ে পুনরায় আরম্ভ করতে পারি। আমরা এটি নিয়মিত পরিমাণে করতে পারি এবং সেরা ফলাফলগুলি ধরে রাখতে পারি (যেমন, চূড়ান্ত সম্ভাবনাগুলির সাথে যারা)।θ^


যদি কোনও অংশ পরিষ্কার না হয় তবে আমি সেগুলি আরও প্রসারিত করার চেষ্টা করতে পারি।
নিকোলাস মানকুসো

এটি এখন আরও পরিষ্কার হয়। আমি আসলে যা পাই না তা হ'ল কেন মুদ্রা এ এর ​​জন্য প্রত্যাশিত সংখ্যার সংখ্যা গণনা করা হয়েছিল: E [# মাথা দ্বারা মুদ্রা এ | এক্স 1, θ] = এইচ 1⋅পিআর [জেড 1 = এ | এক্স 1, θ] = 5⋅0.45 ≈2.2? প্রথম পিডিএফটিতে উল্লিখিত সমস্যাটি আরও জটিল। যদি আপনি কিছু মনে করেন না, আপনি কি এর জন্য কিছু চিত্রণমূলক গণনাও করতে পারেন? আপনার উত্তরের জন্য অনেক ধন্যবাদ।
আইসিএসনো

@ আইসিএসনো, প্রত্যাশার হিসাব যতদূর যায়: । কারণটি হ'ল আপনি ভাবতে পারেন যে যদি অন্যটি ব্যবহার করা হয় তবে অন্য কোনও সূচকের এলোমেলো পরিবর্তনশীল ছিল A সূচক ভেরিয়েবলের তুলনায় গণনা প্রত্যাশা সেই ইভেন্টের সম্ভাব্যতা সহজ। [# মুদ্রা দ্বারা মাথা একজন|এক্স1,θ]=Σ# মাথা এক্স1pr[জেড1=একজন|এক্স1,θ]=5pr[জেড1=একজন|এক্স1,θ]
নিকোলাস মানকুসো

ধীর উত্তর দেওয়ার জন্য দুঃখিত। আপনাকে ধন্যবাদ, আমি এখন দুটি উত্তর মুদ্রার উদাহরণের পিছনে যুক্তিটি সত্যই বুঝতে পারি, আপনার উত্তরটি বহুবার পেরিয়ে যাওয়ার পরে। এই প্রশ্নটি সম্পর্কে আমি একটি শেষ কথা জিজ্ঞাসা করতে চাই: এই স্লাইডের পৃষ্ঠা 8 থেকে শুরু উদাহরণ cs.northw Western.edu/~ddowney/courses/395_Winter2010/em.ppt দেখায় যে এম-পদক্ষেপে, আমাদের প্রথমে গণনা করতে হবে লগ-সম্ভাবনা ফাংশনের ডেরাইভেটিভ এবং প্রত্যাশা সর্বাধিক করতে এটি ব্যবহার করুন। মুদ্রা টাসের উদাহরণগুলিতে এম-স্টেপগুলিতে কেন এমন কিছু হয় না? কারণ এই এম-স্টেপগুলি দেখে মনে হয় না যে তারা কিছু
বাড়িয়েছে

"মডেলটি নির্মাণের" পরে প্রথম প্রদর্শিত সমীকরণ দ্বারা আমি বিভ্রান্ত। আপনি কোথা থেকে এসেছেন তা ব্যাখ্যা করতে পারবেন? এটি আমার কাছে , তাই অভ্যন্তরীণ যোগফল প্রতি জন্য 1 , তাই পুরো ডানদিকে শূন্য হয়। আমি নিশ্চিত যে আমি কিছু মিস করছি - আপনি কীভাবে সেই সমীকরণটি পেয়েছিলেন সে সম্পর্কে যুক্তিটি বানান করতে পারেন? pr[জেডআমি=একজন|এক্সআমি,θ]+ +pr[জেডআমি=বি|এক্সআমি,θ]=1আমি
ডিডাব্লিউ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.