বায়েশিয়ান অনলাইন চেঞ্জপয়েন্ট সনাক্তকরণ (প্রান্তিক পূর্বাভাস বিতরণ)


9

আমি অ্যাডামস এবং ম্যাকেকে বাইয়েশিয়ান অনলাইন চেঞ্জপয়েন্ট সনাক্তকরণ কাগজটি পড়ছি ( লিঙ্ক )।

প্রান্তিক পূর্বাভাস বিতরণ লিখে লেখকরা শুরু করেন:

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
কোথায়
  • xt সময়ে পর্যবেক্ষণ হয় t;
  • x1:t অবধি পর্যবেক্ষণের সেটটি বোঝায় t;
  • rtNবর্তমানে চলমান রানফল্য (শেষ পরিবর্তন পয়েন্ট থেকে সময় 0 হতে পারে); এবং
  • xt(r) রান সঙ্গে যুক্ত পর্যবেক্ষণের সেট rt

EQ। 1 আনুষ্ঠানিকভাবে সঠিক (@ জুহোকোকালার নীচে জবাবটি দেখুন), তবে আমার বোধগম্যতা হল আপনি যদি বাস্তবে কোনও ভবিষ্যদ্বাণী করতে চানxt+1 আপনার এটি নিম্নলিখিত হিসাবে প্রসারিত করতে হবে:

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

আমার যুক্তিটি হ'ল (ভবিষ্যতের) সময়ে একটি পরিবর্তন পয়েন্ট হতে পারে t+1তবে উত্তরোত্তর P(rt|x1:t) শুধুমাত্র কভার পর্যন্ত t

মুল বক্তব্যটি হ'ল, কাগজে লেখকরা আমাদের একিউ তৈরি করেন। 1 যেমনটি হয় (কাগজে Eqs। 3 এবং 11 দেখুন), এবং 1 বি নয় । সুতরাং, তারা আপাতদৃষ্টিতে সময় পরিবর্তনের সম্ভাবনাটিকে উপেক্ষা করেt+1 যখন ভবিষ্যদ্বাণী করা xt+1 সময়ে উপলব্ধ ডেটা থেকে t। বিভাগ 2 এর শুরুতে তারা এন পাসেন্ট বলে

আমরা ধরে নিই যে আমরা ভবিষ্যদ্বাণীমূলক বিতরণ গণনা করতে পারি [এর জন্য xt+1] প্রদত্ত রান দৈর্ঘ্যের উপর শর্তসাপেক্ষ rt

ট্রিক যেখানে সম্ভবত সম্ভবত। তবে সাধারণভাবে, এই ভবিষ্যদ্বাণীপূর্ণ বিতরণকে একের মতো দেখতে হবে। 1B; যা তারা করে না (একাদশ 11)।

সুতরাং, আমি নিশ্চিত যে আমি কী ঘটছে তা বুঝতে পারছি না। স্বরলিপিটি সহ সম্ভবত মজার কিছু চলছে।


উল্লেখ

  • অ্যাডামস, আরপি এবং ম্যাককে, ডিজে (2007)। বায়েশিয়ান অনলাইন চেঞ্জপয়েন্ট সনাক্তকরণ। আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 0710.3742।

এর একটি সম্ভাব্য ব্যাখ্যা rtসময় ধাপ শেষে রান দৈর্ঘ্য প্রতিনিধিত্ব করেt, যা পরে সময়ে changepointt। এটি দিয়ে, এক। 1 বোঝায়। আসলে, অ্যালগরিদমের একটি সূচনাটি সেট করে byP(r0=0)=1 যা ধরে নিয়েছে যে শুরু করার ঠিক আগেই একটি পরিবর্তন পয়েন্ট রয়েছে t=1। তবে এর মধ্যে যদি পরিবর্তন হয় তবে চিত্র 1 ভুল (বা অন্তত বিভ্রান্তিকর) ist=4 এবং t=5, এবং মধ্যে t=10 এবং t=11 চিত্র 1 এ চিত্রিত হিসাবে, তারপর r4 এবং r10 এই স্বরলিপি অনুসারে 0 হওয়া উচিত, এবং না r5 এবং r11চিত্র 1 বি অনুযায়ী
lacerbi

1
একে অদ্ভুত কিছু চলছে। 3 শেষ লাইনে যোগফলের মধ্যম গুণক হিসাবে P(xtrt1,xt(r)) আমি ভেবেছিলাম xt(r) রয়েছে xt। আমি সন্দেহt এবং t1 হিসাবে স্থান পরিবর্তন হয়েছে P(xtrt,xt1(r))বোঝাতে হবে। Eq এ। 11, ডান হাতের উপর নির্ভর করে বলে মনে হচ্ছেxt(r)যা বাম দিকে একেবারেই উপস্থিত হয় না, তাই হয় কিছু ভুল আছে বা আমি স্বীকৃতিটি মোটেই বুঝতে পারি না।
জুহো কোক্কালা

@ জুহোক্ককলা: আমি আনন্দিত যে এই অনুভূতি নিয়ে আমি একমাত্র নই ...
লাসেরবি

1
@ লেসারবি, এই কাগজটি সম্পর্কে আমার আরও একটি প্রশ্ন রয়েছে এবং আপনি মনে করেন যে আপনি এই কাজের সাথে পরিচিত বলে মনে করছেন আপনি এটির উত্তর দিতে সক্ষম হতে পারেন: stats.stackexchange.com/questions/419988
gwg

উত্তর:


5

(1) এবং (1 বি) উভয়ই সঠিক। ওপির ঠিক আছে যে (এই মডেলটিতে) একটি পরিবর্তন পয়েন্ট থাকতে পারেt+1, এবং xt+1পরিবর্তন পয়েন্ট আছে কিনা তার উপর নির্ভর করে। এটি (1) এর সম্ভাব্য মান হিসাবে কোনও সমস্যা বোঝায় নাrt+1 সম্পূর্ণরূপে দ্বারা "আচ্ছাদিত" P(xt+1rt,x1:t)P(xt+1|rt,x1:t) শর্তসাপেক্ষে বিতরণ মানে xt+1 শর্তসাপেক্ষে (rt,x1:t)। এই শর্তসাপেক্ষ বন্টন গড় সহ "অন্যান্য সমস্ত কিছু" জুড়ে overrt+1শর্তযুক্ত (rt,x1:t)। যেমন কেউ লিখতে পারে, বলে,P(xt+1000|xt), যা চেঞ্জপয়েন্টগুলির সম্ভাব্য সমস্ত কনফিগারেশন পাশাপাশি মানগুলির বিবেচনা করবে xiএর মধ্যে ঘটছে t এবং t+1000

বাকী অংশগুলিতে আমি প্রথমে (1) এবং তারপরে (1 বি) ভিত্তিক (1) প্রাপ্ত করি।

(1) এর উত্স

যেকোন র্যান্ডম ভেরিয়েবলের জন্য A,B,C, আমাদের আছে

P(AB)=cP(AB,C=c)P(C=cB),
যতক্ষন পর্যন্ত না Cস্বতন্ত্র (অন্যথায় যোগফল একটি অখণ্ড দ্বারা প্রতিস্থাপন করা প্রয়োজন)। এটি প্রয়োগ করা হচ্ছেxt+1,x1:t,rt:

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
which holds no matter what the dependencies between rt, x1:t, xt+1 are, that is, no model assumptions have yet been used. In the present model, xt+1 given rt,xt(r) is assumed* to be conditionally independent of the values of x from the runs before xt(r). This implies P(xt+1rt,x1:t)=P(xt+1rt,xt(r)). Substituting this into the previous equation, we get

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
which is (1) in OP.

Derivation of (1b)

Let us consider the decomposition of P(xt+1rt,xt(r)) over possible values of rt+1:

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

Since it is assumed* that whether a changepoint occurs at t+1 (between xt and xt+1) does not depend on the history of x, we have P(rt+1rt,xt(r))=P(rt+1rt). Furthermore, since rt+1 determines whether xt+1 belongs into the same run as xt, we have P(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r)). Substituting these two simplifications into the factorization above, we get

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
Substituting this into (1), we get
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)
which is OP's (1b).

* Remark on the model's conditional independence assumptions

Based on quickly browsing the paper, I would personally like the conditional independence properties to be more explicitly stated somewhere, but I suppose that the intention is that r is Markovian and the x:s associated to different runs are independent (given the runs).


1
(+1) Thanks. Yep, of course, I understand that Eq. 1 is formally correct if one assumes implicit marginalization over rt+1. The problem is that later on the authors make predictions (Eq. 11 in the paper, and implicitly in Eq. 3) and they are seemingly not marginalizing over rt+1 when they take them.
lacerbi

1
Oh. It seems then that I misunderstood the question - should I delete this? You may want to clarify the question, currently it sounds like (1) is somehow incorrect (instead of perhaps not useful)
Juho Kokkala

Please keep this answer, which is valuable. My mistake that I was't clear enough in my original post. I tried to clarify my question thanks to your comments, and in a way that still makes this answer meaningful.
lacerbi
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.