আমি এই প্রশ্নের উত্তরের (বিশেষভাবে chapter অধ্যায়ে) উত্তর দেওয়ার জন্য এবং আমি যা বলার করছি তার সমস্ত উত্স হিসাবে বায়েশিয়ান ডেটা অ্যানালাইসিস বইটি পরামর্শ দেব। তবে বায়েশীয়রা যে সমস্যাটিকে আক্রমণ করে সেগুলির মধ্যে একটি হল পোস্টেরিয়ের প্রেডিকটিভ পি-ভ্যালু (পিপিপি) ব্যবহার করে। পিপিপিরা কীভাবে এই সমস্যাটি সমাধান করবে এদিকে ঝাঁপ দেওয়ার আগে প্রথমে আমাকে নীচের স্বরলিপিটি সংজ্ঞায়িত করতে দিন:
যাক পর্যবেক্ষিত তথ্য হতে হবে এবং প্যারামিটার ভেক্টর হও। আমরা সংজ্ঞায়িত যেমন প্রতিলিপি ডেটা আছে যা পারতেন লক্ষ্য করা, বা, predictively ভাবতে, ডাটা হিসাবে আমরা চাই কাল দেখা হবে যদি পরীক্ষা করে উত্পাদিত আজ একই মডেল এবং একই সঙ্গে প্রতিলিপি ছিল মান যা পর্যবেক্ষণ করা ডেটা তৈরি করে।θ Y প্রতিনিধির Y θyθyrepyθ
দ্রষ্টব্য, আমরা উত্তরোত্তর ভবিষ্যদ্বাণীমূলক বিতরণ সাথে জ্ঞানের বর্তমান অবস্থার
of এর বিতরণকে সংজ্ঞায়িত করব will পি ( Y প্রতিনিধির | Y ) = ∫ Θ পি ( Y প্রতিনিধির | θ ) পি ( θ | Y ) ঘ θyrep
p(yrep|y)=∫Θp(yrep|θ)p(θ|y)dθ
এখন, আমরা পরীক্ষার পরিমাণ , আমরা যে ডেটাগুলি পরীক্ষা করতে চাই তার দিকগুলি নির্ধারণ করে মডেল এবং ডেটাগুলির মধ্যে পার্থক্যটি পরিমাপ করতে পারি । একটি পরীক্ষার পরিমাণ বা তাত্পর্যপূর্ণ পরিমাপ , , প্যারামিটার এবং ডেটার একটি স্কেলার সংক্ষিপ্তসার যা ভবিষ্যদ্বাণীমূলক সিমুলেশনের সাথে ডেটার তুলনা করার সময় একটি মান হিসাবে ব্যবহৃত হয়। পরীক্ষার পরিসংখ্যানগুলি ক্লাসিকাল টেস্টিংয়ে পরীক্ষার পরিসংখ্যানগুলি খেলায় বায়েশিয়ান মডেল চেক করার ক্ষেত্রে ভূমিকা পালন করে। আমরা পরীক্ষার পরিসংখ্যানগুলির জন্য স্বরলিপি সংজ্ঞায়িত করি , যা পরীক্ষার পরিমাণ যা কেবলমাত্র ডেটা উপর নির্ভর করে; বায়েশীয় প্রসঙ্গে, আমরা তাদের উত্তরোত্তর বিতরণের অধীনে মডেল প্যারামিটারগুলির উপর নির্ভরতার অনুমতি দেওয়ার জন্য পরীক্ষার পরিসংখ্যানগুলিকে সাধারণীকরণ করতে পারি।টি ( y )T(y,θ)T(y)
, পরীক্ষার পরিসংখ্যান এর p- মান হল
যেখানে সম্ভাবনা নেওয়া হয় the বিতরণ ও সহ ।p C = Pr ( T ( y rep ) ≥ T ( y ) | θ ) y rep θT(y)
pC=Pr(T(yrep)≥T(y)|θ)
yrepθ
বায়সীয় দৃষ্টিকোণ থেকে, পূর্ববর্তী ভবিষ্যদ্বাণীমূলক বিতরণের ক্ষেত্রে ডেটা ফিট করার অভাবটি পরীক্ষার পরিমাণের লেজ-অঞ্চল সম্ভাবনা বা পি-মান দ্বারা পরিমাপ করা যেতে পারে এবং সিমুলেশন ব্যবহার করে গণনা করা যায় । বায়েশিয়ান পদ্ধতির ক্ষেত্রে পরীক্ষার পরিমাণগুলি অজানা প্যারামিটারগুলির পাশাপাশি ডেটা হিসাবে কাজ করতে পারে কারণ পরীক্ষার পরিমাণটি অজানা প্যারামিটারগুলির উত্তরোত্তর বিতরণ থেকে অঙ্কিত হওয়ার পরে মূল্যায়ন করা হয়।(θ,yrep)
এখন, আমরা বেইসিয়ান পি-মান (পিপিপি) এর সংজ্ঞা হিসাবে পরীক্ষার পরিমাণ হিসাবে পরিমাপকৃত ডেটা পর্যবেক্ষণ করা তথ্যের চেয়ে আরও চরম হতে পারে হিসাবে সংজ্ঞা দিতে পারি:
যেখানে সম্ভাবনাটি উত্তরোত্তর বিতরণ এবং এর উত্তরোত্তর পূর্বাভাসমূলক বিতরণের উপর নেওয়া হয় (যে , যৌথ বিতরণ, ):
যেখানে সূচক ফাংশন। অনুশীলনে যদিও আমরা সাধারণত সিমুলেশন ব্যবহার করে পূর্ববর্তী ভবিষ্যদ্বাণীমূলক বিতরণ গণনা করি।
pB=Pr(T(yrep,θ)≥T(y,θ)|y)
θyrepp(θ,yrep|y)pB=∬ΘIT(yrep,θ)≥T(y|θ)p(yrep|θ)p(θ|y)dyrepdθ,
I
আমরা ইতিমধ্যে থাকে, তাহলে বলুন, এর অবর বন্টন থেকে সিমিউলেশন , তাহলে আমরা শুধু একটা আহরণ করতে পারে প্রত্যেকের জন্য ভবিষ্যদ্বাণীপূর্ণ বন্টন থেকে কৃত্রিম ; আমরা এখন আছে যৌথ অবর বন্টন, থেকে স্বপক্ষে । পূর্ববর্তী ভবিষ্যদ্বাণীমূলক চেকটি অনুধাবন করা পরীক্ষার পরিমাণ এবং ভবিষ্যদ্বাণীমূলক পরীক্ষার পরিমাণ মধ্যে তুলনা । আনুমানিক পি-মানটি এই সিমুলেশনের মাত্রার অনুপাত যার জন্য পরীক্ষার পরিমাণটি তার উপলব্ধিমানের সমান বা তার চেয়ে বেশি হয়; যে, যার জন্যθ y rep θ L p ( y rep , θ | y ) T ( y , θ l ) T ( y rep l , θ l ) L T ( y rep l , θ l ) ≥ T ( y , θ l ) l = 1 , । । । , এলLθyrepθLp(yrep,θ|y)T(y,θl)T(yrepl,θl)L
T(yrepl,θl)≥T(y,θl)
জন্য ।
l=1,...,L
শাস্ত্রীয় পদ্ধতির বিপরীতে, বয়েসিয়ান মডেল চেকিংয়ে "উপদ্রব পরামিতিগুলি" পরিচালনা করতে বিশেষ পদ্ধতি প্রয়োজন হয় না। উত্তরীয় সিমুলেশনগুলি ব্যবহার করে, আমরা মডেলটির সমস্ত পরামিতিগুলির উপর স্পষ্টভাবে গড় করি।
অ্যান্ড্রু গেলম্যানের একটি অতিরিক্ত উত্স, পিপিপি-র এখানে একটি খুব সুন্দর কাগজ রয়েছে:
http://www.stat.columbia.edu/mangelman/research/unpublished/ppc_:30:302.pdf