ফিট টেস্টের সাধারণ ধার্মিকতার সমতুল্য বায়েশিয়ান কী?


25

আমার দুটি ডেটা সেট রয়েছে, একটি শারীরিক পর্যবেক্ষণের একটি সেট থেকে (তাপমাত্রা), এবং একটিতে সংখ্যাসূচক মডেলের একটি উপহার se আমি একটি নিখুঁত-মডেল বিশ্লেষণ করছি, ধরে নিচ্ছি যে মডেলটি সাজানো একটি সত্য, স্বতন্ত্র নমুনার প্রতিনিধিত্ব করে এবং সেই বিতরণ থেকে পর্যবেক্ষণগুলি টানা হয়েছে কিনা তা পরীক্ষা করে দেখছি। আমি যে পরিসংখ্যান গণনা করেছি তা সাধারণীকরণ করা হয় এবং তাত্ত্বিকভাবে এটি একটি সাধারণ বন্টন হওয়া উচিত। অবশ্যই এটি নিখুঁত নয়, তাই আমি ফিটের সচ্ছলতার জন্য পরীক্ষা করতে চাই।

ঘনঘনবাদী যুক্তি ব্যবহার করে, আমি ক্র্যামার-ভন মাইসেস স্ট্যাটিস্টিক (বা কোলমোগোরভ-স্মারনভ, ইত্যাদি), বা অনুরূপ গণনা করতে পারি এবং পি-মান পেতে একটি সারণীতে মানটি খুঁজে পেতে, আমাকে মানটি কতটা সম্ভাবনা তা নির্ধারণ করতে সহায়তা করতে দেখুন পর্যবেক্ষণগুলি মডেল হিসাবে একই।

বায়েশিয়ান এই প্রক্রিয়া সমতুল্য কি হবে? এটি হ'ল আমি এই বিশ্বাসের শক্তিটি কীভাবে প্রমাণ করব যে এই দুটি বিতরণ (আমার গণনা করা পরিসংখ্যান এবং আদর্শ সাধারণ) আলাদা?


ভালো কিছু এই বিল মাপসই পারে।
সায়ান

উত্তর:


23

আমি এই প্রশ্নের উত্তরের (বিশেষভাবে chapter অধ্যায়ে) উত্তর দেওয়ার জন্য এবং আমি যা বলার করছি তার সমস্ত উত্স হিসাবে বায়েশিয়ান ডেটা অ্যানালাইসিস বইটি পরামর্শ দেব। তবে বায়েশীয়রা যে সমস্যাটিকে আক্রমণ করে সেগুলির মধ্যে একটি হল পোস্টেরিয়ের প্রেডিকটিভ পি-ভ্যালু (পিপিপি) ব্যবহার করে। পিপিপিরা কীভাবে এই সমস্যাটি সমাধান করবে এদিকে ঝাঁপ দেওয়ার আগে প্রথমে আমাকে নীচের স্বরলিপিটি সংজ্ঞায়িত করতে দিন:

যাক পর্যবেক্ষিত তথ্য হতে হবে এবং প্যারামিটার ভেক্টর হও। আমরা সংজ্ঞায়িত যেমন প্রতিলিপি ডেটা আছে যা পারতেন লক্ষ্য করা, বা, predictively ভাবতে, ডাটা হিসাবে আমরা চাই কাল দেখা হবে যদি পরীক্ষা করে উত্পাদিত আজ একই মডেল এবং একই সঙ্গে প্রতিলিপি ছিল মান যা পর্যবেক্ষণ করা ডেটা তৈরি করে।θ Y প্রতিনিধির Y θyθyrepyθ

দ্রষ্টব্য, আমরা উত্তরোত্তর ভবিষ্যদ্বাণীমূলক বিতরণ সাথে জ্ঞানের বর্তমান অবস্থার of এর বিতরণকে সংজ্ঞায়িত করব will পি ( Y প্রতিনিধির | Y ) = Θ পি ( Y প্রতিনিধির | θ ) পি ( θ | Y ) θyrep

p(yrep|y)=Θp(yrep|θ)p(θ|y)dθ

এখন, আমরা পরীক্ষার পরিমাণ , আমরা যে ডেটাগুলি পরীক্ষা করতে চাই তার দিকগুলি নির্ধারণ করে মডেল এবং ডেটাগুলির মধ্যে পার্থক্যটি পরিমাপ করতে পারি । একটি পরীক্ষার পরিমাণ বা তাত্পর্যপূর্ণ পরিমাপ , , প্যারামিটার এবং ডেটার একটি স্কেলার সংক্ষিপ্তসার যা ভবিষ্যদ্বাণীমূলক সিমুলেশনের সাথে ডেটার তুলনা করার সময় একটি মান হিসাবে ব্যবহৃত হয়। পরীক্ষার পরিসংখ্যানগুলি ক্লাসিকাল টেস্টিংয়ে পরীক্ষার পরিসংখ্যানগুলি খেলায় বায়েশিয়ান মডেল চেক করার ক্ষেত্রে ভূমিকা পালন করে। আমরা পরীক্ষার পরিসংখ্যানগুলির জন্য স্বরলিপি সংজ্ঞায়িত করি , যা পরীক্ষার পরিমাণ যা কেবলমাত্র ডেটা উপর নির্ভর করে; বায়েশীয় প্রসঙ্গে, আমরা তাদের উত্তরোত্তর বিতরণের অধীনে মডেল প্যারামিটারগুলির উপর নির্ভরতার অনুমতি দেওয়ার জন্য পরীক্ষার পরিসংখ্যানগুলিকে সাধারণীকরণ করতে পারি।টি ( y )T(y,θ)T(y)

, পরীক্ষার পরিসংখ্যান এর p- মান হল যেখানে সম্ভাবনা নেওয়া হয় the বিতরণ ও সহ ।p C = Pr ( T ( y rep ) T ( y ) | θ ) y rep θT(y)

pC=Pr(T(yrep)T(y)|θ)
yrepθ

বায়সীয় দৃষ্টিকোণ থেকে, পূর্ববর্তী ভবিষ্যদ্বাণীমূলক বিতরণের ক্ষেত্রে ডেটা ফিট করার অভাবটি পরীক্ষার পরিমাণের লেজ-অঞ্চল সম্ভাবনা বা পি-মান দ্বারা পরিমাপ করা যেতে পারে এবং সিমুলেশন ব্যবহার করে গণনা করা যায় । বায়েশিয়ান পদ্ধতির ক্ষেত্রে পরীক্ষার পরিমাণগুলি অজানা প্যারামিটারগুলির পাশাপাশি ডেটা হিসাবে কাজ করতে পারে কারণ পরীক্ষার পরিমাণটি অজানা প্যারামিটারগুলির উত্তরোত্তর বিতরণ থেকে অঙ্কিত হওয়ার পরে মূল্যায়ন করা হয়।(θ,yrep)

এখন, আমরা বেইসিয়ান পি-মান (পিপিপি) এর সংজ্ঞা হিসাবে পরীক্ষার পরিমাণ হিসাবে পরিমাপকৃত ডেটা পর্যবেক্ষণ করা তথ্যের চেয়ে আরও চরম হতে পারে হিসাবে সংজ্ঞা দিতে পারি: যেখানে সম্ভাবনাটি উত্তরোত্তর বিতরণ এবং এর উত্তরোত্তর পূর্বাভাসমূলক বিতরণের উপর নেওয়া হয় (যে , যৌথ বিতরণ, ): যেখানে সূচক ফাংশন। অনুশীলনে যদিও আমরা সাধারণত সিমুলেশন ব্যবহার করে পূর্ববর্তী ভবিষ্যদ্বাণীমূলক বিতরণ গণনা করি।

pB=Pr(T(yrep,θ)T(y,θ)|y)
θyrepp(θ,yrep|y)
pB=ΘIT(yrep,θ)T(y|θ)p(yrep|θ)p(θ|y)dyrepdθ,
I

আমরা ইতিমধ্যে থাকে, তাহলে বলুন, এর অবর বন্টন থেকে সিমিউলেশন , তাহলে আমরা শুধু একটা আহরণ করতে পারে প্রত্যেকের জন্য ভবিষ্যদ্বাণীপূর্ণ বন্টন থেকে কৃত্রিম ; আমরা এখন আছে যৌথ অবর বন্টন, থেকে স্বপক্ষে । পূর্ববর্তী ভবিষ্যদ্বাণীমূলক চেকটি অনুধাবন করা পরীক্ষার পরিমাণ এবং ভবিষ্যদ্বাণীমূলক পরীক্ষার পরিমাণ মধ্যে তুলনা । আনুমানিক পি-মানটি এই সিমুলেশনের মাত্রার অনুপাত যার জন্য পরীক্ষার পরিমাণটি তার উপলব্ধিমানের সমান বা তার চেয়ে বেশি হয়; যে, যার জন্যθ y rep θ L p ( y rep , θ | y ) T ( y , θ l ) T ( y rep l , θ l ) L T ( y rep l , θ l ) T ( y , θ l ) l = 1 , , এলLθyrepθLp(yrep,θ|y)T(y,θl)T(yrepl,θl)L

T(yrepl,θl)T(y,θl)
জন্য । l=1,...,L

শাস্ত্রীয় পদ্ধতির বিপরীতে, বয়েসিয়ান মডেল চেকিংয়ে "উপদ্রব পরামিতিগুলি" পরিচালনা করতে বিশেষ পদ্ধতি প্রয়োজন হয় না। উত্তরীয় সিমুলেশনগুলি ব্যবহার করে, আমরা মডেলটির সমস্ত পরামিতিগুলির উপর স্পষ্টভাবে গড় করি।

অ্যান্ড্রু গেলম্যানের একটি অতিরিক্ত উত্স, পিপিপি-র এখানে একটি খুব সুন্দর কাগজ রয়েছে: http://www.stat.columbia.edu/mangelman/research/unpublished/ppc_:30:302.pdf


3

একটি অপেক্ষাকৃত সহজ সম্ভাবনা: ফিটের ধার্মিকতার মসৃণ পরীক্ষাগুলি উদাহরণস্বরূপ [1] - যা অরথোগোনাল বহুপদী (ওজন-ক্রিয়া হিসাবে নাল ঘনত্বের সাথে সম্মত) দ্বারা নির্মিত নাল থেকে মসৃণ বিচ্যুতির ক্ষেত্রে বিকল্পকে ফ্রেম করে তুলনামূলকভাবে সোজা হবে একটি বয়েসিয়ান কাঠামোতে নিয়ে যান, যেহেতু বহুবচনগুলির সহগগুলি নলের একটি নমনীয়-তবে-প্যারামেট্রিক বর্ধন করে form

[১]: রায়নার, জেসিডাব্লু এবং ডিজে বেস্ট (১৯৯০),
"ফিটের উপকারের স্মুথ টেস্ট: একটি ওভারভিউ,"
আন্তর্জাতিক পরিসংখ্যান পর্যালোচনা , 58 : 1 (এপ্রিল), পৃষ্ঠা 9-17

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.