পিএমসি 3-তে বায়েশিয়ান মডেল নির্বাচন


11

আমি আমার ডেটাতে বায়েশিয়ান মডেলগুলি চালানোর জন্য পাইএমসি 3 ব্যবহার করছি।

আমি বয়েসিয়ান মডেলিংয়ে নতুন তবে এই সাইট থেকে কিছু ব্লগ পোস্ট , উইকিপিডিয়া এবং কিউএ অনুসারে, কোন ডেটা আমার ডেটা উপস্থাপন করে তা সেরা চয়ন করতে সক্ষম হতে বায়েস ফ্যাক্টর এবং বিআইসির মানদণ্ড ব্যবহার করার জন্য এটি একটি বৈধ পন্থা বলে মনে হচ্ছে (যেটি উত্পন্ন করে আমার তথ্য).

বেয়েস ফ্যাক্টর গণনা করতে আমার যে মডেলগুলি তুলনা করতে চাই তার তুলনামূলক সম্ভাবনা আমার দরকার। এটি আমার কাছে কিছুটা বিভ্রান্ত হতে পারে তবে আমি মনে করি সম্ভাবনা পাওয়ার দুটি উপায় আছে (আমি ভুল হলে আমাকে সংশোধন করুন):

  • মডেল যখন সহজ হয় তখন বীজগণিতের উপায়: উইকিপিডিয়া উদাহরণটি বেইস ফ্যাক্টর পৃষ্ঠাটি দেখুন

  • সাংখ্যিক উপায়ে: এমসিএমসি অ্যালগরিদমের সাহায্যে পাইএমসি 3 এটি করে

আমি কীভাবে সম্ভাবনায় অ্যাক্সেস করতে পারি এবং তাই পাইএমসি 3-তে আমার মডেলগুলির তুলনা করতে পারি? আমি এমন model.logpপদ্ধতি খুঁজে পেয়েছি যা ডক অনুযায়ী "লগ সম্ভাবনার ঘনত্ব ফাংশন"। সম্ভাবনা পাওয়ার জন্য আমি কি এটি ব্যবহার করতে পারি?

বোনাস প্রশ্ন: যখন দুটি মডেল উভয় সম্ভাবনার মধ্যে অনুপাতের তুলনা করা হয়। আপনি যদি বেশ কয়েকটি মডেলের তুলনা করতে চান তবে কী হবে?

একটি কংক্রিট পিএমসি 3 উদাহরণ খুব সহায়ক হবে!

উত্তর:


15

আপনি মডেল.লগ () ব্যবহার করে কোনও মডেলের প্রকৃত সম্ভাবনা গণনা করতে পারেন। ইনপুট হিসাবে এটি একটি পয়েন্ট প্রয়োজন। উদাহরণস্বরূপ, আমি করতে পারি উদাহরণের ডিরেক্টরি থেকে সেরা মডেল:

np.exp(model.logp({'group1_mean': 0.1, 
                   'group2_mean': 0.2, 
                   'group1_std_interval': 1., 
                   'group2_std_interval': 1.2, 
                   'nu_minus_one_log': 1}))

নোট করুন যে এই মডেলটি ট্রান্সফর্মড ভেরিয়েবল ব্যবহার করছে, তাই আমাকে এগুলি সরবরাহ করতে হবে। তারপরে আপনি এটির এক্সপ () নিতে এবং এটি একটি সংখ্যাসূচক ইন্টিগ্রেটারের মধ্যে ব্যবহার করতে পারেন, উদাহরণস্বরূপ, যেমন স্কিপি.আইনটিগ্রেট দ্বারা সরবরাহ করা। সমস্যাটি হ'ল কেবল 5 টি পরামিতি সহ, এটি খুব ধীর হবে।

বেইস ফ্যাক্টরগুলি সাধারণত গণনা করা খুব কঠিন কারণ আপনাকে সম্পূর্ণ প্যারামিটার স্পেসের সাথে একীভূত করতে হবে। তার জন্য এমসিসিএম নমুনা ব্যবহার করার জন্য কিছু ধারণা রয়েছে। আরও তথ্যের জন্য এই পোস্টটি এবং বিশেষত মন্তব্য বিভাগটি দেখুন: https://radfordneal.wordpress.com/2008/08/17/the-harmonic-mean-of-t لہ- সম্ভাবনা- wrst-monte-carlo-method- ever / বিআইসির ক্ষেত্রে দুর্ভাগ্যক্রমে একই রকম।

আপনি যদি সত্যিই বায়েস ফ্যাক্টরটি গণনা করতে চান তবে আপনি সেভেজ ডিকি অনুপাত পরীক্ষাটিও দেখতে পারেন (উদাহরণস্বরূপ: http://drsmorey.org/bibtex/upload/Wagenmakers:etal:2010.pdf ) তবে এটির প্রয়োগ সীমাবদ্ধ।

আমি মনে করি আপনি মডেল তুলনা করার চেষ্টা করছেন যা অনেক মতামত এবং সমাধানগুলির সাথে একটি ক্ষেত্র (বিএফগুলির মতো কিছু বাস্তবায়ন করা শক্ত)। একটি পরিমাপ যা খুব সহজ গণনা হয় ডিভায়েন্স ইনফরমেশন মাপদণ্ড। এটির ডাউনসাইড রয়েছে, যদিও এর কিছুটির প্রতিকার দেওয়া যেতে পারে (দেখুন http://onlinelibrary.wiley.com/doi/10.1111/rssb.12062/abstract )। দুর্ভাগ্যক্রমে আমরা এখনও কোড পিমসি 3 পোর্ট করে নেই, তবে এটি বেশ সহজ হবে (পিমক 2 বাস্তবায়নের জন্য এখানে দেখুন: https://github.com/pymc-devs/pymc/blob/895c24f62b9f5d786bce7ac4fe88edb4ad220364/pymc/MCMC.py# এল 410 )।

ক্রুশকে কেবলমাত্র পুরো মডেলটি তৈরি করার পদ্ধতির পক্ষে এবং কোন প্যারামিটারগুলি গুরুত্বপূর্ণ তা আপনাকে জানাতে দিন। আপনি নিজেই মডেলটিতে পরিবর্তনশীল নির্বাচন তৈরি করতে পারেন (যেমন: http://arxiv.org/pdf/math/0505633.pdf দেখুন )।

পরিশেষে, আরও অনেক সম্পূর্ণ চিকিত্সার জন্য, এই সাম্প্রতিক ব্লগ পোস্টটি দেখুন: http://jakevdp.github.io/blog/2015/08/07/frequentism-and-bayesianism-5- মডেল- নির্বাচন /


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.