কীভাবে এবিসি এবং এমসিসিএম তাদের অ্যাপ্লিকেশনগুলির মধ্যে পৃথক হতে পারে?


15

আমার অনুধাবনের জন্য আনুমানিক বায়েশিয়ান কম্পিউটেশন (এবিসি) এবং মার্কভ চেইন মন্টি কার্লো (এমসিএমসি) এর খুব একই লক্ষ্য রয়েছে। নীচে আমি এই পদ্ধতিগুলি সম্পর্কে আমার বোঝার বর্ণনা দিচ্ছি এবং কীভাবে আমি বাস্তব জীবনের ডেটাতে তাদের প্রয়োগের পার্থক্য বুঝতে পারি।

আনুমানিক বায়েশিয়ান গণনা

এবিসি একটি প্যারামিটার স্যাম্পলিং এ গঠিত মাধ্যমে, একটি পূর্বে থেকে সংখ্যাসূচক সিমুলেশন কম্পিউট একটি পরিসংখ্যাত যা কিছু পর্যবেক্ষিত সাথে তুলনা করা হয় । প্রত্যাখ্যান অ্যালগোরিদমের ভিত্তিতে, হয় হয় ধরে রাখা বা প্রত্যাখ্যান করা। ধরে রাখা s এর তালিকা বিতরণ করেছে।x i x o b s x i x iθxixobsxixi

মার্কভ চেইন মন্টি কার্লো

এমসিএমসি প্যারামিটারের একটি পূর্বে বন্টন স্যাম্পলিং এ গঠিত । এটি প্রথম নমুনা গ্রহণ করে , গণনা এবং তারপরে লাফিয়ে (কিছু নিয়ম অনুসারে) একটি নতুন মান এ যায় যার জন্য আবার গণনা করা হয়। অনুপাত গণনা করা হয় এবং কিছু প্রান্তিক মানের উপর নির্ভর করে পরবর্তী জাম্প প্রথম বা দ্বিতীয় অবস্থান থেকে ঘটবে। মানগুলির অন্বেষণ এক এবং এক যায় এবং শেষ , বজায় রাখা মানগুলির উত্তরোত্তর বিতরণ হয়θ 1 পি ( x বি এস | θ 1 ) পি ( θ 1 ) θ 2 পি ( এক্স বি এস | θ 2 ) পি ( θ 2 ) পি ( x বি এস | θ 2 ) পি ( θ 2 )θθ1P(xobs|θ1)P(θ1)θ2P(xobs|θ2)P(θ2)পি(এক্সগুলি|θ2)পি(θ2)পি(এক্সগুলি|θ1)পি(θ1)θθপি(θ|এক্স) (এমন একটি কারণে যা এখনও আমার কাছে অজানা)।

আমি বুঝতে পারি যে আমার ব্যাখ্যাগুলি প্রতিটি পদগুলির অধীনে বিদ্যমান বিভিন্ন পদ্ধতির প্রতিনিধিত্ব করতে মিস করেছে (বিশেষত MCMC এর জন্য)।

এমবিএম বনাম এবিসি (উপকারিতা এবং কনস)

এবিসির সুবিধা রয়েছে যে বিশ্লেষণীভাবে সমাধান করার জন্য কারও প্রয়োজন নেই । যেমন এবিসি জটিল মডেলের পক্ষে সুবিধাজনক যেখানে এমসিএমসি এটি তৈরি করে না।পি(এক্স|θ)পি(θ)

এমসিএমসি পরিসংখ্যানগত পরীক্ষা করার সম্ভাবনা দেয় (সম্ভাবনা অনুপাতের পরীক্ষা, জি-পরীক্ষা, ...) তবে আমি মনে করি না এটি এটিবিসি-র সাথে সম্ভবপর।

আমি এখন পর্যন্ত ঠিক আছি?

প্রশ্ন

  • কীভাবে এবিসি এবং এমসিসিএম তাদের অ্যাপ্লিকেশনগুলির মধ্যে পৃথক হতে পারে? কীভাবে কেউ একটি বা অন্য পদ্ধতি ব্যবহার করার সিদ্ধান্ত নেয়?

1
"এমসিএমসি প্যারামিটারের পূর্ব বিতরণ নমুনা তৈরি করে θ" যদিও কেউ অবশ্যই এটি করতে পারে এটি বেশিরভাগ ক্ষেত্রেই প্রয়োজনীয় নয়, এমনকি এটি কাম্যও নয়। অনেক এমসিসিএম অ্যাপ্লিকেশনগুলির জন্য, আমরা প্রার্থী বিতরণ থেকে θ1 এর কাছাকাছি কেন্দ্রের (যেমন, একটি ছোট স্ট্যান্ডার্ড বিচ্যুতি সহ একটি গাউসিয়ান) নমুনা করি, তারপরে আপনি উল্লিখিত হিসাবে গ্রহণ / প্রত্যাখ্যান অনুপাতের গণনা করুন। এটি এবিসির বিপরীতে, যেখানে আমরা পূর্বের থেকে নমুনা নিই (এবং এটি সাধারণত সাধারণভাবে এবিসিতে পূর্ববর্তী তথ্য অন্তর্ভুক্ত করার একমাত্র উপায়)।
z_dood

উত্তর:


12

বিজারনের উত্তরের উপরে কিছু অতিরিক্ত মন্তব্য:

  1. এবিসি প্রথমে গণনার উদ্দেশ্যে নয়, বায়েশিয়ান অনুমানের প্রকৃতির ব্যাখ্যা হিসাবে রুবিন (1984) দ্বারা প্রবর্তিত হয়েছিল। এই গবেষণাপত্রে তিনি ব্যাখ্যা করেছিলেন যে কীভাবে নমুনা বিতরণ এবং পূর্ববর্তী বিতরণ উত্তরোত্তর বিতরণ উত্পাদন করতে ইন্টারঅ্যাক্ট করে।

  2. এবিসি প্রাথমিকভাবে গণনাগত কারণে শোষণ করা হয়। জনসংখ্যা জিনতত্ত্ববিদরা গাছ ভিত্তিক মডেলগুলির সাথে পদ্ধতিটি নিয়ে এসেছিলেন যেখানে পর্যবেক্ষণ হওয়া নমুনার সম্ভাবনা অক্ষুণ্ণ ছিল। এমসিএমসি (ডেটা অগমেন্টেশন) স্কিমগুলি যা এই জাতীয় সেটিংসে পাওয়া যায় তা অত্যন্ত অকার্যকর ছিল এবং তাই গুরুত্বের নমুনা ছিল, এমনকি একক মাত্রার একটি প্যারামিটারও ছিল ... এর মূল ভিত্তিতে, এবিসি এমসিএমসি বা পিএমসির মতো মন্টি কার্লো পদ্ধতির বিকল্প যখন এগুলি সমস্ত ব্যবহারিক উদ্দেশ্যে উপলব্ধ নয়। এগুলি উপলভ্য হলে এবিসি একটি প্রক্সি হিসাবে উপস্থিত হয় যা দ্রুত চালিত হলে এগুলি ক্রমাঙ্কণ করতে ব্যবহৃত হতে পারে।

  3. আরও আধুনিক দৃষ্টিকোণে আমি ব্যক্তিগতভাবে এবিসিকে একটি গণনামূলক কৌশল না করে আনুমানিক অনুমান পদ্ধতি হিসাবে বিবেচনা করি। একটি আনুমানিক মডেল তৈরির মাধ্যমে, অগত্যা একটি সুনির্দিষ্ট মডেলের উপর নির্ভর না করেই আগ্রহের প্যারামিটারের উপর দৃষ্টি আকর্ষণ করতে পারে। এই সেটিংয়ে কিছুটা বৈধতা যাচাই করা প্রয়োজন, এটি মডেল গড় বা নন-প্যারামেট্রিকগুলি করার চেয়ে কম বৈধ নয়। আসলে, এবিসিকে একটি বিশেষ ধরণের নন-প্যারাম্যাট্রিক বায়েশিয়ান পরিসংখ্যান হিসাবে দেখা যেতে পারে।

  4. এটি আরও দেখানো যেতে পারে যে (শোরগোল) এবিসি একটি নিখুঁতভাবে সংজ্ঞায়িত বায়েশিয়ান পদ্ধতির যদি কোনও ব্যক্তি শোরগোলের সাথে মূল মডেল এবং ডেটা প্রতিস্থাপন করে। এর ফলে এটি সমস্ত বায়েশিয়ান সূচনাগুলির জন্য মঞ্জুরি দেয় যা কেউ ভাবতে পারে। পরীক্ষা সহ। এবিসি এবং হাইপোথিসিস টেস্টিং সম্পর্কে বিতর্কের আমাদের ইনপুটটি হ'ল এবিসি অন্তর্নিহিত আনুমানিক মডেলটি তথ্য প্রদত্ত একটি অনুমানের প্রাসঙ্গিকতা মূল্যায়নের জন্য যথেষ্ট সজ্জিত হিসাবে শেষ হতে পারে , তবে অগত্যা নয় , যা জনসংখ্যার মধ্যে বেশিরভাগ অ্যাপসিসির প্রয়োগ থেকে জেনেটিক্স মডেল পছন্দ সঙ্গে সম্পর্কিত।

  5. আরও সাম্প্রতিক দৃষ্টিকোণে, আমরা এবিসিকে পরোক্ষ অনুক্রমের বায়েশিয়ান সংস্করণ হিসাবে দেখতে পাই যেখানে কোনও পরিসংখ্যানের মডেলের পরামিতি পূর্ব নির্ধারিত পরিসংখ্যানের মুহুর্তগুলির সাথে সম্পর্কিত। এই পরিসংখ্যানগুলি সনাক্ত করতে যদি এই পরিসংখ্যানটি যথেষ্ট (বা স্থানীয় ভাষায় যথেষ্ট), তবে এবিসি পর্যবেক্ষণের সংখ্যার সাথে পরামিতিগুলির সত্যিকার মানে রূপান্তর করতে দেখানো যেতে পারে ।


2
আমি এই উত্তরটি যাচাই করেছিলাম তবে প্রথমে @ বিজন এর উত্তর (+1) এবং তারপরে শি'র উত্তরটি পড়ার পরামর্শ দিতে চাই।
রেমি.বি

12

পি(এক্স|θ)θসিমুলেটেড ডেটা প্রায়শই (আনুমানিক) পর্যবেক্ষণ করা ডেটার সাথে মেলে (প্রস্তাবিত মানগুলির সাথে যেমন পূর্বের থেকে এলোমেলোভাবে আঁকা)। সাধারণ ক্ষেত্রে যেমন খুব বেশি না স্যাম্পল আকারের সাথে একক দ্বিপদী র‌্যান্ডম ভেরিয়েবলের জন্য আপনি এমনকি সঠিক ম্যাচের প্রয়োজনও বোধ করতে পারেন এবং এই ক্ষেত্রে, সত্যিকার অর্থে এমন কিছু নেই যা আপনি এই উত্তরোত্তর নমুনাগুলির সাথে করতে পারেন নি যা আপনিও করতে পারেন নি could মানক MCMC নমুনা। অবিচ্ছিন্ন (এমনকি মাল্টিভারিয়েটযুক্ত বিচ্ছিন্ন ফলাফলের জন্য) এবং আরও সঠিক জটিলতার জন্য যথাযথ ম্যাচের জন্য প্রয়োজনীয় ফলস্বরূপ আরও জটিল পরিস্থিতির জন্য এটি আর সম্ভব হয় না।

প্রকৃতপক্ষে এবিসির এমসিসিএম সংস্করণ রয়েছে, যা এই সমস্যাটিকে সম্বোধন করে যে আপনি যদি পূর্ববর্তী থেকে নিকটবর্তী সাদৃশ্যযুক্ত না হন (উদাহরণস্বরূপ কারণ পূর্বটি অত্যন্ত অপ্রয়োজনীয়) পূর্ববর্তী থেকে অঙ্কন করে স্যাম্পলিং চূড়ান্তভাবে অক্ষম, কারণ আপনি খুব কমই করবেন পর্যবেক্ষণ এবং সিমুলেটেড ডেটার মধ্যে একটি ঘনিষ্ঠ মিল পান।

পি(এক্স|θ)পি(এক্স|θ)পি(এক্স|θ)বিশ্লেষণাত্মকভাবে উপলব্ধ নয়। অবশ্যই এ জাতীয় ক্ষেত্রে আরও কিছু সম্ভাব্য বিকল্প থাকতে পারে (যেমন আইএনএলএ, সম্ভাবনার চতুষ্পদ প্রান্তিককরণ ইত্যাদি) যা বিশেষ সমস্যার জন্য আরও দক্ষ / সফল হতে পারে। একরকমভাবে, আপনি এবিসি থেকে উত্তরোত্তর নমুনাগুলির সাথে যা করতে পারেন তার কোনও সীমাবদ্ধতা কেবলমাত্র আসল এবং সিমুলেটেড ডেটার মধ্যে অপ্রিমিক্স ম্যাচের প্রয়োজন থেকে আসে (যদি আপনাকে কোনও সঠিক ম্যাচের প্রয়োজন হতে পারে তবে কোনও সমস্যা হবে না)। বেশ কয়েকটি ভাল প্রারম্ভিক কাগজ রয়েছে যেমন মেরিন এট আল দ্বারা এই কাগজটি (2012) । কমপক্ষে একজন সহ-লেখক (@ শিয়ান) এখানে একজন সক্রিয় অবদানকারী এবং আমি তার চিন্তাভাবনাগুলি এখানেও পছন্দ করতে পারি - আমি বিশ্বাস করি তিনি পরীক্ষার বিষয়ে আরও অনেক কিছু বলতে সক্ষম হবেন।


আমি আশা করি আমি এখনই লিঙ্কটি ঠিক করতে সক্ষম হয়েছি (এটি এখন আমার পক্ষে কাজ করে)।
Björn

1
(+1) খুব ভাল পয়েন্ট!
শি'আন

1
"যখন পি (x | θ) বিশ্লেষণযোগ্যভাবে পাওয়া যায় তখন আমি ধরে নিয়েছি এটি প্রায় সর্বদা একটি স্ট্যান্ডার্ড এমসিসিএম ব্যবহার করা পছন্দসই হবে।" কাছাকাছি, কিন্তু সবসময় না। কল্পনা করুন যে কোনওটির অনেকগুলি পরামিতিগুলির সাথে একত্রে একটি বৃহত নমুনা আকার (10 ^ 9) রয়েছে। প্রতিটি পরামিতিগুলির সেটগুলির সম্ভাবনাগুলি পুনরায় সংশোধন করা খুব ব্যয়বহুল হয়ে যায়। এবিসি সহ, এই গতি বাড়ানোর জন্য অনেকগুলি কৌশল ব্যবহার করা যেতে পারে। এমসিএমসির সাথে, তেমন কিছু হয় না।
z_dood

2
@ জ_ডুড: যখন সম্ভাবনাটি সত্যিকারভাবে গণনা করার জন্য অনেকগুলি পর্যবেক্ষণ থাকে, যেমন, যখন তাদের বিভিন্ন কম্পিউটারে সংরক্ষণ করার প্রয়োজন হয় তখন এটি যুক্তিযুক্ত হয়ে ওঠে যে সম্ভাবনা ফাংশন বিশ্লেষণাত্মকভাবে উপলভ্য নয়।
শি'আন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.