MCMC এর জন্য পারফরম্যান্স মানদণ্ড


14

এমসিএমসি পদ্ধতিগুলির কি বড় আকারের অধ্যয়ন হয়েছে যা পরীক্ষার ঘনত্বের স্যুটটিতে বিভিন্ন বিভিন্ন অ্যালগরিদমের পারফরম্যান্সের তুলনা করে? আমি রিওস এবং সহিনিডিসের কাগজ (২০১৩) এর সমতুল্য কিছু নিয়ে ভাবছি , যা পরীক্ষার বিভিন্ন শ্রেণির বহু সংখ্যক ডেরাইভেটিভ-মুক্ত ব্ল্যাক-বাক্স অপটিমাইজারের একটি সম্পূর্ণ তুলনা।

এমসিএমসির জন্য, পারফরম্যান্সটি অনুমান করা যায়, যেমন, ঘনত্ব মূল্যায়নের জন্য কার্যকর সংখ্যার নমুনা (ইএসএস), বা অন্য কোনও উপযুক্ত মেট্রিক।

কয়েকটি মন্তব্য:

  • আমি প্রশংসা করি যে পারফরম্যান্স দৃ p ়ভাবে লক্ষ্য পিডিএফের বিবরণের উপর নির্ভর করবে , তবে একটি অনুরূপ (সম্ভবত অভিন্ন নয়) তর্কটি অপ্টিমাইজেশনের জন্য ধারণ করে এবং তবুও বেঞ্চমার্ক ফাংশন, স্যুট, প্রতিযোগিতা, কাগজপত্র ইত্যাদির আধিক্য রয়েছে যা বেঞ্চমার্কিং অপ্টিমাইজেশানের সাথে সম্পর্কিত আলগোরিদিম।

  • এছাড়াও, এটি সত্য যে MCMC অপেক্ষাকৃত তুলনায় অপেক্ষাকৃত তুলনায় অনেক বেশি যত্ন এবং টিউনিং প্রয়োজন ব্যবহারকারী থেকে পৃথক। তবুও, এখন বেশ কয়েকটি এমসিসিসি পদ্ধতি রয়েছে যার জন্য খুব কম বা কোনও সুরের প্রয়োজন নেই: যে পদ্ধতিগুলি বার্ন-ইন পর্বের সাথে স্যাম্পলিংয়ের সময় অভিযোজিত হয় বা মাল্টি- স্টেটকে (যেমন এনসেম্বলও বলা হয় ) পদ্ধতিগুলি (যেমন এমসি ) একাধিক ইন্টারেক্টিভ চেইনগুলি বিকশিত করে এবং ব্যবহার করে স্যাম্পলিং গাইড করার জন্য অন্যান্য চেইন থেকে তথ্য।

  • আমি বিশেষভাবে স্ট্যান্ডার্ড এবং মাল্টি-স্টেটের (ওরফে এনম্বেল) পদ্ধতির মধ্যে তুলনা করতে আগ্রহী। বহু-রাষ্ট্রের সংজ্ঞার জন্য, ম্যাকের বইয়ের 30.6 ধারা দেখুন :

একটি বহু-রাষ্ট্র পদ্ধতিতে, একাধিক প্যারামিটার ভেক্টরগুলি maintained রক্ষণাবেক্ষণ করা হয়; তারা পৃথকভাবে মেট্রোপলিস এবং গিবস হিসাবে চালিত অধীনে বিবর্তিত; ভেক্টরদের মধ্যেও ইন্টারঅ্যাকশন রয়েছে।এক্স

  • এই প্রশ্নের উত্স এখানে থেকে ।

হালনাগাদ

  • মাল্টি-স্টেটের ওরফে এনসেম্বল পদ্ধতিগুলি আকর্ষণীয়ভাবে গ্রহণের জন্য, গেলম্যানের ব্লগে বব কার্পেন্টারের এই ব্লগ পোস্টটি এবং এই সিভি পোস্টকে উল্লেখ করে আমার মন্তব্য দেখুন

উত্তর:


5

কিছু অনলাইন অনুসন্ধানের পরে, আমি এই ধারণাটি নিয়ে এসেছি যে প্রতিষ্ঠিত এমসিএমসি পদ্ধতির একটি বিস্তৃত মানদণ্ড, যেটি অপ্টিমাইজেশন সাহিত্যে খুঁজে পেতে পারে তার সাথে সাদৃশ্যপূর্ণ নয়। (আমি এখানে ভুল হতে পেরে খুশি হব।)

কোনও প্রয়োগকৃত ডোমেনের মধ্যে নির্দিষ্ট সমস্যা সম্পর্কিত কয়েকটি এমসিসিএম পদ্ধতির তুলনা খুঁজে পাওয়া সহজ। এটি ঠিক আছে যদি আমরা এই তথ্যটি সরবরাহ করতে পারি - তবে, এই জাতীয় মানদণ্ডের মান প্রায়শই অপর্যাপ্ত থাকে (যেমন, প্রতিবেদিত মেট্রিকের বা অভাবিত নকশার পছন্দগুলির অভাবে)।

নিম্নলিখিতগুলিতে আমি যা যা বিশ্বাস করি তা মূল্যবান অবদান হিসাবে খুঁজে পেয়েছি তা পোস্ট করব:

  • নিশিহারা, মারে এবং অ্যাডামস, জেনারালাইজড উপবৃত্তাকার স্লাইস স্যাম্পলিং , জেএমএলআর (2014) এর সাথে সমান্তরাল এমসিএমসি । লেখকরা একটি উপন্যাস মাল্টি-স্টেট পদ্ধতি, জিএসইএসের প্রস্তাব রাখে এবং test টি পরীক্ষার কার্যক্রমে other টি একক-রাষ্ট্রীয় এবং বহু-রাষ্ট্রীয় পদ্ধতির সাথে একটি তুলনা সম্পাদন করে। তারা প্রতি সেকেন্ডে এবং প্রতি ফাংশন মূল্যায়নের জন্য ESS (কার্যকর নমুনা আকার) হিসাবে কর্মক্ষমতা মূল্যায়ন করে evalu

  • স্যাম্পলারকম্পার হ'ল এমসিএমসি অ্যালগরিদমগুলির বেঞ্চমার্কিংয়ের লক্ষ্য সহ একটি আর প্যাকেজ - আমি আমার আসল প্রশ্নটি সম্পর্কে ঠিক কী জিজ্ঞাসা করছিলাম। দুর্ভাগ্যক্রমে, প্যাকেজটিতে কয়েকটি পরীক্ষামূলক ফাংশন রয়েছে; সাথে থাকা কাগজগুলি কোনও আসল মানদণ্ডের প্রতিবেদন দেয় না (কেবল একটি ছোট উদাহরণ); এবং মনে হয় সেখানে কোনও অনুসরণ করা হয়নি।

থম্পসন, মেডেলিন বি। "স্যাম্পলারকম্পেরের পরিচিতি।" পরিসংখ্যান সফটওয়্যার জার্নাল 43.12 (2011): 1-10 ( লিঙ্ক )।

  • মাল্টি-স্টেটের ওরফে এনসেম্বল পদ্ধতিগুলি আকর্ষণীয়ভাবে গ্রহণের জন্য, গেলম্যানের ব্লগে বব কার্পেন্টারের এই ব্লগ পোস্টটি এবং এই সিভি পোস্টকে উল্লেখ করে আমার মন্তব্য দেখুন

আপনার দ্বিতীয় লিঙ্কটি মারা গেছে - আপনি কি এটি একটি কর্মস্থলে পরিবর্তন করতে পারেন?
টিম

আপনি এই ডিসেম্বর 2017 এর কাগজটি একবার দেখতে চান: রায়ান টার্নার এবং ব্র্যাডি নিল, আপনার নমুনা সত্যিই কতটা ভাল কাজ করে? মনে হচ্ছে এমসিএমসি অ্যালগরিদমের জন্য একটি ভাল মানদণ্ড নিয়ে আসার ঠিক এই সমস্যার একটি ঝরঝরে সমাধান সরবরাহ করেছে।
কার্ল

2

আমি আপনার মূল্যায়নের সাথে একমত হব যে এমসিএমসি পদ্ধতিগুলির জন্য কোনও বিস্তৃত মানদণ্ড প্রতিষ্ঠিত হয়নি। এটি কারণ প্রতিটি এমসিসিএম স্যাম্পলারের পক্ষে ভাল এবং কনস রয়েছে এবং এটি অত্যন্ত সমস্যা নির্দিষ্ট।

একটি সাধারণ বায়েশিয়ান মডেলিং সেটিংয়ে, ডেটা আলাদা হওয়ার সময় আপনি বিভিন্ন মিক্সিং রেটের সাথে একই নমুনা চালাতে পারেন। আমি এই পর্যায়ে যাব যে ভবিষ্যতে যদি বিভিন্ন এমসিসিএম স্যাম্পলারের একটি বিস্তৃত মানদণ্ড অধ্যয়ন ঘটে, তবে আমি দেখানো উদাহরণগুলির বাইরে ফলাফলগুলি কার্যকর হওয়ার বিষয়ে বিশ্বাস করব না।

স্যাম্পলিংয়ের গুণমান নির্ধারণের জন্য ESS এর ব্যবহার সম্পর্কে, এটি উল্লেখযোগ্য যে ESS নমুনা থেকে অনুমানযোগ্য পরিমাণের উপর নির্ভর করে। আপনি যদি নমুনার মাধ্যমটি খুঁজতে চান তবে প্রাপ্ত ESS আপনি 25 তম কোয়ান্টাইল অনুমান করতে চাইলে আলাদা হবে। এই কথাটি বলার পরেও, যদি আগ্রহের পরিমাণ নির্দিষ্ট করা হয় তবে ইএসএস হ'ল স্যাম্পেলারদের তুলনা করার একটি যুক্তিসঙ্গত উপায়। সম্ভবত আরও ভাল ধারণাটি প্রতি ইউনিট সময় ESS।

ইএসএস-এর একটি ত্রুটি হ'ল মাল্টিভারিয়েট অনুমানের সমস্যার জন্য, এসএসএস অনুমানের প্রক্রিয়াতে সমস্ত ক্রস-পারস্পরিক সম্পর্ককে উপেক্ষা করে প্রতিটি উপাদানগুলির জন্য পৃথকভাবে কার্যকর নমুনার আকার দেয়। ইন এই সম্প্রতি কাগজ, একটি বহুচলকীয় কানা অনুলিপি করুন প্রস্তাব করা হয়েছে, এবং বাস্তবায়িত Rপ্যাকেজ mcmcseফাংশন মাধ্যমে multiESS। এই পদ্ধতিটি কীভাবে codaপ্যাকেজের ইএসএসের সাথে তুলনা করে তা স্পষ্ট নয় , তবে একেবারে শুরুতে অবিবাহিত ইএসএস পদ্ধতিগুলির চেয়ে আরও যুক্তিসঙ্গত বলে মনে হয়।


2
(+1) উত্তরের জন্য ধন্যবাদ। আমি আপনার কয়েকটি বিষয়গুলির সাথে একমত, তবে আমি এখনও মনে করি যে এই জাতীয় একটি মানদণ্ড থেকে কিছু তথ্য নেওয়া যেতে পারে। ভবিষ্যতে বাছাই করা সিদ্ধান্তগুলি তাদের উপর নির্ভর করে কীভাবে কেউ এই জাতীয় মানদণ্ডের ফলাফলগুলি ব্যবহার করে - তবে কিছু প্রমাণ প্রমাণ ছাড়াই ভাল। ESS সম্পর্কে ভাল পয়েন্ট। মাল্টি-স্টেট দ্বারা আমি মাল্টি-স্টেট বলতে চাই (বা মাল্টি-চেইন, আপনি যদি পছন্দ করেন), কেবল মাল্টিভারিয়েট নয় - আমার আসল প্রশ্নে ম্যাকের বইয়ের উদ্ধৃতি দেখুন।
lacerbi

2
সাধারণভাবে, কিছু সংখ্যক নমুনা মাল্টিমোডাল বিতরণ (এমএইচ, গিবস) এর জন্য খারাপ সঞ্চালনের জন্য পরিচিত এবং কিছু অব্যবহৃত সাপোর্ট (হ্যামিলটোনিয়ান এমসি) এর জন্য খারাপ। অন্যদিকে, উচ্চ মাত্রিক সমস্যার জন্য হ্যামিলটোনিয়ান এমসি ভালভাবে কাজ করে এবং মাল্টিমোডাল বিতরণের জন্য সিমুলেটেড টেম্পারিং ইত্যাদি ভাল। যে কোনও বেঞ্চমার্কিংয়ের জন্য, ফলাফলগুলি সাধারণভাবে ব্যাখ্যাযোগ্য হওয়ার জন্য লক্ষ্য বিস্তারের বিভিন্ন বিস্তৃত শ্রেণীর (উপ-এক্সফোনেনশিয়াল, লগ অবতল ইত্যাদি) সংজ্ঞায়নের প্রয়োজন হতে পারে।
গ্রিনপার্কার

1
ভাল, হ্যাঁ, এটিই এক শ্রেণীর অ্যালগরিদমের জন্য একটি মানদণ্ড তৈরির পুরো বিষয়। উদাহরণস্বরূপ দেখুন এই বিশ্বব্যাপী অপ্টিমাইজেশান জন্য। স্পষ্টতই এমসিমিসির একটি মানদণ্ড অপ্টিমাইজেশনের জন্য বিদ্যমানগুলিকে কেবল bণ নিতে পারে না; লক্ষ্য উল্লেখের ঘনত্বগুলির বৈশিষ্ট্যগুলিতে মনোযোগ দেওয়ার প্রয়োজন রয়েছে যা নির্দিষ্ট, সাধারণ এবং এমসিএমসি সমস্যার প্রতি আগ্রহী, যেমনটি আপনি উল্লেখ করেছেন।
lacerbi
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.