কেন হ্যামিলটোনীয় গতিবিদ্যা এমসিএমসিতে কিছু ক্ষেত্রে র্যান্ডম ওয়াক প্রস্তাবের চেয়ে ভাল?


10

হ্যামিলটোনীয় গতিশীলতা কিছু ক্ষেত্রে মেট্রোপলিস অ্যালগরিদমের এলোমেলো হাঁটার চেয়ে সর্বদা পারফর্ম করে। কেউ কি খুব বেশি গণিত ছাড়াই সাধারণ শব্দ দিয়ে কারণ ব্যাখ্যা করতে পারেন?


1
@ জুহোকোকালা, সাধারণত উচ্চ মাত্রার সমস্যায়, এলোমেলো হাঁটার প্রস্তাবটির ভাল পারফরম্যান্স হয় না, তবে হ্যামিটোনিয়াল গতিশীলতার রয়েছে।
ফ্লাই_ব্যাক

@ জুহোকোকালা এইচএমসি সম্পর্কে আমার বোঝাটি হ'ল, আমরা হ্যামিলটোনীয় গতিশীল ব্যবস্থায় স্বল্প শক্তির এইচ সহ নমুনাগুলি পাই, তারপরে আমি এই কুইজটি নিয়ে এসেছি যে হ্যামিলটোনীয় গতিবিদ্যা দ্বারা প্রস্তাবিত নমুনা সর্বদা গ্রহণযোগ্য হতে পারে কেন।
ফ্লাই_ব্যাক

3
নভেম্বরের প্রথম দিকে, এন্ডএম গ্যালম্যান ম্যান্ডেল বেতানকোর্টের একটি "সুন্দর নতুন কাগজ" সম্পর্কে একটি নোট পোস্ট করেছিলেন কেন এইচএমসি এলোমেলো এমসিএমসির চেয়ে ভাল। গেলম্যানের মূল বক্তব্যটি ছিল এইচএমসি কমপক্ষে প্রতিযোগিতামূলক পদ্ধতির চেয়ে দ্বিগুণ দ্রুত। andrewgelman.com/2016/11/03/…
মাইক হান্টার

2
এই প্রশ্নটি কিছুটা অপ্রকাশিত, তবে নীচে পোস্ট করা উত্তরগুলি দেওয়া, আমি মনে করি না যে এটি উত্তর দেওয়া খুব অস্পষ্ট। আমি খোলা ছেড়ে ভোট দিচ্ছি।
গুং - মনিকা পুনরায়

উত্তর:


14

প্রথমত, আমাকে জানিয়ে দিন যে আমি বিশ্বাস করি না যে এইচএমসি (হ্যামিলটোনিয়ান মন্টি কার্লো) এর গ্রহণযোগ্যতার হার মহানগরীর অ্যালগরিদমের চেয়ে সর্বদা বেশি। @ জুহোকোক্কালার দ্বারা উল্লিখিত হিসাবে, মহানগরীর গ্রহণযোগ্যতার হারটি সুসংগত এবং উচ্চ গ্রহণযোগ্যতার হারের অর্থ এই নয় যে আপনার অ্যালগোরিদম উত্তরোত্তর বিতরণ অন্বেষণের জন্য একটি ভাল কাজ করছেন। আপনি যদি কেবলমাত্র একটি অতি সংকীর্ণ প্রস্তাব বিতরণ ব্যবহার করেন (উদাহরণস্বরূপ খুব ছোট ), আপনি অত্যন্ত উচ্চ গ্রহণযোগ্যতার হার পাবেন, তবে কেবলমাত্র আপনি পুরো উত্তরোত্তর বিতরণটি অন্বেষণ না করে মূলত একই জায়গায় সর্বদা অবস্থান করছেন বলে কেবল।T(q|q)=N(q,σI)σ

আমি মনে করি আপনি সত্যই যা জিজ্ঞাসা করছেন (এবং যদি আমি ঠিকই থাকি তবে অনুগ্রহ করে সেই অনুসারে আপনার প্রশ্নটি সম্পাদনা করুন) হ্যামিলটোনিয়ান মন্টি কার্লো কেন (কিছু ক্ষেত্রে) মহানগরীর চেয়ে ভাল পারফরম্যান্স করেছেন? "আরও ভাল পারফরম্যান্স" দিয়ে আমি বলতে চাইছি যে, অনেকগুলি অ্যাপ্লিকেশনের জন্য, আপনি যদি মেট্রোপলিস অ্যালগরিদমের দ্বারা উত্পন্ন সমান দৈর্ঘ্যের (একই ধরণের নমুনা ) চেইনের সাথে এইচএমসি দ্বারা উত্পাদিত একটি শৃঙ্খলা তুলনা করেন, এইচএমসি চেইন স্থির স্থানে পৌঁছায় যত তাড়াতাড়ি মেট্রোপলিস চেইন, নেতিবাচক লগ-সম্ভাবনার (বা একটি অনুরূপ মান, তবে কম পুনরাবৃত্তিতে) জন্য একটি কম মান খুঁজে পায়, কার্যকর নমুনার আকার ছোট হয়, নমুনাগুলির স্বতঃসংশ্লিষ্টতা ল্যাগ ইত্যাদির সাথে দ্রুত ক্ষয় হয় ..N

আমি গাণিতিক বিবরণে খুব বেশি না গিয়ে কেন এমনটি হয় তার একটি ধারণা দেওয়ার চেষ্টা করব। সুতরাং, প্রথম সব রিকল সাধারণভাবে এমসিএমসি আলগোরিদিম উচ্চ মাত্রিক ইন্টেগ্রাল একটি ফাংশন এর (প্রত্যাশা) (বা তার বেশি ফাংশন) গনা দরকারী আছে লক্ষ্য ঘনত্ব থেকে সম্মান সঙ্গে আমরা না যখন, এবং expecially লক্ষ্য ঘনত্ব থেকে সরাসরি নমুনার একটি উপায়:fπ(q)

Eπ[f]=Qf(q)π(q)dq1dqd

যেখানে হল পরামিতিগুলির ভেক্টর, যার উপর এবং নির্ভর করে এবং হল প্যারামিটারের স্থান। এখন উচ্চ মাত্রায়, প্যারামিটার স্পেসের ভলিউম যা উপরের অবিচ্ছেদের ক্ষেত্রে সর্বাধিক অবদান রাখে মোডের প্রতিবেশ নয় (অর্থাত্, এটি এমএলই অনুমানের চারপাশে কোনও সংকীর্ণ পরিমাণ নয় ), কারণ এখানে বড় তবে ভলিউম খুব কম।qdfπQπ(q)qπ(q)

উদাহরণস্বরূপ, ধরুন আপনি যখন এর উত্স থেকে পয়েন্ট এর গড় দূরত্ব গণনা করতে চান , যখন এর স্থানাঙ্কগুলি শূন্য গড় এবং একক বৈকল্পিক সহ স্বতন্ত্র গাউসীয় পরিবর্তনশীল হয়। তারপরে উপরের অবিচ্ছেদ্য হয়ে যায়:qRd

Eπ[X]=Q||q||(2π)d/2exp(||q||2/2)dq1dqd

এখন, লক্ষ্য ঘনত্ব সম্ভবত সর্বোচ্চ 0. গোলাকার স্থানাঙ্ক এবং প্রবর্তন, আপনি দেখতে পারেন যে সংহতটি সমানুপাতিক হয়ে যায় । উত্স থেকে কিছু দূরে এই ফাংশনটির স্পষ্টতই সর্বোচ্চ রয়েছে। অঞ্চল ভিতরে যা অবিচ্ছেদ্য মান সবচেয়ে বলা হয় অবদান টিপিক্যাল সেট , এবং এই অবিচ্ছেদ্য জন্য আদর্শ সেট ব্যাসার্ধ্যের একটি গোলাকৃতি শেল হল ।π(q)=(2π)d/2exp(||q||2/2)r=||q||rd1exp(r2/2)drQRd

এখন, কেউ দেখাতে পারে যে, আদর্শ পরিস্থিতিতে এমসিএমসি দ্বারা উত্পাদিত মার্কোভ চেইন প্রথমে সাধারণ সেটের একটি বিন্দুতে রূপান্তরিত করে, তারপর পুরো সেটটি অন্বেষণ শুরু করে এবং অবশেষে সেটটির বিশদ অনুসন্ধান করতে থাকে। এটি করার ক্ষেত্রে, এমসিএমসি প্রত্যাশার অনুমানটি আরও বেশি নির্ভুল হয়ে ওঠে, পক্ষপাত এবং বৈকল্পিকতা যা ক্রমবর্ধমান পদক্ষেপের সাথে হ্রাস করে।

তবে, যখন টিপিক্যাল সেটের জ্যামিতি জটিল হয় (উদাহরণস্বরূপ, এটিতে যদি দুটি মাত্রায় ক্রপ থাকে), তবে স্ট্যান্ডার্ড র্যান্ডম-ওয়াক মেট্রোপলিস অ্যালগরিদম সেটটির "প্যাথলজিকাল" বিবরণ অন্বেষণে অনেক অসুবিধা হয়। এটি এ অঞ্চলগুলি অন্বেষণ না করে এলোমেলোভাবে "চারপাশে" ঝাঁপিয়ে পড়ে। অনুশীলনে, এর অর্থ এই যে অখণ্ডের জন্য আনুমানিক মানটি সঠিক মানটির আশেপাশে ঝাঁকুনি দেয় এবং একটি চূড়ান্ত সংখ্যক পদক্ষেপে শৃঙ্খলে বাধাগ্রস্ত করার ফলে একটি খারাপ পক্ষপাতদুষ্ট অনুমান হবে will

হ্যামিলটোনীয় মন্টি কার্লো লক্ষ্যমাত্রার সাথে সম্পর্কিত না করে কেবল প্রস্তাব বিতরণ ব্যবহারের পরিবর্তে লক্ষ্য বিতরণে অন্তর্ভুক্ত তথ্যগুলি (তার গ্রেডিয়েন্টে) একটি নতুন নমুনা পয়েন্টের প্রস্তাব জানানোর মাধ্যমে এই সমস্যাটি কাটিয়ে উঠার চেষ্টা করে। সুতরাং, আমরা এই কারণেই বলি যে এইচএমসি প্যারামিটারের স্থানটি আরও দক্ষতার সাথে অন্বেষণ করতে লক্ষ্য বিতরণের ডেরিভেটিভগুলি ব্যবহার করে। তবে লক্ষ্য বন্টনের গ্রেডিয়েন্ট, নিজেই, প্রস্তাবের পদক্ষেপটি অবহিত করার জন্য যথেষ্ট নয় is এর উত্স থেকে এলোমেলো পয়েন্টের গড় দূরত্বের উদাহরণ হিসাবেRd, লক্ষ্য বিতরণের গ্রেডিয়েন্ট, নিজেই, আমাদের বিতরণের মোডের দিকে পরিচালিত করে, তবে মোডের চারপাশের অঞ্চলটি অগত্যা যে অঞ্চলটি উপরের অখণ্ডায় সর্বাধিক অবদান রাখে, তা নয়, এটি সাধারণ সেট নয়।

সঠিক দিকনির্দেশ পাওয়ার জন্য, এইচএমসিতে আমরা ভেরিয়েবলগুলির একটি সহায়ক সেট প্রবর্তন করি, যাকে মোমেন্টাম ভেরিয়েবল বলা হয়। একটি শারীরিক এনালগ এখানে সহায়তা করতে পারে। কোনও গ্রহের চারদিকে প্রদক্ষিণকারী একটি উপগ্রহ স্থির কক্ষপথে থাকবে কেবল তখনই তার গতির "ডান" মান থাকবে, অন্যথায় এটি হয় খালি স্থানের দিকে চলে যাবে, অথবা এটি মহাকর্ষীয় আকর্ষণ দ্বারা গ্রহের দিকে টেনে নিয়ে যাবে (এখানে ভূমিকা পালন করবে) লক্ষ্য ঘনত্বের গ্রেডিয়েন্টের, যা মোডের দিকে "টান" " একইভাবে, গতিযুক্ত প্যারামিটারগুলির লেজের দিকে বা মোডের দিকে প্রবাহিত না হয়ে নতুন স্যাম্পলগুলিকে সাধারণ সেটের ভিতরে রাখার ভূমিকা রয়েছে have

অতিরিক্ত গণিত ছাড়াই হ্যামিলটোনীয় মন্টি কার্লো ব্যাখ্যা করার জন্য মাইকেল বেতানকোর্টের এটি একটি খুব আকর্ষণীয় কাগজের একটি ছোট সংক্ষিপ্তসার। আপনি কাগজটি খুঁজে পেতে পারেন, যা এখানে আরও বিস্তারিতভাবে যায় ।

আইএমও, কাগজটি পর্যাপ্ত বিবরণে কভার করে না এমন একটি বিষয় হ'ল এইচএমসি কখন এবং কেন এলোমেলো হাঁটা মেট্রোপলিসের চেয়ে খারাপ করতে পারে। এটি প্রায়শই ঘটে না (আমার সীমাবদ্ধ অভিজ্ঞতায়) তবে এটি ঘটতে পারে। সর্বোপরি, আপনি গ্রেডিয়েন্টগুলি প্রবর্তন করেন যা আপনাকে উচ্চ-মাত্রিক প্যারামিটার স্পেসে আপনার পথ খুঁজে পেতে সহায়তা করে তবে আপনি সমস্যার মাত্রিক দ্বিগুণও করেন। তত্ত্বের ক্ষেত্রে, এটি ঘটতে পারে যে মাত্রিকতা বৃদ্ধির কারণে ধীরগতি গ্রেডিয়েন্টগুলির শোষণের দ্বারা প্রদত্ত ত্বরণকে অতিক্রম করে। এছাড়াও (এবং এটি কাগজটিতে আচ্ছাদিত রয়েছে) যদি আদর্শ সেটটিতে উচ্চ বক্রতার অঞ্চল থাকে তবে এইচএমসি "ওভারশুট" করতে পারে, অর্থাত এটি লেজগুলিতে খুব দূরে অপ্রয়োজনীয় পয়েন্টগুলির নমুনা শুরু করতে পারে যা প্রত্যাশার কোনও অবদান রাখে না। যাহোক, এর ফলে সিম্পিকটিক ইন্টিগ্রেটারের অস্থিরতা দেখা দেয় যা সংখ্যায় এইচএমসি বাস্তবায়নে ব্যবহৃত হয়। সুতরাং, এই ধরণের সমস্যা সহজেই নির্ণয় করা হয়।


1
আমি দেখতে পাচ্ছি যে আমি আমার উত্তর লিখতে গিয়ে @ ডি জনসনও বেতানকোর্টের কাগজটি উদ্ধৃত করেছিলেন। যাইহোক, আমি মনে করি উত্তরটি কাগজে কী কী পাওয়া যায় তার সংক্ষিপ্তসার হিসাবে এখনও কার্যকর হতে পারে।
ডেল্টাভিও

3

@ জুহোকোক্কাল মন্তব্যগুলিতে যেমন উল্লেখ করেছেন, উচ্চ গ্রহণযোগ্যতার হার অগত্যা ভাল পারফরম্যান্স দেয় না। প্রস্তাব বিতরণ সঙ্কুচিত করে মহানগর হেস্টিংসের গ্রহণযোগ্যতার হার বাড়ানো যেতে পারে। তবে, এর ফলে লক্ষ্য বন্টনটি অন্বেষণ করতে আরও বেশি সময় লাগবে এর ফলে আরও ছোট পদক্ষেপ নেওয়া হবে। অনুশীলনে, পদক্ষেপের আকার এবং গ্রহণযোগ্যতার হারের মধ্যে একটি বাণিজ্য রয়েছে এবং ভাল পারফরম্যান্স পাওয়ার জন্য একটি যথাযথ ভারসাম্য প্রয়োজন।

হ্যামিলটোনীয় মন্টি কার্লো মেট্রোপলিস হেস্টিংসকে ছাড়িয়ে যাওয়ার প্রবণতা দেখায় কারণ এটি গ্রহণের উচ্চতর সম্ভাবনার সাথে আরও দূরবর্তী পয়েন্টে পৌঁছতে পারে। সুতরাং, প্রশ্নটি হল: কেন এইচএমসি আরও দূরের পয়েন্টগুলির জন্য এমএইচ এর চেয়ে বেশি গ্রহণযোগ্যতার সম্ভাবনা রাখে ?

এমএইচ দূরবর্তী পয়েন্টে পৌঁছাতে সমস্যা হয় কারণ লক্ষ্যগুলি বিতরণ সম্পর্কিত তথ্য ব্যবহার না করেই প্রস্তাবগুলি তৈরি করা হয়। প্রস্তাব বিতরণ সাধারণত আইসোট্রপিক (যেমন একটি প্রতিসম গৌসিয়ান)। সুতরাং, প্রতিটি বিন্দুতে, অ্যালগরিদম এলোমেলো দিক থেকে একটি এলোমেলো দূরত্ব সরিয়ে নিয়ে যাওয়ার চেষ্টা করে। লক্ষ্যমাত্রা বিতরণটি সেই দিকে কত দ্রুত পরিবর্তিত হয় তার তুলনায় দূরত্বটি যদি সামান্য হয় তবে বর্তমান এবং নতুন পয়েন্টগুলিতে ঘনত্ব একইরকম হওয়ার সম্ভাবনা রয়েছে, এটি কমপক্ষে গ্রহণযোগ্যতার একটি যুক্তিসঙ্গত সুযোগ প্রদান করে। বৃহত্তর দূরত্বে, লক্ষ্য বিতরণ বর্তমান পয়েন্টের তুলনায় বেশ কিছুটা পরিবর্তিত হতে পারে। সুতরাং, অনুরূপ বা (আশাকরি) উচ্চ ঘনত্বের সাথে এলোমেলোভাবে কোনও পয়েন্ট সন্ধানের সুযোগটি খুব কম হতে পারে, বিশেষত মাত্রা বৃদ্ধি হওয়ার কারণে। উদাহরণস্বরূপ, যদি বর্তমান বিন্দুটি একটি সংকীর্ণ প্রান্তে থাকে তবে সেখানে '

বিপরীতে, এইচএমসি লক্ষ্য বিতরণের কাঠামোটি কাজে লাগায়। এর প্রস্তাব প্রক্রিয়াটি শারীরিক সাদৃশ্য ব্যবহারের কথা ভাবা যেতে পারে, যেমন নিল (২০১২) তে বর্ণিত হয়েছে। পাহাড়ী, ঘর্ষণবিহীন পৃষ্ঠের উপর একটি ছোঁয়া স্লাইড কল্পনা করুন। ছানার অবস্থান বর্তমান পয়েন্টটি উপস্থাপন করে এবং পৃষ্ঠের উচ্চতা লক্ষ্য বিতরণের নেতিবাচক লগ উপস্থাপন করে। নতুন প্রস্তাবিত পয়েন্টটি পেতে, ছোঁয়াটিকে এলোমেলো দিক এবং প্রস্থের সাথে একটি গতি দেওয়া হয় এবং পৃষ্ঠের উপর দিয়ে প্রসারিত হওয়ার সাথে সাথে এর গতিশীলতা সিমুলেটেড হয়। পাকটি উতরাইয়ের দিকগুলিতে ত্বরান্বিত হবে এবং চড়াই উতরাইয়ের দিকে হ্রাস পাবে (সম্ভবত থামাতেও আবার আবার উতরাই পিছনে পিছলে যেতে হবে)। কোনও উপত্যকার প্রাচীর বরাবর সরানো ট্রাজিলগুলি নীচের দিকে বক্ররেখা হবে। সুতরাং, ল্যান্ডস্কেপ নিজেই ট্র্যাজেক্টোরিটিকে প্রভাবিত করে এবং এটি উচ্চতর সম্ভাবনা অঞ্চলের দিকে টান। মুহুর্তটি ছানাটিকে ছোট ছোট পাহাড়ের উপরে ক্রেস্ট করতে দেয় এবং ছোট ছোট অববাহিকাগুলিকে ওভারশুট করতে পারে। বেশ কয়েকটি সময় পদক্ষেপের পরে পকের অবস্থানটি নতুন প্রস্তাবিত পয়েন্ট দেয় যা মানক মহানগর বিধি ব্যবহার করে গৃহীত বা প্রত্যাখ্যান করা হয়। লক্ষ্য বিতরণ অনুসন্ধান (এবং এর ধীরে ধীরে) হ'ল উচ্চতর গ্রহণযোগ্যতার হারের সাথে এইচএমসি দূরবর্তী পয়েন্টগুলিতে পৌঁছতে দেয়।

এখানে একটি ভাল পর্যালোচনা:

নীল (2012) । হ্যামিলটোনীয় গতিবিদ্যা ব্যবহার করে এমসিসিএম।


0

একটি শিথিল উত্তর হিসাবে (যা আপনি যা খুঁজছেন তা হ্যামিলটোনিয়ান পদ্ধতিগুলি লগের সম্ভাবনার ডেরাইভেটিভকে বিবেচনা করে, যদিও মানক এমএইচ অ্যালগরিদম তা দেয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.