মেশিন লার্নিং বা ডিপ লার্নিং অ্যালগরিদমগুলি কি এমসিসিএম কৌশল ব্যবহারের নমুনা প্রক্রিয়াটিকে "উন্নত" করতে ব্যবহার করা যেতে পারে?


21

আমার এমসিএমসি (মার্কভ চেইন মন্টি কার্লো) পদ্ধতিগুলির উপর যে সামান্য জ্ঞান রয়েছে তার উপর ভিত্তি করে আমি বুঝতে পারি যে নমুনাটি পূর্বোক্ত কৌশলগুলির একটি গুরুত্বপূর্ণ অঙ্গ। স্যাম্পলিংয়ের সর্বাধিক ব্যবহৃত পদ্ধতি হ্যামিলটোনিয়ান এবং মেট্রোপলিস।

আরও দক্ষ এমসিএমসি স্যাম্পলার তৈরির জন্য কি মেশিন লার্নিং বা আরও গভীর শিক্ষার ব্যবহার করার কোনও উপায় আছে?


5
আপনার মনে কী ধরণের "উন্নতি" রয়েছে এবং আপনি কীভাবে মেশিন লার্নিংয়ের ভূমিকাটিকে দেখেন তা নির্দিষ্ট করে দিতে পারেন ..?
টিম

2
সাধারণত নয়, এমসিএমসি সাধারণত কোনও বদ্ধ রূপ নয় যা বিশ্লেষণাত্মক সমাধানগুলি খুঁজে পাওয়ার জন্য খুব জটিল with এটা সম্ভব যে মাল্টিভারিয়েট ক্লাস্টারিং (বা একই ধরণের পদ্ধতির) সহজ মাল্টিভারিয়েট ঘনত্বগুলি অনুমান করার জন্য ব্যবহার করা যেতে পারে তবে আমি এমসিএমসি ব্যবহারের বিকল্প হিসাবে আরও কিছু দেখতে পাচ্ছি।
আদমো

1
@ অ্যাডামো, কেন এটিকে উত্তরে রূপান্তর করবেন না? দেখে মনে হচ্ছে এটি এখানে যেমন আমরা পেতে পারি তত ভাল।
গুং - মনিকা পুনরায়

@ টিম ভাল, আমি যা পড়েছি তা থেকে, এমসিএমসি অনুমানমূলক পরিমাণগুলি গণনা করার জন্য একটি বিতরণ থেকে নমুনাগুলি আঁকেন। এমএইচ অ্যালগরিদম এলোমেলোভাবে "অবস্থানগুলি" বাছাই করে এবং তারপরে তারা গ্রহণযোগ্য কিনা তা জোর দিয়েছিল। আমি ভাবছিলাম যে এমএল বিকল্প কৌশল আছে। আমি জানি এটি অস্পষ্ট বলে মনে হচ্ছে, এবং এর জন্য আমি ক্ষমা চেয়ে নিচ্ছি, তবে আমি এমসিএমসিটিকে আগ্রহী বলে মনে করি এবং আমি নিজেই অধ্যয়ন করে তত্ত্ব এবং ব্যবহারিক প্রয়োগগুলিকে ধরে রাখতে চাইছি।
জেস্পার

উত্তর:


27

হ্যাঁ। অন্যান্য উত্তরগুলির মতামতগুলির বিপরীতে, 'টিপিক্যাল' মেশিন-শেখার পদ্ধতি যেমন ননপ্যারমেট্রিক্স এবং (গভীর) নিউরাল নেটওয়ার্কগুলি আরও ভাল এমসিসিএম স্যাম্পেলার তৈরি করতে সহায়তা করতে পারে।

এমসিএমসির লক্ষ্য হ'ল একটি (অস্বাভাবিক) লক্ষ্য বন্টন থেকে নমুনা আঁকুন । প্রাপ্ত নমুনাগুলি আনুমানিক হিসাবে ব্যবহৃত হয় এবং বেশিরভাগ অধীনে ফাংশনগুলির প্রত্যাশা গণনা করতে (যেমন, উচ্চ-মাত্রিক ইন্টিগ্রালস) এবং বিশেষত, বৈশিষ্ট্যগুলি ব্যবহৃত হয়(এক্স) (যেমন মুহুর্তগুলির জন্য) ব্যবহৃত হয়।

স্যাম্পলিংয়ের জন্য সাধারণত হ্যামিলটোনিয়ান মন্টি কার্লো (এইচএমসি) এর মতো পদ্ধতির জন্য এবং এর গ্রেডিয়েন্টের প্রচুর মূল্যায়ন প্রয়োজন । তাহলে নির্ণয় করা ব্যয়বহুল হয়, অথবা গ্রেডিয়েন্ট অনুপলব্ধ, কখনও কখনও এর কম দামী নির্মাণ করা সম্ভব ভাড়াটে ফাংশন স্যাম্পলিং গাইড করতে সহায়তা করে এবং স্থানে মূল্যায়ন করা হয় করতে পারে (একটি উপায় যে এখনও এমসিএমসি বৈশিষ্ট্য অপরিবর্তিত মধ্যে)।

উদাহরণস্বরূপ, একটি ধাতুগত কাগজ ( রাসমুসেন 2003 ) ব্যবহার করতে প্রস্তাব গসিয়ান প্রসেস (ক nonparametric ফাংশন পড়তা) এর একটি পড়তা গড়ে তুলতে এবং ক্ষেত্রে HMC একমাত্র স্বীকৃতি / প্রত্যাখ্যান পদক্ষেপ উপর ভিত্তি করে সঙ্গে, ভাড়াটে ফাংশন উপর ক্ষেত্রে HMC সঞ্চালন । এটি আসল এর মূল্যায়নের সংখ্যা হ্রাস করে এবং পিডিএফসগুলিতে এমসিএমসি সম্পাদনের অনুমতি দেয় যা অন্যথায় মূল্যায়ন করতে খুব ব্যয়বহুল হবে।লগ

এমসিএমসিকে গতি বাড়ানোর জন্য সারোগেটগুলি ব্যবহার করার ধারণাটি বিগত কয়েক বছরে অনেকগুলি অনুসন্ধান করা হয়েছে, মূলত সার্গেট কার্য সম্পাদন করার জন্য বিভিন্ন উপায়ে চেষ্টা করে এবং দক্ষতার সাথে / অভিযোজিতভাবে বিভিন্ন এমসিএমসি পদ্ধতির সাথে সংমিশ্রণ করা (এবং এমনভাবে যা 'সঠিকতা সংরক্ষণ করে' এমসিএমসি স্যাম্পলিংয়ের)। আপনার প্রশ্নের সাথে সম্পর্কিত, এই দুটি অতি সাম্প্রতিক কাগজগুলি উন্নত মেশিন লার্নিং কৌশলগুলি ব্যবহার করে - এলোমেলো নেটওয়ার্ক ( ঝাং এট আল। 2015 ) বা অভিযোজিতভাবে শিখানো এক্সফোনেনশিয়াল কার্নেল ফাংশন ( স্ট্রথম্যান এট আল। 2015 ) - সারোগেট ফাংশনটি তৈরি করতে।

এইচএমসি এমসিএমসির একমাত্র ফর্ম নয় যা সারোগেটগুলি থেকে উপকৃত হতে পারে। উদাহরণস্বরূপ, নিশিয়ারা এট আল। (2014) একটি ঘাঁটিযুক্ত নমুনার মাল্টি-চেইন স্টেটে মাল্টিভারিয়েট স্টুডেন্টের বিতরণ ফিটিং করে লক্ষ্য ঘনত্বের একটি আনুমানিকতা তৈরি করুন এবং উপবৃত্তাকার স্লাইস স্যাম্পলিংয়ের একটি সাধারণ রূপটি সম্পাদন করতে এটি ব্যবহার করুন ।টি

এগুলি কেবল উদাহরণ। সাধারণভাবে, বেশ কয়েকটি স্বতন্ত্র এমএল কৌশলগুলি (বেশিরভাগ ফাংশন আনুমানিকতা এবং ঘনত্ব অনুমানের ক্ষেত্রে) এমসিএমসি স্যাম্পেলারগুলির দক্ষতা উন্নত করতে পারে এমন তথ্য আহরণের জন্য ব্যবহার করা যেতে পারে। তাদের আসল উপযোগিতা - যেমন "প্রতি সেকেন্ডে কার্যকর স্বতন্ত্র নমুনার সংখ্যায় পরিমাপ করা" - ব্যয় ব্যয়বহুল বা কিছুটা শক্ত হওয়াতে শর্তযুক্ত ; এছাড়াও, এই পদ্ধতিগুলির অনেকগুলি তাদের নিজস্ব প্রয়োগ বা সীমাবদ্ধকরণের মাধ্যমে নিজস্ব বা অতিরিক্ত জ্ঞানের সুরের প্রয়োজন হতে পারে।

তথ্যসূত্র:

  1. রাসমুসেন, কার্ল এডওয়ার্ড। "গসিয়ান দামি বায়েশিয়ান ইন্টিগ্রালের জন্য হাইব্রিড মন্টি কার্লো গতি বাড়ানোর প্রক্রিয়া করছেন।" বায়েশিয়ান পরিসংখ্যান 7. 2003।

  2. জাং, চেং, বাবাক শাহবাবা, এবং হংকাই ঝাও। "র্যান্ডম বেসগুলি সহ সারোগেট ফাংশনগুলি ব্যবহার করে হ্যামিলটোনীয় মন্টি কার্লো ত্বরণ।" আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1506.05555 (2015)।

  3. স্ট্রেথম্যান, হাইকো, ইত্যাদি। "দক্ষ কার্নেল ক্ষতিকারক পরিবারগুলির সাথে গ্রেডিয়েন্ট-মুক্ত হ্যামিলটোনিয়ান মন্টি কার্লো" " নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমগুলিতে অগ্রগতি। 2015।

  4. নিশিহারা, রবার্ট, আয়েন মারে, এবং রায়ান পি অ্যাডামস। "জেনারাইজড উপবৃত্তাকার স্লাইস স্যাম্পলিং সহ সমান্তরাল এমসিএমসি।" মেশিন লার্নিং রিসার্চ জার্নাল 15.1 (2014): 2087-2112।


2
আমি নিশ্চিত নই যে আপনি তালিকাভুক্ত পদ্ধতিগুলি সত্যই "মেশিন লার্নিং পদ্ধতি" বিভাগে রয়েছে, কেবলমাত্র স্ট্যান্ডার্ড এমসিএমসি পদ্ধতিগুলি (যদিও এটি লাইনগুলির মধ্যে সবচেয়ে ঝাপসা)। কেবলমাত্র একটি যা এমএল / ডিএল পদ্ধতি হিসাবে সুনির্দিষ্টভাবে মনে হয় 3 টি ছিল , যেহেতু এটি তার শিরোনাম থেকে "নিউরাল নেটওয়ার্ক" সরিয়ে নিয়েছে (এবং পাঠ্যটিতে স্বীকৃত বলে মনে হচ্ছে যে স্ট্যান্ডার্ড এমএল পদ্ধতি ব্যবহার করা খুব ধীর হবে)।
ক্লিফ এবি

2
টি

1
আপনাকে অনেক ধন্যবাদ @ লেসারবি। আমি আনন্দিত যে আমি আপনার গবেষণাগুলি আরও গবেষণার জন্য বেডরোক হিসাবে ব্যবহার করতে পারি।
জেস্পার

6

একটি পদ্ধতি যা দুটি ধারণাকে সংযুক্ত করতে পারে তা হ'ল মাল্টিভিয়ারেট মেট্রোপলিস হেস্টিংস অ্যালগরিদম। এই ক্ষেত্রে, আমাদের একটি লক্ষ্য বিতরণ (উত্তরোত্তর বিতরণ) এবং একটি প্রস্তাব বিতরণ (সাধারণত একটি মাল্টিভারিয়েট স্বাভাবিক বা টি-বিতরণ) থাকে।

একটি সুপরিচিত সত্য হ'ল প্রস্তাব বিতরণ উত্তরোত্তর বিতরণ থেকে যত বেশি নমুনা তত কম দক্ষ হয়। সুতরাং কেউ প্রস্তাবনা বিতরণ গড়ে তুলতে কিছু ধরণের মেশিন লার্নিং পদ্ধতি ব্যবহার করে কল্পনা করতে পারেন যা সাধারণ মাল্টিভারিয়েট স্বাভাবিক / টি বিতরণের চেয়ে সত্য উত্তরোত্তর বিতরণের সাথে আরও ভাল মেলে।

তবে এটি পরিষ্কার নয় যে এটি দক্ষতার কোনও উন্নতি হবে। গভীর শেখার পরামর্শ দিয়ে আমি ধরে নিয়েছি যে আপনি কোনও ধরণের নিউরাল নেটওয়ার্ক পদ্ধতির ব্যবহারে আগ্রহী হতে পারেন। বেশিরভাগ ক্ষেত্রে, এটি পুরো ভ্যানিলা এমসিএমসি পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে আরও বেশি ব্যয়বহুল হবে। একইভাবে, আমি কোনও কারণ জানি না যে এনএন পদ্ধতিগুলি (বা এমনকি বেশিরভাগ মেশিন লার্নিং পদ্ধতি) পর্যবেক্ষণ করা জায়গার বাইরে পর্যাপ্ত ঘনত্ব সরবরাহের জন্য ভাল কাজ করে যা এমসিসিএমের পক্ষে অত্যন্ত গুরুত্বপূর্ণ। এমনকি মেশিন লার্নিং মডেল তৈরির সাথে যুক্ত গণ্য ব্যয়গুলি উপেক্ষা করেও, নমুনা কার্যকারিতার উন্নতি করার কারণ আমি এর কোনও ভাল কারণ দেখতে পাচ্ছি না।


ক্লিফ এবি আমার কাছে মনে হয় আপনি এবং @ অ্যাডামো অন্য বইতে ঘন্টা ব্যয় করার চেয়ে এমসিএমসি এবং এমএল ধারণাগুলি আমার কাছে পরিষ্কার করেছেন। আমি আপনার প্রচেষ্টার প্রশংসা করি এবং আমি আনন্দিত যে আপনি এমন কিছু ক্ষেত্র উল্লেখ করেছেন যাতে আমি আরও জানাতে পারি।
জেস্পার

আপনি কোন বইয়ের কথা উল্লেখ করছেন?
আদমো

@ অ্যাডামো বর্তমানে আমি রিচার্ড সাটন এবং মেশিন লার্নিং দ্বারা পুনর্বহালনের পাঠ শিখছি: কেভিন মারফি দ্বারা পরিচালিত একটি সম্ভাব্য দৃষ্টিভঙ্গি যার একটি এমসিসিএম অধ্যায় রয়েছে; এবং বিভিন্ন এমএল এবং গণনা সংক্রান্ত পরিসংখ্যান জার্নাল থেকে প্রকাশনা।
জেস্পার

3

মেশিন লার্নিং ভবিষ্যদ্বাণী, শ্রেণিবিন্যাস, বা তদারকি করা বা আনসারভিজড সেটিংয়ে ক্লাস্টারিংয়ের সাথে সম্পর্কিত। অন্যদিকে, এমসিএমসি সম্ভাব্য সংখ্যাসূচক পদ্ধতিগুলি ব্যবহার করে একটি জটিল ইন্টারগ্রাল (সাধারণত কোনও বদ্ধ ফর্ম ছাড়াই) মূল্যায়নের সাথে কেবল উদ্বিগ্ন। মেট্রোপলিস স্যাম্পলিং স্পষ্টভাবে হয় না সবচেয়ে বেশি ব্যবহৃত পদ্ধতির। প্রকৃতপক্ষে, কোনও সম্ভাব্য উপাদান না থাকার জন্য এটিই একমাত্র MCMC পদ্ধতি । সুতরাং এমএল এমসিসিএমসির সাথে এই ক্ষেত্রে কিছু জানাবে না।

গুরুত্ব ভিত্তিক স্যাম্পলিং করে সম্ভাব্য উপাদান প্রয়োজন। এটি কিছু প্রাথমিক অনুমানের অধীনে মেট্রোপলিসের চেয়ে দক্ষ। এমএল পদ্ধতিগুলি এই সম্ভাব্য উপাদানটি অনুমান করতে ব্যবহার করা যেতে পারে যদি এটি কিছু অনুমানের সাথে ডোভেটেল করে। জটিল উচ্চ মাত্রিক গাউসিয়ান ঘনত্ব অনুমান করার জন্য উদাহরণগুলি মাল্টিভারিয়েট ক্লাস্টারিং হতে পারে। আমি এই সমস্যায় অ-প্যারাম্যাট্রিক পদ্ধতির সাথে পরিচিত নই, তবে এটি বিকাশের আকর্ষণীয় ক্ষেত্র হতে পারে।

তবুও, এমএল একটি উচ্চ মাত্রিক জটিল সম্ভাবনা মডেল যা পরবর্তী সময়ে একটি সংখ্যা পদ্ধতিতে ব্যবহৃত হয় তা অনুমান করার প্রক্রিয়াটির একটি স্বতন্ত্র পদক্ষেপ হিসাবে আমার কাছে দাঁড়িয়ে আছে। এমএল এমসিএমসিকে কীভাবে এই ক্ষেত্রে উন্নতি করে তা আমি দেখছি না।


আপনাকে ধন্যবাদ অ্যাডামো, কমপক্ষে এখন আমার এই অঞ্চলটি সম্পর্কে আরও ভাল ধারণা রয়েছে।
জেস্পার

1
আমি মনে করি এই উত্তরটি অসম্পূর্ণ এবং সম্ভবত ভুল (ওপির আসল প্রশ্নের ব্যাখ্যার উপর নির্ভর করে, যা সম্পূর্ণ পরিষ্কার নয়)। যেমন nonparametrics এবং স্নায়ুর নেটওয়ার্ক যেমন বৈশিষ্টসূচক এমএল পদ্ধতি করতে এবং করছে এমসিএমসি samplers উন্নত করতে ব্যবহৃত। আসলে এটি গবেষণার একটি সক্রিয় ক্ষেত্র। আমার উত্তরটি দেখুন এবং এর সাথে সূত্র উল্লেখ করুন।
lacerbi

1
পি

ধন্যবাদ @ অ্যাডামো তবুও, সত্যি বলতে কী, আমি আপনার ব্যাখ্যাটি বুঝতে পারি না বা এটি কীভাবে আপনার উত্তরটিকে সঠিক করে তোলে। উদাহরণস্বরূপ, আপনি যখন বলছেন যে মেট্রোপলিসের "কোনও সম্ভাব্য উপাদান নেই" তখন আপনি কী বোঝাতে চাইছেন তা আমি বুঝতে পারি না। এছাড়াও, আপনি উল্লেখ করেছেন যে এমএল স্যাম্পলিংয়ে সহায়তা করতে পারে না, যা কেবল অসত্য (এমনকি একটি উচ্চ-মাত্রিক ইন্টিগ্রালের অনুমান হিসাবে নমুনার সংকীর্ণ সংজ্ঞাতেও), আমার উত্তরটি দেখায়।
লেসারবি

3
@ অ্যাডামো: গাউসিয়ান প্রক্রিয়াগুলি, কার্নেল পদ্ধতি, র্যান্ডম ভিত্তিক নেটওয়ার্কগুলি। সাধারণভাবে, ফাংশনের আনুমানিকতা বা ঘনত্বের প্রাক্কলনের কোনও ফর্ম কাজ করবে। এই এমএল পদ্ধতি না হন, তাহলে আমি নিশ্চিত কি নই হয় ... (দয়া করে মনে রাখবেন ওপি এমএল চাইলেন বা ডিএল পদ্ধতি)। এছাড়াও, যেমন আমি উপরে জিজ্ঞাসা করেছি, আপনি যখন লিখেছেন যে মেট্রোপলিসের কোনও সম্ভাব্য উপাদান নেই তখন আপনি কী বোঝাতে চেয়েছিলেন দয়া করে তা ব্যাখ্যা করতে পারেন? ধন্যবাদ!
লেসারবি

0

কম্পিউটেশনাল ফিজিক্সে সাম্প্রতিক কয়েকটি কাজ ছিল যেখানে সম্ভাব্যতা বন্টনকে মডেল করার জন্য লেখকরা সীমাবদ্ধ বোল্টজমান মেশিনগুলি ব্যবহার করেছিলেন এবং তারপরে প্রস্তাবিত ( আশাবাদী ) দক্ষ মন্টি কার্লো আপডেটগুলি arXiv: 1610.02746 । এখানে ধারণাটি উপরে উপরে ল্লেসার্বি দ্বারা প্রদত্ত রেফারেন্সগুলির সাথে বেশ সমান হতে পারে।

1702.08586 এর অন্য একটি প্রয়াসে , লেখক স্পষ্টভাবে বল্টজমান মেশিনগুলি নির্মাণ করেছিলেন যা উদযাপন ক্লাস্টার মন্টি কার্লো আপডেটগুলি সম্পাদন করতে পারে (এবং আবিষ্কার করতে পারে) ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.