হতে পারে ধারণাটি, এটি কেন ব্যবহৃত হয়েছে এবং একটি উদাহরণ।
হতে পারে ধারণাটি, এটি কেন ব্যবহৃত হয়েছে এবং একটি উদাহরণ।
উত্তর:
প্রথমে আমাদের বুঝতে হবে একটি মার্কভ চেইন কী। উইকিপিডিয়া থেকে নিম্নলিখিত আবহাওয়ার উদাহরণ বিবেচনা করুন । ধরা যাক যে কোনও দিন আবহাওয়াকে কেবল দুটি রাজ্যে শ্রেণিবদ্ধ করা যায়: রৌদ্র এবং বৃষ্টি। অতীত অভিজ্ঞতার ভিত্তিতে আমরা নিম্নলিখিতটি জানি:
যেহেতু, পরের দিনের আবহাওয়া হয় রোদ বা বৃষ্টিপাত এটি অনুসরণ করে:
একইভাবে, যাক:
অতএব, এটি অনুসরণ করে যে:
উপরোক্ত চারটি সংখ্যাকে সংক্রামিত ম্যাট্রিক্স হিসাবে সংক্ষিপ্তভাবে উপস্থাপন করা যেতে পারে যা এক রাজ্য থেকে অন্য রাজ্যে যাওয়ার আবহাওয়ার সম্ভাবনার প্রতিনিধিত্ব করে:
আমরা বেশ কয়েকটি প্রশ্ন জিজ্ঞাসা করতে পারি যার উত্তরগুলি অনুসরণ করে:
প্রশ্ন 1: আজ যদি আবহাওয়া রৌদ্র হয় তবে আগামীকাল আবহাওয়ার সম্ভাবনা কী?
এ 1: যেহেতু, আমরা নিশ্চিতভাবে কী হতে চলেছি তা আমরা জানি না, সর্বোপরি আমরা বলতে পারি যে সম্ভাবনা রয়েছে যা সম্ভবত রোদযুক্ত এবং বৃষ্টি হবে।10 %
প্রশ্নোত্তর: আজ থেকে দু'দিন কী?
এ 2: এক দিনের পূর্বাভাস: রোদ, বৃষ্টি। অতএব, এখন থেকে দুই দিন:10 %
প্রথম দিন এটি রোদ হতে পারে এবং পরের দিনও রোদ হতে পারে। এই হওয়ার সম্ভাবনাগুলি হ'ল: ।
অথবা
প্রথম দিন বৃষ্টি হতে পারে এবং দ্বিতীয় দিন রোদ হতে পারে। এই হওয়ার সম্ভাবনাগুলি হ'ল: ।
সুতরাং, দুই দিনের মধ্যে আবহাওয়া রৌদ্রের সম্ভাবনা হ'ল:
একইভাবে, বৃষ্টি হওয়ার সম্ভাবনা হ'ল:
লিনিয়ার বীজগণিত (ট্রানজিশন ম্যাট্রিক্স) এ গণনাগুলি এক ধাপ থেকে পরের (রোদ-টু- ( ), থেকে বৃষ্টি ( ), বর্ষায় থেকে ( ) বা or তাদের গণনার সম্ভাব্যতা সহ বৃষ্টি-থেকে-বর্ষার ( ):এস 2 আর আর 2 এস আর 2 আর
চিত্রের নীচের অংশে আমরা দেখতে পাই যে প্রতিটি রাজ্যের জন্য সম্ভাব্যতা (সম্ভাব্য ভর ফাংশন, ) প্রদত্ত ভবিষ্যতের রাষ্ট্রের সম্ভাব্যতা ( বা ) কীভাবে গণনা করতে হবে (রৌদ্র বা বৃষ্টি) সময় শূন্যে (এখন বা ) সাধারণ ম্যাট্রিক্সের গুণ হিসাবে।t + 2 P M F t 0
আপনি যদি আবহাওয়ার পূর্বাভাসটি এভাবেই রাখেন তবে আপনি খেয়াল করবেন যে অবশেষে তম দিনের পূর্বাভাস, যেখানে খুব বড় ( বলুন ), নিম্নলিখিত 'ভারসাম্য' সম্ভাবনাগুলিতে স্থায়ী হয়:এন 30
এবং
অন্য কথায়, তম দিন এবং তম দিনের জন্য আপনার পূর্বাভাস একই থাকবে। এছাড়াও, আপনি পরীক্ষা করতে পারেন যে 'ভারসাম্য' সম্ভাবনাগুলি আজকের আবহাওয়ার উপর নির্ভর করে না। আপনি যদি আজকের আবহাওয়া রোদ বা বৃষ্টিপাত অনুমান করে শুরু করেন আপনি আবহাওয়ার জন্য একই পূর্বাভাস পেতে পারেন।n + 1
উপরের উদাহরণটি কেবল তখনই কাজ করবে যদি রাষ্ট্রের উত্তরণের সম্ভাবনাগুলি বেশ কয়েকটি শর্ত পূরণ করে যা আমি এখানে আলোচনা করব না। তবে, এই 'দুর্দান্ত' মার্কভ চেইনের নিম্নলিখিত বৈশিষ্ট্যগুলি লক্ষ্য করুন (চমৎকার = রূপান্তর সম্ভাবনার শর্তগুলি পূরণ করে):
প্রাথমিক প্রারম্ভিক অবস্থা নির্বিশেষে আমরা শেষ পর্যন্ত রাজ্যের একটি ভারসাম্য সম্ভাবনা বন্টনে পৌঁছে যাব।
মার্কভ চেইন মন্টি কার্লো নিম্নোক্ত বৈশিষ্ট্যটি ব্যবহার করেছেন:
আমরা একটি লক্ষ্য বিতরণ থেকে এলোমেলো অঙ্কন তৈরি করতে চাই। তারপরে আমরা একটি 'সুন্দর' মার্কভ চেইন নির্মাণের একটি উপায় চিহ্নিত করি যাতে এর সাম্যতার সম্ভাব্যতা বন্টন আমাদের লক্ষ্য বিতরণ।
যদি আমরা এই জাতীয় শৃঙ্খলা তৈরি করতে পারি তবে আমরা নির্বিচারে কিছু বিন্দু থেকে শুরু করি এবং মার্কভ চেইনটিকে বহুবার পুনরাবৃত্তি করি (যেমন আমরা কীভাবে আবহাওয়ার বারবার পূর্বাভাস দিয়েছি )। অবশেষে, আমরা যে অঙ্কনগুলি তৈরি করি তা প্রদর্শিত হবে যেন সেগুলি আমাদের লক্ষ্য বিতরণ থেকে আসছে।
তারপরে আমরা মন্টে কার্লো উপাদান যে কয়েকটি প্রাথমিক ড্র আঁকার পরে অঙ্কনের নমুনা গড় গ্রহণ করে আগ্রহের পরিমাণগুলি (উদাহরণস্বরূপ) আনুমানিক।
'দুর্দান্ত' মার্কভ চেইন নির্মাণের বিভিন্ন উপায় রয়েছে (যেমন, গিবস স্যাম্পলার, মহানগর-হেস্টিংস অ্যালগরিদম) g
আমি মনে করি (স্বাধীনতা-চেইন) মেট্রোপলিস-হেস্টিংস অ্যালগরিদম থেকে একটি দুর্দান্ত এবং সাধারণ অন্তর্দৃষ্টি পাওয়া যায়।
প্রথম, লক্ষ্য কি? এমসিএমসির লক্ষ্য হ'ল কোনও পর্যায়ে সঠিক উচ্চতা না জেনে কিছু সম্ভাবনা বিতরণ থেকে নমুনা আঁকানো। এমসিএমসি যেভাবে এটি অর্জন করে তা হ'ল সেই বিতরণটিকে "ঘুরে বেড়ানো" এমনভাবে করা যাতে প্রতিটি জায়গাতে যে পরিমাণ সময় ব্যয় হয় তা বিতরণের উচ্চতার সাথে সমানুপাতিক। যদি "কাছাকাছি ঘোরাঘুরি" প্রক্রিয়াটি সঠিকভাবে সেট আপ করা হয় তবে আপনি নিশ্চিত করতে পারেন যে এই আনুপাতিকতা (সময় ব্যয় করার সময় এবং বিতরণের উচ্চতার মধ্যে) অর্জিত হয়েছে।
স্বজ্ঞাতভাবে, আমরা যা করতে চাই তা হ'ল কিছু (লম্পট) পৃষ্ঠকে এমনভাবে ঘুরে বেড়ানো যাতে প্রতিটি স্থানে আমরা যে পরিমাণ সময় ব্যয় করি (বা # নমুনা টানা) সে স্থানের পৃষ্ঠের উচ্চতার সমানুপাতিক। সুতরাং, উদাহরণস্বরূপ, আমরা 50 মিটার উচ্চতায় যে কাছাকাছি পাহাড়ের মতো 100 মিটার উচ্চতায় একটি পাহাড়ের চূড়ায় দ্বিগুণ সময় ব্যয় করতে চাই। সুন্দর জিনিসটি হ'ল আমরা উপরিভাগের পয়েন্টগুলির পরম উচ্চতাগুলি না জানলেও আমরা এটি করতে পারি: আমাদের যা জানতে হবে তা আপেক্ষিক উচ্চতা। উদাহরণস্বরূপ, যদি একটি পাহাড়ের মাটি এ পাহাড়ের দ্বার চেয়ে দ্বিগুণ হয় তবে আমরা বি তে যতটা সময় কাটিয়েছি তার চেয়ে দ্বিগুণ সময় ব্যয় করতে চাই A
মেট্রোপলিস-হেস্টিংস অ্যালগরিদম (স্বতন্ত্র চেইনের নমুনা) এর সহজতম রূপটি নিম্নলিখিত হিসাবে এটি অর্জন করে: ধরে নিন যে প্রতিটি (পৃথক) সময় ধাপে আমরা একটি এলোমেলো নতুন "প্রস্তাবিত" অবস্থান বেছে নিয়েছি (পুরো পৃষ্ঠতল জুড়ে অভিন্নভাবে নির্বাচিত)। প্রস্তাবিত অবস্থানটি এখনই আমরা যেখানে দাঁড়িয়ে আছি তার চেয়ে বেশি হলে এটিতে যান। যদি প্রস্তাবিত অবস্থানটি কম হয়, তবে সম্ভাব্যতা পি সহ নতুন অবস্থানে যান, যেখানে p that পয়েন্টের উচ্চতার অনুপাত বর্তমান অবস্থানের উচ্চতায়। (উদাহরণস্বরূপ, মাথা পাওয়ার সম্ভাবনা পি দিয়ে একটি মুদ্রা ফ্লিপ করুন; যদি এটি মাথা উপরে আসে তবে নতুন জায়গায় সরে যান; যদি এটি লেজ উপরে আসে তবে আমরা যেখানে থাকি সেখানে থাকুন)। আপনি প্রতিবারের পদক্ষেপে যে অবস্থানগুলি করেছেন সেগুলির একটি তালিকা রাখুন এবং সেই তালিকাতে (অ্যাসিপ্টোটিক্যালি) পৃষ্ঠের প্রতিটি অংশে সময় ব্যয় করার সঠিক অনুপাত থাকবে।
নতুন জায়গা এবং সেগুলি গ্রহণের নিয়মগুলির প্রস্তাব দেওয়ার জন্য আরও জটিল পরিকল্পনা রয়েছে তবে মূল ধারণাটি এখনও রয়েছে: (1) একটি নতুন "প্রস্তাবিত" অবস্থান বেছে নিন; (২) আপনার বর্তমান অবস্থানের সাথে তুলনামূলকভাবে সেই অবস্থানটি কতটা উচ্চতর বা নীচে রয়েছে তা নির্ধারণ করুন; (3) সম্ভাব্য স্থিতিস্থলে থাকুন বা সেই স্থানে এমনভাবে চলে যান যাতে অবস্থানের উচ্চতার সমানুপাতিক সময় ব্যয় করার সামগ্রিক লক্ষ্যকে সম্মান করা হয়।
এটি কি জন্য দরকারী? ধরুন আমাদের কাছে আবহাওয়ার একটি সম্ভাব্য মডেল রয়েছে যা আমাদের এ * পি (আবহাওয়া) মূল্যায়ন করতে দেয়, যেখানে এ অজানা ধ্রুবক। (এটি প্রায়শই ঘটে - অনেকগুলি মডেল এমনভাবে তৈরি করা সুবিধাজনক যে আপনি এটি কী তা নির্ধারণ করতে পারবেন না)। সুতরাং আমরা ঠিক পি ("কাল বৃষ্টি") মূল্যায়ন করতে পারি না। তবে, আমরা কিছুক্ষণের জন্য এমসিসিএম স্যাম্পলারটি চালাতে পারি এবং তারপরে জিজ্ঞাসা করতে পারি: "আগামীকাল বৃষ্টি" অবস্থায় স্যাম্পলগুলির (বা "অবস্থানগুলি") এর কোন ভগ্নাংশ শেষ হয়েছিল। সেই ভগ্নাংশটি হবে (মডেল-ভিত্তিক) সম্ভাব্য আবহাওয়ার পূর্বাভাস।
আমি সম্ভবত এরকম কিছু বলব:
"যে কোনও সময় আমরা সম্ভাব্যতাগুলি নিয়ে কথা বলতে চাই, আমরা সত্যই একটি ঘনত্বকে সংহত করি Bay বায়েসীয় বিশ্লেষণে, আমরা যে বহু ঘনত্ব নিয়ে এসেছি তা বিশ্লেষণাত্মকভাবে ট্র্যাকটেবল নয়: আপনি কেবল তাদের সংহত করতে পারবেন - আপনি যদি এগুলিকে একীভূত করতে পারেন তবে - প্রচুর ভোগান্তির সাথে। সুতরাং আমরা এর পরিবর্তে যা করি তা হ'ল এলোমেলো পরিবর্তনশীলকে অনেকগুলি অনুকরণ করে এবং তারপরে আমাদের সিমুলেটেড এলোমেলো সংখ্যাগুলি থেকে সম্ভাব্যতাগুলি খুঁজে বের করতে পারি If যদি আমরা সম্ভাবনাটি জানতে চাই যে এক্স 10 এর চেয়ে কম হয় তবে আমরা গণনা করি সিমুলেটেড এলোমেলো পরিবর্তনশীল ফলাফলের তুলনায় 10 টিরও কম এবং এটি আমাদের অনুমান হিসাবে ব্যবহার করুন That's এটিই "মন্টি কার্লো" অংশ, এটি এলোমেলো সংখ্যার ভিত্তিতে সম্ভাবনার একটি অনুমান। পর্যাপ্ত সিমুলেটেড এলোমেলো সংখ্যার সাথে, অনুমানটি খুব ভাল তবে এটি এখনও সহজাতভাবে এলোমেলো।
"তবে" মার্কভ চেইন "কেন? কারণ কিছু প্রযুক্তিগত অবস্থার অধীনে আপনি একটি স্মৃতিবিহীন প্রক্রিয়া তৈরি করতে পারেন (যার নাম একটি মার্কোভিয়ান) যা আপনি যে র্যান্ডম ভেরিয়েবলের অনুকরণের চেষ্টা করছেন তার সমান সীমিত বন্টন রয়েছে You আপনি যে কোনওটির পুনরাবৃত্তি করতে পারেন বিভিন্ন ধরণের সিমুলেশন প্রক্রিয়া যা পারস্পরিক সম্পর্কযুক্ত র্যান্ডম সংখ্যা উত্পন্ন করে (কেবলমাত্র সেই সংখ্যার বর্তমান মানের উপর ভিত্তি করে), এবং আপনি গ্যারান্টিযুক্ত যে একবার ফলাফলের যথেষ্ট পরিমাণ সঞ্চার করার পরে আপনি সংখ্যার একটি গাদা দিয়ে শেষ করবেন " যেন "আপনি যে জটিল বিতরণ সম্পর্কে জানতে চেয়েছিলেন সেগুলি থেকে আপনি কোনওভাবে স্বাধীন নমুনাগুলি নিতে পেরেছেন।
"সুতরাং উদাহরণস্বরূপ, আমি যদি একটি স্ট্যান্ডার্ড স্বাভাবিক এলোমেলো পরিবর্তনশীল 0.5 এর কম হওয়ার সম্ভাবনাটি অনুমান করতে চাই তবে আমি একটি আদর্শ সাধারণ বিতরণ থেকে দশ হাজার স্বতন্ত্র উপলব্ধি অর্জন করতে পারি এবং 0.5 এর চেয়ে কম সংখ্যা গণনা করতে পারি; বলুন আমি পেয়েছিলাম 6905 যা ছিল মোট ১০০০০০ নমুনার মধ্যে ০.৫ এরও কম; পি (জেড <0.5) এর জন্য আমার অনুমান 0.6905 হবে, যা আসল মান থেকে খুব বেশি দূরে নয় That এটি মন্টি কার্লো অনুমান হবে।
পদ্ধতি থেকে আমি যে সংখ্যার তালিকা পেয়েছি তা সাধারণ র্যান্ডম ভেরিয়েবলগুলি উত্পন্ন করে এমন কিছু থেকে অঙ্কুর মতো বিশাল পরিমাণে বিতরণ করা হবে। এটি আমাকে একটি স্ট্যান্ডার্ড নরমাল এলোমেলো ভেরিয়েবলের জন্য একটি মার্কভ চেইন মন্টি কার্লো সিমুলেশন দেবে। আমি যদি সম্ভাব্যতাগুলি অনুমান করার জন্য এটি ব্যবহার করি তবে এটি এমসিসিএমের অনুমান। "
কল্পনা করুন যে আপনি বোর্ড গেম একচেটিয়া ক্ষেত্রে আপনার বন্ধুদের পরাজিত করার জন্য আরও ভাল কৌশল খুঁজতে চান। গেমের জন্য গুরুত্বপূর্ণ জিনিসগুলি প্রশ্নটিতে সরল করুন: লোকেরা কোন সম্পত্তিটিতে সবচেয়ে বেশি অবতরণ করে? উত্তর বোর্ডের কাঠামো, গেমের নিয়ম এবং দুটি পাশ্ব ছোঁড়ার উপর নির্ভর করে।
প্রশ্নের উত্তর দেওয়ার একটি উপায় হ'ল এটি। আপনি পাশা নিক্ষেপ করতে এবং নিয়মগুলি অনুসরণ করার সাথে সাথে বোর্ডের চারপাশে একটি টুকরো অনুসরণ করুন। প্রতিটি সম্পত্তিতে আপনি কতবার অবতরণ করুন (বা আপনার জন্য কাজটি করার জন্য একটি কম্পিউটার প্রোগ্রাম করুন) অবশেষে, আপনার কম্পিউটারে যথেষ্ট ধৈর্য থাকলে বা আপনি নিয়মগুলি যথেষ্ট পরিমাণে প্রোগ্রাম করেছেন, কোন বৈশিষ্ট্যটি সবচেয়ে বেশি ব্যবসায় পাবে তার একটি ভাল চিত্র আপনি তৈরি করবেন। এটি আপনাকে আরও প্রায়ই জিততে সহায়তা করবে।
আপনি যা করেছেন তা হ'ল একটি মার্কভ চেইন মন্টি কার্লো (এমসিএমসি) বিশ্লেষণ। বোর্ড নিয়ম সংজ্ঞায়িত করে। আপনি পরবর্তী যেখানে অবতরণ করবেন তার উপর নির্ভর করে আপনি এখন কোথায় আছেন, আগে যেখানে ছিলেন না এবং দুটি সম্ভাবনার ছোঁড়া বিতরণের মাধ্যমে নির্দিষ্ট সম্ভাবনাগুলি নির্ধারিত হয়। আগামীকাল আবহাওয়া কেমন হবে বা গ্যাসের অণু দ্বারা এলোমেলোভাবে পরাগযুক্ত শস্যের শস্য শেষ হওয়ার মতো গাণিতিক বা শারীরিক ব্যবস্থায় এমসিএমসি এই ধারণার প্রয়োগ।
ঠিক আছে এখানে অনানুষ্ঠানিক ও অপরিশোধিত ব্যাখ্যায় আমার সেরা চেষ্টা।
একটি মার্কভ চেইন একটি এলোমেলো প্রক্রিয়া যার মধ্যে এমন সম্পত্তি রয়েছে যা ভবিষ্যত কেবল প্রক্রিয়াটির বর্তমান অবস্থার উপর নির্ভর করে অতীতের উপর নির্ভর করে না এটি স্মরণহীন। এলোমেলো প্রক্রিয়ার একটি উদাহরণ স্টক এক্সচেঞ্জ হতে পারে। মার্কভ চেইনের উদাহরণ হ'ল একচেটিয়া বা সাপ এবং মইয়ের মতো বোর্ড গেম যেখানে আপনার ভবিষ্যতের অবস্থান (ডাই রোল করার পরে) কেবল যেখানে রোলের আগে থেকেই শুরু করেছিলেন তার উপর নির্ভর করবে, আপনার পূর্ববর্তী কোনও অবস্থান নয়। মার্কভ চেইনের একটি পাঠ্যপুস্তকের উদাহরণ হ'ল "মাতালদের পদচারণা"। মাতাল এমন কাউকে কল্পনা করুন এবং এক গতিতে কেবল বাম বা ডানদিকে যেতে পারেন। মাতাল সমান সম্ভাবনার সাথে বাম বা ডানে সরে যায়। এটি এমন একটি মার্কভ চেইন যেখানে মাতালদের ভবিষ্যত / পরবর্তী অবস্থান কেবল যেখানে তিনি বর্তমানে আছেন তার উপর নির্ভর করে।
মন্টি কার্লো পদ্ধতি হ'ল গণনা সংক্রান্ত অ্যালগরিদম (কেবল নির্দেশের সেট) যা এলোমেলোভাবে অধ্যয়নের অধীনে কিছু প্রক্রিয়া থেকে নমুনা দেয়। এগুলি এমন কিছু অনুমান করার একটি উপায় যা নির্ধারিতভাবে খুঁজে পাওয়া খুব কঠিন বা সময়সাপেক্ষ। এগুলি মূলত কিছু গাণিতিক বা শারীরিক প্রক্রিয়ার কম্পিউটার সিমুলেশনগুলির ফর্ম। মন্টে কার্লো মনিকার একটি ক্যাসিনো এবং এলোমেলো সংখ্যা জেনারেশনের মধ্যে উপমা থেকে আসে। আমাদের বোর্ড গেমের উদাহরণটিতে আগে ফিরে আসা, সম্ভবত আমরা জানতে চাই যে একচেটিয়া বোর্ডে কিছু সম্পত্তি অন্যদের তুলনায় বেশিবার পরিদর্শন করা হয় কিনা। একটি মন্টি কার্লো পরীক্ষায় বারবার পাশা ঘুরিয়ে দেওয়া এবং প্রতিটি সম্পত্তিতে আপনি কত বার নামাবেন তা গণনা করা জড়িত। এটি সংখ্যার ইন্টিগ্রাল গণনা করার জন্যও ব্যবহার করা যেতে পারে। (খুব অনানুষ্ঠানিকভাবে, আমরা কোনও ফাংশনের গ্রাফের আওতাধীন অঞ্চল হিসাবে অবিচ্ছেদ্যর কথা ভাবতে পারি। ) মন্টি কার্লো ইন্টিগ্রেশন ফাংশনের পয়েন্টগুলির এলোমেলো নমুনা গ্রহণ করে এবং এই বিভিন্ন পয়েন্টে এক ধরণের গড় গণনা করে একটি উচ্চ-মাত্রিক ফাংশনে দুর্দান্ত কাজ করে। নমুনার আকার বাড়াতে, বিপুল সংখ্যার আইন আমাদের জানায় যে আমরা আরও বেশি বেশি ফাংশনটি coveringেকে আমাদের সান্নিধ্যের নির্ভুলতা বাড়াতে পারি।
এই দুটি ধারণাগুলি একসাথে রাখা যেতে পারে যেমন বয়েশিয়ান অনুমিতি, গণনামূলক জীববিজ্ঞান ইত্যাদির মতো কিছু সমস্যাগুলিকে সমাধান করার জন্য যেখানে সাধারণ সমস্যাগুলি সমাধান করার জন্য বহু-মাত্রিক ইন্টিগ্রালগুলি গণনা করা প্রয়োজন। ধারণাটি হল একটি মার্কভ চেইন নির্মাণ করা যা বেশ কয়েকটি পদক্ষেপের পরে পছন্দসই সম্ভাবনা বিতরণে রূপান্তরিত করে। বিপুল সংখ্যক পদক্ষেপের পরে চেইনের রাজ্যটি পছন্দসই বিতরণ থেকে নমুনা হিসাবে ব্যবহৃত হয় এবং প্রক্রিয়াটি পুনরাবৃত্তি হয়। অনেকগুলি MCMC অ্যালগরিদম রয়েছে যা মার্কভ চেইন তৈরির জন্য বিভিন্ন কৌশল ব্যবহার করে। সাধারণগুলির মধ্যে রয়েছে মেট্রোপলিস-হেস্টিংস এবং গিবস সাম্পার ler
হ্যাকারদের জন্য বয়েসিয়ান পদ্ধতিগুলি থেকে কিছু অংশ
যখন আমরা অজানাগুলির সাথে কোনও বয়েশিয়ান অনুমানের সমস্যা সেটআপ করি তখন আমরা পূর্বের বিতরণগুলির উপস্থিতির জন্য স্পষ্টভাবে একটি মাত্রিক স্থান তৈরি করি the স্থানের সাথে যুক্ত হওয়া একটি অতিরিক্ত মাত্রা, যা আমরা স্থানটির পৃষ্ঠ বা বাঁক হিসাবে বর্ণনা করতে পারি can , এটি একটি নির্দিষ্ট পয়েন্টের পূর্ব সম্ভাবনা প্রতিফলিত করে । স্থানটির পৃষ্ঠটি আমাদের পূর্ববর্তী বিতরণ দ্বারা সংজ্ঞায়িত করা হয়। উদাহরণস্বরূপ, যদি আমাদের দুটি অজানা এবং এবং উভয়ই [0,5] এ সমান হয় তবে তৈরি স্থানটি দৈর্ঘ্যের 5 বর্গ এবং পৃষ্ঠটি একটি সমতল সমতল যা বর্গক্ষেত্রের শীর্ষে বসে (প্রতিটি পয়েন্ট প্রতিনিধিত্ব করে) সমান সম্ভাবনা রয়েছে)।
বিকল্পভাবে, যদি দুটি প্রিয়ার এবং তবে স্পেসটি 2-ডি বিমানের সমস্ত ধনাত্মক সংখ্যা এবং প্রিয়ারদের দ্বারা প্ররোচিত পৃষ্ঠটি পানির মতো দেখায় পতন যা বিন্দুতে শুরু হয় (0,0) এবং ধনাত্মক সংখ্যার উপরে প্রবাহিত হয়।
নীচের চাক্ষুষটি এটি দেখায়। যত গা dark় লাল রঙ হবে, অজানা লোকেরা সেই স্থানে রয়েছে তার পূর্বের সম্ভাবনা তত বেশি। বিপরীতে, গা blue় নীল রঙের অঞ্চলগুলি প্রতিনিধিত্ব করে যে আমাদের প্রিরিয়াররা সেখানে অজানাদের খুব কম সম্ভাবনা দেয় prob
এগুলি 2 ডি স্পেসের সহজ উদাহরণ, যেখানে আমাদের মস্তিষ্কগুলি পৃষ্ঠগুলি ভালভাবে বুঝতে পারে। অনুশীলনে, আমাদের প্রিরিয়ারদের দ্বারা উত্পন্ন স্পেস এবং পৃষ্ঠগুলি অনেক বেশি মাত্রিক হতে পারে।
যদি এই পৃষ্ঠগুলি অজানাগুলিতে আমাদের পূর্বের বিতরণগুলি বর্ণনা করে তবে আমরা পর্যবেক্ষণ করার পরে আমাদের স্পেসে কী ঘটবে । ডেটা স্থান পরিবর্তন করে না, তবে এটি সত্যের পরামিতিগুলি কোথায় থাকে তা প্রতিবিম্বিত করার জন্য পৃষ্ঠের ফ্যাব্রিকটি টানতে এবং প্রসারিত করে স্থানটির পৃষ্ঠকে পরিবর্তন করে। আরও ডেটা মানে আরও টানা এবং প্রসারিত করা এবং নতুন রূপের আকারের তুলনায় আমাদের আসল আকারটি ম্যাঙ্গেল বা তুচ্ছ হয়ে যায়। কম ডেটা, এবং আমাদের মূল আকৃতি আরও উপস্থিত। নির্বিশেষে, ফলস্বরূপ পৃষ্ঠটি উত্তরোত্তর বিতরণ বর্ণনা করে । আবার আমার জোর করতে হবে যে দুর্ভাগ্যক্রমে, এটি বৃহত্তর মাত্রায় কল্পনা করা অসম্ভব। দুটি মাত্রার জন্য, ডেটা মূলতলম্বা পাহাড় তৈরি করতে মূল পৃষ্ঠটিকে ধাক্কা দেয় । পূর্বের সম্ভাবনার দ্বারা ধাক্কা দেওয়ার পরিমাণটি প্রতিরোধ করা হয়, যাতে কম পূর্বের সম্ভাবনাটি আরও প্রতিরোধের হয়। সুতরাং উপরের দ্বিগুণ তাত্পর্যপূর্ণ-পূর্বের ক্ষেত্রে, একটি পর্বত (বা একাধিক পর্বত) যে (0,0) কোণে প্রস্ফুটিত হতে পারে যেগুলি পর্বতমালার (5,5) এর নিকটে প্রস্ফুটিত হবে তার চেয়ে অনেক বেশি উঁচু হবে, কারণ সেখানে আরও প্রতিরোধের উপস্থিতি রয়েছে (5,5)। পর্বত বা সম্ভবত আরও সাধারণভাবে, পর্বতশ্রেণীগুলি যেখানে সত্যিকারের পরামিতিগুলির সন্ধানের সম্ভাবনা রয়েছে তার উত্তরোত্তর সম্ভাবনা প্রতিফলিত করে।
ধরুন উপরে বর্ণিত দুটি পয়সন বিতরণের বিভিন্ন পরামিতি উপস্থাপন করে । আমরা কয়েকটি ডেটা পয়েন্ট পর্যবেক্ষণ করি এবং নতুন ল্যান্ডস্কেপটি ভিজ্যুয়ালাইজ করি।
বাম দিকের প্লটটি হ'ল প্রিরিয়ারগুলির সাথে বিকৃত ল্যান্ডস্কেপ এবং ডান দিকের প্লটটি হ'ল ঘৃণ্য প্রিয়ারগুলির সাথে বিকৃত ল্যান্ডস্কেপ। উত্তরোত্তর ল্যান্ডস্কেপগুলি একে অপরের থেকে পৃথক দেখাচ্ছে। ঘৃণ্য-পূর্ব প্রাকৃতিক দৃশ্যটি উপরের ডান কোণে মানগুলির উপর খুব সামান্য ওজন রাখে: এটি কারণ পূর্ববর্তী সেখানে খুব বেশি ওজন রাখে না , যেখানে অভিন্ন-পূর্বের প্রাকৃতিক দৃশ্য সেখানে উত্তরোত্তর ওজন রেখে খুশি। এছাড়াও, সর্বাধিক পয়েন্টটি, গা the়তম লাল বর্ণের সাথে সম্পর্কিত, ঘনিষ্ঠ বর্ণের ক্ষেত্রে (0,0) দিকে পক্ষপাতদুষ্ট, যা ঘনিষ্ঠভাবে পূর্বে (0,0) কোণায় পূর্ববর্তী উইগটি রাখার ফলস্বরূপ।
কালো বিন্দুটি সত্য পরামিতিগুলি উপস্থাপন করে। এমনকি 1 টি নমুনা বিন্দু সহ, উপরে যা অনুকরণ করা হয়েছিল, পর্বতগুলি সত্য পরামিতি ধারণ করার চেষ্টা করে। অবশ্যই, 1 টির একটি নমুনা আকারের সাথে অনুকরণ অবিশ্বাস্যভাবে নিষ্পাপ এবং এ জাতীয় ছোট নমুনা আকারটি বেছে নেওয়া কেবল চিত্রিতই ছিল।
পশ্চিমা পর্বতমালা সন্ধানের জন্য আমাদের আমাদের পূর্বের পৃষ্ঠের দ্বারা উত্পন্ন বিকৃত উত্তরীয় স্থানটি পর্যবেক্ষণ করা উচিত এবং পর্যবেক্ষণ করা ডেটা। যাইহোক, আমরা naively স্থান অনুসন্ধান করতে পারেন: যে কোন কম্পিউটার বিজ্ঞানী আপনাকে বলবে যে ঢোঁড়ন -dimensional মহাকাশে ব্যাখ্যা মূলকভাবে কঠিন : স্থান আকার দ্রুত বয়-আপ হিসাবে আমরা বৃদ্ধি (দেখুন মাত্রা অভিশাপ )। এই লুকিয়ে থাকা পাহাড়গুলি পাওয়ার জন্য আমাদের কী আশা আছে? MCMC এর পিছনে ধারণাটি স্থানটির বুদ্ধিমান অনুসন্ধান করা। "অনুসন্ধান" বলতে ইঙ্গিত দেয় আমরা একটি নির্দিষ্ট বস্তুর সন্ধান করছি, যা সম্ভবত এমসিএমসি কী করছে তার সঠিক বিবরণ নয়। প্রত্যাহার: এমসিএমসি নমুনা ফিরিয়ে দেয়উত্তর বিতরণ থেকে, বিতরণ নিজেই নয়। আমাদের পাহাড়ী উপমাটিকে তার সীমাতে প্রসারিত করে, এমসিসিএম বারবার জিজ্ঞাসা করার অনুরূপ একটি কাজ সম্পাদন করে "আমি যে পাহাড়ের তল্লাশী খুঁজে পেয়েছি তা কতটা সম্ভব?", এবং পুনর্গঠনের আশায় হাজার হাজার স্বীকৃত নুড়ি ফিরিয়ে কাজটি সম্পন্ন করে আসল পর্বত। এমসিএমসি এবং পাইএমসি লিঙ্গোতে, "নুড়ি" এর প্রত্যাবর্তিত অনুক্রমটি নমুনা, যাকে প্রায়শই ট্রেস বলা হয় ।
আমি যখন বলি এমসিসিএম বুদ্ধিমানভাবে অনুসন্ধান করে, আমার অর্থ এমসিএমসি আশা করে উচ্চতর উত্তরোত্তর সম্ভাবনার ক্ষেত্রগুলিতে রূপান্তর করবে । এমসিএমসি এটি কাছাকাছি অবস্থানগুলি অন্বেষণ করে এবং উচ্চতর সম্ভাবনাযুক্ত অঞ্চলে সরিয়ে নিয়ে এটি করে। আবার, সম্ভবত এমসিএমসির অগ্রগতি বর্ণনা করার জন্য "কনভার্জ" কোনও সঠিক শব্দ নয়। রূপান্তরটি সাধারণত মহাকাশের পয়েন্টের দিকে অগ্রসর হওয়া বোঝায়, তবে এমসিসিসি মহাকাশের বিস্তৃত অঞ্চলের দিকে অগ্রসর হয় এবং এ অঞ্চল থেকে এলোমেলোভাবে হাঁটাচলা করে সেই অঞ্চল থেকে নমুনা তুলে নেয়।
প্রথমে, হাজার হাজার নমুনা ব্যবহারকারীর কাছে ফিরিয়ে দেওয়া উত্তরবর্তী বিতরণগুলি বর্ণনা করার জন্য একটি অদক্ষ উপায় বলে মনে হতে পারে। আমি তর্ক করব যে এটি অত্যন্ত দক্ষ। বিকল্প সম্ভাবনা বিবেচনা করুন ::
গণনামূলক কারণ ছাড়াও, সম্ভবত নমুনাগুলি ফিরিয়ে আনার সবচেয়ে শক্তিশালী কারণ হ'ল আমরা অন্যথায় বিরক্তিকর সমস্যাগুলি সমাধান করতে সহজেই বৃহত সংখ্যাগুলির আইনটি ব্যবহার করতে পারি । আমি এই আলোচনাটি পরবর্তী অধ্যায়ে স্থগিত করি।
অ্যালগরিদমের একটি বৃহত পরিবার রয়েছে যা এমসিসিএম সম্পাদন করে। সহজভাবে, বেশিরভাগ অ্যালগরিদমগুলি নিম্ন স্তরে প্রকাশ করা যায়:
1. Start at current position.
2. Propose moving to a new position (investigate a pebble near you ).
3. Accept the position based on the position's adherence to the data
and prior distributions (ask if the pebble likely came from the mountain).
4. If you accept: Move to the new position. Return to Step 1.
5. After a large number of iterations, return the positions.
এইভাবে আমরা সেই অঞ্চলগুলির দিকে সাধারণ দিকে এগিয়ে যাই যেখানে উত্তরোত্তর বিতরণ রয়েছে এবং যাত্রায় অল্প কিছুটা নমুনা সংগ্রহ করি। একবার আমরা উত্তরোত্তর বিতরণে পৌঁছে গেলে, আমরা সহজেই নমুনাগুলি সংগ্রহ করতে পারি কারণ সেগুলি সম্ভবত সমস্ত উত্তরোত্তর বিতরণের অন্তর্ভুক্ত।
যদি এমসিসিএমের অ্যালগরিদমের বর্তমান অবস্থানটি অত্যন্ত কম সম্ভাবনার ক্ষেত্রে থাকে, যা সাধারণত যখন অ্যালগরিদম শুরু হয় তখন ঘটে থাকে (সাধারণত স্থানটিতে একটি এলোমেলো স্থানে), অ্যালগরিদম সম্ভবত এমন অবস্থানগুলিতে স্থানান্তরিত হবে যা সম্ভবত উত্তরোত্তর থেকে নয় are তবে কাছের সমস্ত কিছুর চেয়ে ভাল। সুতরাং অ্যালগরিদমের প্রথম চালগুলি উত্তরোত্তর প্রতিফলিত হয় না।
সুতরাং এখানে পরিসংখ্যান / সম্ভাব্য পাঠ্যপুস্তক, উইকিপিডিয়া ইত্যাদির দ্বারা বর্ণিত প্রচুর উত্তর রয়েছে I আমি বিশ্বাস করি যেখানে আমি কাজ করি সেখানে আমাদের "ল্যাপারসন" রয়েছে; আমি মনে করি তারা বিপণন বিভাগে আছে। যদি আমাকে তাদের কাছে কোনও প্রযুক্তিগত কিছু ব্যাখ্যা করতে হয় তবে আমি "শো না বলুন" বিধিটি প্রয়োগ করি। সেই নিয়মটি মাথায় রেখে আমি তাদের সম্ভবত এটির মতো কিছু দেখাব।
এখানে ধারণাটি হল এমন একটি অ্যালগরিদম কোড করার চেষ্টা করা যা আমি বানানটি শিখাতে পারি - শত শত (হাজার?) সমস্ত নিয়ম শিখার দ্বারা নয় যেমন নীরব ইয়ের সাথে শেষ হওয়া কোনও শব্দের একটি শেষ যুক্ত করার পরে, চূড়ান্ত ই বাদ দিন যদি শেষটি স্বর দিয়ে শুরু হয় । কাজ না করার একটি কারণ হ'ল আমি এই নিয়মগুলি জানি না (আমি নিশ্চিত যে আমি কেবল আবৃত্তি করেছি তা সঠিক কিনা)। পরিবর্তে আমি এটিকে বানান বলতে শিখিয়ে যাচ্ছি তা সঠিকভাবে বানানযুক্ত শব্দের একগুচ্ছ দেখিয়ে এবং সেই শব্দগুলি থেকে নিয়মগুলি বের করতে দিয়ে যা অ্যালগরিদম নির্বিশেষে মেশিন লার্নিংয়ের সারমর্ম - প্যাটার্ন নিষ্কাশন এবং প্যাটার্ন স্বীকৃতি ।
সাফল্যের মানদণ্ডটি এমন কোনও শব্দের বানান যা সঠিকভাবে অ্যালগরিদম এর আগে কখনও দেখেনি (আমি বুঝতে পারি যে শুদ্ধ সুযোগ দ্বারা ঘটতে পারে, তবে বিপণনকারীদের সাথে তা ঘটবে না, তাই আমি উপেক্ষা করব - আরও আমি অ্যালগরিদম পেতে যাচ্ছি একটি শব্দ নয়, প্রচুর পরিমাণে বানান করার চেষ্টা করুন, তাই সম্ভবত কয়েকটি ভাগ্যবান অনুমানের দ্বারা আমরা প্রতারিত হব না)।
একটি ঘন্টা বা আগে, আমি চমৎকার প্রজেক্ট গুটেনবার্গ সাইট, হারমান হেস উপন্যাস থেকে (ক প্লেইন টেক্সট ফাইল হিসাবে) ডাউনলোড করা সিদ্ধার্থ । আমি এই উপন্যাসে শব্দগুলি কীভাবে বানান তা শিখতে অ্যালগরিদমটি ব্যবহার করব।
সুতরাং আমি এই উপন্যাসটি স্ক্যান করে নীচে অ্যালগরিদম কোড করেছিলাম, একবারে তিনটি অক্ষর (প্রতিটি শব্দের শেষে একটি অতিরিক্ত অক্ষর রয়েছে, যা 'সাদা অংশ' বা শব্দের শেষে)। ত্রি-বর্ণের অনুক্রম আপনাকে অনেক কিছু বলতে পারে - উদাহরণস্বরূপ, 'কি' অক্ষরটি প্রায় সবসময় 'ইউ' এর পরে থাকে; ক্রম 'ty' সাধারণত একটি শব্দের শেষে ঘটে; z খুব কমই করে এবং তাই করে। (দ্রষ্টব্য: সম্পূর্ণ বাক্যে কথা বলার প্রশিক্ষণ দেওয়ার জন্য আমি কেবল সহজেই পুরো শব্দটি খাওয়াতে পারতাম - ঠিক একই ধারণা, কোডটিতে কিছুটা টুইট))
এর কোনওটিই এমসিসিএমির সাথে জড়িত না, যদিও তা প্রশিক্ষণের পরে ঘটে, যখন আমরা অ্যালগরিদমকে কয়েকটি এলোমেলো চিঠি (বীজ হিসাবে) দেই এবং এটি 'শব্দ' গঠন শুরু করে। অ্যালগরিদম কীভাবে শব্দ তৈরি করে? কল্পনা করুন যে এটিতে 'কোয়া' ব্লক রয়েছে; এটি আর কোন চিঠি যুক্ত করে? প্রশিক্ষণের সময়, অ্যালগরিদম উপন্যাসের হাজার হাজার শব্দের সমস্ত থেকে একটি বিশাল l * ইটার-সিকোয়েন্স ফ্রিকোয়েন্সি ম্যাট্রিক্স * নির্মাণ করেছিলেন constructed সেই ম্যাট্রিক্সের কোথাও তিন অক্ষরের ব্লক 'কোয়া' এবং ক্রমিকগুলি অনুসরণ করতে পারে এমন অক্ষরের ফ্রিকোয়েন্সি। অ্যালগরিদম সেই ফ্রিকোয়েন্সিগুলির উপর ভিত্তি করে একটি চিঠি নির্বাচন করে যা সম্ভবত এটি অনুসরণ করতে পারে। সুতরাং অ্যালগরিদম পরবর্তী যে চিঠিটি নির্বাচন করে তার উপর নির্ভর করে - এবং কেবলমাত্র - তার শব্দ-নির্মাণ সারিতে শেষ তিনটি।
সুতরাং এটি একটি মার্কভ চেইন মন্টি কার্লো অ্যালগরিদম।
আমি মনে করি এটি কীভাবে কাজ করে তা বোঝানোর সর্বোত্তম উপায় হ'ল বিভিন্ন স্তরের প্রশিক্ষণের উপর ভিত্তি করে ফলাফলগুলি দেখানো। প্রশিক্ষণ স্তরটি উপন্যাসের দ্বারা তৈরি করা অ্যালগরিদম পাসের সংখ্যা পরিবর্তনের মাধ্যমে পরিবর্তিত হয় - যত বেশি পাস তার অক্ষরের অনুক্রমের ফ্রিকোয়েন্সি ম্যাট্রিক্সের তত বেশি বিশ্বস্ততা বোধ করে। 'সিদ্ধার্থ' উপন্যাসটি প্রশিক্ষণের পরে - অ্যালগরিদমের 100 অক্ষরের স্ট্রিং আউটপুট আকারে - নীচে ফলাফলগুলি রয়েছে।
উপন্যাসের একক পাস, সিদ্ধার্থ :
তারপরে হুইস জীবাণু সমস্ত মোথ্যানি স্ট্যান্ড এআর আপনি লিভিড থিয়েটারিম কাঁচা আত্মঘাতীতা ভয়ে তার সিলেক্ট তার
(সরাসরি, এটি প্রায় নিখুঁত ওয়েলশ ভাষায় কথা বলতে শিখেছে; আমি এটি আশা করিনি))
উপন্যাসটি দুটি পাস করার পরে:
আক্ক ওয়ার ওয়ার্ক প্রিন্সিঙ্কিথ শোটি ছিল একটি দ্বৈত তৃতীয় থিয়েটিন ল্যান্ড র্যাথিংল সেখানে ওভ
10 পাসের পরে:
তবুও এসিকে দিয়ে প্রার্থনা করা উচিত এখন তার কুকুরের লিভার ব্যথার ফুট দুধের দুর্বল স্মৃতি নয় have
এবং কোডটি এখানে রয়েছে (পাইথনে আমি প্রায় নিশ্চিত হয়েছি যে এমসিসিএম প্যাকেজটি ব্যবহার করে এটি আর-তে করা যেতে পারে, যার মধ্যে বেশিরভাগ রয়েছে মাত্র 3-4 লাইনে)
def create_words_string(raw_string) :
""" in case I wanted to use training data in sentence/paragraph form;
this function will parse a raw text string into a nice list of words;
filtering: keep only words having more than 3 letters and remove
punctuation, etc.
"""
pattern = r'\b[A-Za-z]{3,}\b'
pat_obj = re.compile(pattern)
words = [ word.lower() for word in pat_obj.findall(raw_string) ]
pattern = r'\b[vixlm]+\b'
pat_obj = re.compile(pattern)
return " ".join([ word for word in words if not pat_obj.search(word) ])
def create_markov_dict(words_string):
# initialize variables
wb1, wb2, wb3 = " ", " ", " "
l1, l2, l3 = wb1, wb2, wb3
dx = {}
for ch in words_string :
dx.setdefault( (l1, l2, l3), [] ).append(ch)
l1, l2, l3 = l2, l3, ch
return dx
def generate_newtext(markov_dict) :
simulated_text = ""
l1, l2, l3 = " ", " ", " "
for c in range(100) :
next_letter = sample( markov_dict[(l1, l2, l3)], 1)[0]
simulated_text += next_letter
l1, l2, l3 = l2, l3, next_letter
return simulated_text
if __name__=="__main__" :
# n = number of passes through the training text
n = 1
q1 = create_words_string(n * raw_str)
q2 = create_markov_dict(q1)
q3 = generate_newtext(q2)
print(q3)
এমসিএমসি সাধারণত অপরিশোধিত মন্টি কার্লো সিমুলেশন কৌশলগুলির বিকল্প হিসাবে ব্যবহৃত হয়। এমসিএমসি এবং অন্যান্য মন্টি কার্লো উভয় কৌশলই কঠিন ইন্টিগ্রালগুলি মূল্যায়নের জন্য ব্যবহৃত হয় তবে এমসিএমসি আরও সাধারণভাবে ব্যবহার করা যায়।
উদাহরণস্বরূপ, পরিসংখ্যানগুলির একটি সাধারণ সমস্যা হ'ল কিছু সম্ভাব্য / স্টোকাস্টিক মডেল সম্পর্কিত গড় ফলাফল গণনা করা। এমসিএমসি এবং মন্টি কার্লো উভয় কৌশলই প্রকৃত ফলাফলের অনুক্রম তৈরি করে এই সমস্যাটি সমাধান করবে যা আমরা সত্যিকারের গড়টি অনুমান করতে ব্যবহার করতে পারি।
এমসিএমসি এবং অপরিশোধিত মন্টি কার্লো উভয় কৌশলই দীর্ঘমেয়াদে অনুপাতের অনুপাত হিসাবে কাজ করে যা নির্দিষ্ট ফলাফলের সমান হয় that ফলাফলের মডেলিং সম্ভাবনার সমান হয়। অতএব, পর্যাপ্ত পরিমাণে সিমুলেশন তৈরি করে, উভয় পদ্ধতির দ্বারা উত্পাদিত ফলাফলগুলি সঠিক হবে।
* আমি সমান বলি যদিও সাধারণভাবে আমার পরিমাপযোগ্য সেটগুলি সম্পর্কে কথা বলা উচিত। একটি ল্যাপারসন অবশ্য এই * তে আগ্রহী হবেন না
যাইহোক, অপরিশোধিত মন্টি কার্লো অনেকগুলি স্বতন্ত্র সিমুলেশন উত্পাদন করতে জড়িত, যার প্রত্যেকটি মডেল বিতরণ অনুযায়ী বিতরণ করা হয়েছে, এমসিসিএম একটি এলোমেলো পদচারণা জড়িত যা দীর্ঘমেয়াদে প্রতিটি ফলাফলকে কাঙ্ক্ষিত ফ্রিকোয়েন্সি সহ "পরিদর্শন" করে।
এমসএমসির কৌশলটি, তাই এলোমেলো পদক্ষেপ গ্রহণ করছে যা প্রতিটি ফলাফলকে পছন্দসই দীর্ঘমেয়াদে চালিত ফ্রিকোয়েন্সি সহ "পরিদর্শন" করবে।
একটি সাধারণ উদাহরণ হতে পারে এমন একটি মডেল থেকে অনুকরণ করা যা বলে যে "এ" ফলাফলের সম্ভাবনা 0.5 এবং ফলাফলটির "বি" 0.5 হয় 0.5 এই ক্ষেত্রে, যদি আমি অবস্থান "এ" এ এলোমেলো হাঁটা শুরু করে এবং নির্দেশ দিয়েছি যে প্রতিটি পদক্ষেপে এটি সম্ভাব্যতা 0.2 (বা 0 এর চেয়ে বড় যে কোনও সম্ভাবনা) সহ অন্য অবস্থানে চলে গেছে, আমি নিশ্চিত হতে পারি যে বড় পরে আমাদের মডেল দ্বারা নির্ধারিত সম্ভাবনার সাথে সামঞ্জস্য রেখে এলোমেলো পদক্ষেপের প্রায় 50% পদক্ষেপে এ "এ" এবং "বি" এর প্রত্যেকটিতে পরিদর্শন করা হত steps
এটি অবশ্যই খুব বিরক্তিকর উদাহরণ। তবে দেখা যাচ্ছে যে এমসিএমসি প্রায়শই এমন পরিস্থিতিতে প্রযোজ্য যেখানে স্ট্যান্ডার্ড মন্টি কার্লো বা অন্যান্য কৌশল প্রয়োগ করা কঠিন।
আপনি এখানে একটি নিবন্ধ আবিষ্কার করতে পারেন যা এটি কী এবং এটি এখানে কেন কাজ করে তার মূল বিষয়গুলি অন্তর্ভুক্ত করে:
আমি একজন ডিএনএ বিশ্লেষক যা ডিএনএ প্রমাণের ব্যাখ্যার জন্য সম্পূর্ণ ক্রমাগত সম্ভাব্য জিনোটাইপিং সফ্টওয়্যার ব্যবহার করে এবং আমাকে কীভাবে এটি জুরির পক্ষে কাজ করে তা ব্যাখ্যা করতে হবে। স্বীকারযোগ্যভাবে, আমরা অতিরিক্ত সরলকরণ করেছি এবং আমি সামগ্রিক বোঝার উন্নতির নামে নির্দিষ্ট বিবরণের যথাযথতার চেয়ে এই সরলকরণের ত্যাগ করি realize তবে, এই প্রক্রিয়াটি কীভাবে ডিএনএ ব্যাখ্যায় একাডেমিক ডিগ্রি এবং বছর বয়সের পেশাদার অভিজ্ঞতা ছাড়াই ব্যবহার করা হয় তা বোঝার এক জুরির প্রসঙ্গে, তারা সংক্ষেপে জানায় :)
ব্যাকগ্রাউন্ড: সফ্টওয়্যারটিতে মেট্রোপলিস হাস্টিংস এমসিএমসি এবং একটি জৈবিক মডেল ব্যবহার করা হয় যা ডিএনএ প্রোফাইলগুলির জ্ঞাত আচরণের নকল করে (মডেলটি অজানা কেস ওয়ার্কের মধ্যে উপস্থিত রেঞ্জের প্রতিনিধিত্বকারী পরিচিত শর্তগুলি থেকে অনেক ডিএনএ প্রোফাইল বিশ্লেষণ করে পরীক্ষাগার দ্বারা উত্পন্ন বৈধতা ডেটার উপর ভিত্তি করে তৈরি করা হয়)। এখানে 8 টি স্বতন্ত্র চেইন রয়েছে এবং বার্ন বাড়ানো এবং পোষ্ট গ্রহণযোগ্যতা পুনরায় চালানো যায় কিনা তা নির্ধারণের জন্য আমরা রূপান্তরটি মূল্যায়ন করি (ডিফল্ট বার্নিন 100 কে গ্রহণ করে 400k গ্রহণ করে)
MCMC সম্পর্কে প্রসিকিউশন / প্রতিরক্ষা দ্বারা জিজ্ঞাসা করা হলে: আমরা এটি ব্যাখ্যা করি যে এটি মার্কভ চেইন মন্টি কার্লো সম্পর্কিত এবং জটিল সমস্যা সমাধানের জন্য ব্যবহৃত একটি বিশেষ শ্রেণি / ধরণের অ্যালগরিদমকে উপস্থাপন করে এবং একটি অ্যালগোরিদম কেবল একটি অভিনব শব্দ যা বিভিন্ন প্রক্রিয়া বা রুটিনের উল্লেখ করে ring একটি কম্পিউটার দ্বারা পরিচালিত ... এমএমসিসি অ্যালগরিদমগুলি একটি সমাধান প্রস্তাব করে, সেই সমাধানটি অনুকরণ করে পরিচালিত করে, তারপরে মূল্যায়ন করে যে সিমুলেশনটি প্রকৃত প্রমাণের ডেটা পর্যবেক্ষণ করা হচ্ছে তা কতটা ভালভাবে আয়না করে ... প্রমাণের পর্যবেক্ষণ ভালভাবে ফিট করে এমন একটি সিমুলেশন একটির চেয়ে বেশি সম্ভাবনা রয়েছে has সিমুলেশন যা পর্যবেক্ষণ ভালভাবে ফিট করে না ... প্রস্তাবিত সমাধানগুলির বহু পুনরাবৃত্ত নমুনা / অনুমানের উপরে, মার্কোভ চেইনগুলি কম সম্ভাবনার সমাধানগুলি থেকে উচ্চ সম্ভাব্যতার সমাধানগুলির দিকে সরে যায় যা পর্যবেক্ষিত প্রমাণের প্রোফাইলটিকে আরও ভাল ফিট করে / ব্যাখ্যা করে, অবশেষে ভারসাম্যহীনতা না হওয়া পর্যন্ত অর্জন,মানে অ্যালগরিদমের উল্লেখযোগ্য পরিমাণে বর্ধিত সম্ভাবনা পাওয়া নতুন প্রস্তাবগুলির নমুনার সীমাবদ্ধ ক্ষমতা রয়েছে
মেট্রোপলিস হেস্টিংস সম্পর্কে জিজ্ঞাসা করা হলে: আমরা প্রস্তাবটি গ্রহণ বা প্রত্যাখ্যান করার সিদ্ধান্ত গ্রহণ প্রক্রিয়া বর্ণনা করে এটি এমসিএমসি অ্যালগরিদমকে পরিমার্জনীয় বলে ব্যাখ্যা করি ... সাধারণত এটি "গরম / ঠান্ডা" শিশুদের খেলার উপমা দিয়ে ব্যাখ্যা করা হয় তবে আমি সম্ভবত "ব্যবহার করে বিবেচনা করেছি" ডান বা বাম সোয়াইপ করুন "যখন জুরিটি বিশেষত তরুণ হয় !! : p তবে আমাদের উত্তপ্ত / শীতল উপমা ব্যবহার করে আমরা সর্বদা একটি গরম অনুমান গ্রহণ করি এবং মাঝে মাঝে একটি শীতল অনুমান গ্রহণ করি এবং মাঝে মধ্যে শীতল অনুমান গ্রহণের উদ্দেশ্যটি ব্যাখ্যা করি যে শৃঙ্খলার নমুনাটিকে বিস্তৃত সম্ভাবনার এক বিস্তৃত পরিসীমা নিশ্চিত করা ensure প্রকৃত ভারসাম্যের আগে একটি নির্দিষ্ট প্রস্তাব আটকে যাওয়ার বিরোধিতা to
যুক্ত / স্পষ্ট করার জন্য সম্পাদিত: গরম / শীতল উপমা সহ আমরা ব্যাখ্যা করি যে বাচ্চাদের খেলায়, নেতা ঘরের মধ্যে একটি লক্ষ্য বস্তু / ক্ষেত্র বেছে নেয় এবং খেলোয়াড়রা তাদের বর্তমান অবস্থান / অবস্থানের তুলনায় কোন দিকে এগিয়ে যায় সে অনুমানগুলি করে turns নেত্রী তাদের বলছেন যে তাদের অবস্থান পরিবর্তন করুন / সরল অনুমান করা হলে চালচলন করুন এবং যদি শীতল অনুমান হয় তবে তারা তাদের পালা / পজিশনে থেকে যায়। একইভাবে, আমাদের সফ্টওয়্যারটির মধ্যে, স্থানান্তরিত / গ্রহণের সিদ্ধান্তটি বর্তমানে অবস্থিত পজিশনের সম্ভাবনার তুলনায় প্রস্তাবের সম্ভাবনার উপর নির্ভর করে ... তবুও লক্ষ্যটি বাচ্চাদের খেলায় নেতৃত্বের দ্বারা পূর্বনির্ধারিত / জানা থাকে যেখানে আমাদের সফ্টওয়্যারটির মধ্যে লক্ষ্যটি পূর্বনির্ধারিত নয় - এটি সম্পূর্ণ অজানা (এটি কেন এটিও '
আমি যেমন বলেছিলাম, সুপার সুপার বুনিয়াদী এবং বোধগম্যতার উন্নতির জন্য প্রযুক্তিগত বিশদটির একেবারে অভাব রয়েছে - আমরা একটি মধ্য-স্কুল স্তরের শিক্ষার ব্যাখ্যা দেওয়ার জন্য প্রচেষ্টা করি ve পরামর্শ নির্দ্বিধায়। আমি তাদের অন্তর্ভুক্ত করব।
এই প্রশ্নটি বিস্তৃত তবে উত্তরগুলি প্রায়শই বেশ নৈমিত্তিক। বিকল্পভাবে, আপনি এই কাগজটি দেখতে পাচ্ছেন যা মেট্রোপলিস-হেস্টিংস অ্যালগরিদমস, গীবস স্যাম্পলিং, মহানগর-অভ্যন্তর-গিবস এবং সহায়ক ভেরিয়েবল পদ্ধতি, স্লাইস স্যাম্পলিং, পুনরাবৃত্তিমূলক প্রস্তাবনা, দিশারী নমুনা, ল্যাঙ্গভিন এবং একটি এমসিএমসি অ্যালগরিদমের বিস্তৃত শ্রেণির সংক্ষিপ্ত গাণিতিক বিবরণ দেয় this হ্যামিলটোনীয় মন্টি কার্লো, নুটিএসের নমুনা, সিউডো-প্রান্তিক মহানগর-হেস্টিংস অ্যালগরিদম এবং সিউডো-প্রান্তিক হ্যামিলটনিয়ান মন্টি কার্লো, যেমনটি লেখকরা আলোচিত ছিলেন।
একটি বিশ্বাসযোগ্য পর্যালোচনা এখানে দেওয়া হয়
স্ট্যাকেক্সচেঞ্জের ফর্ম্যাটে এর বিষয়বস্তু বিশদ দেওয়ার জন্য আমি আরও সময় পাব।
প্রথমে আমাদের মন্টে-কার্লো নমুনাটি ল্যাপারসনের কাছে ব্যাখ্যা করা উচিত। কল্পনা করুন যখন আপনার কোনও ফাংশনের সঠিক রূপ নেই (উদাহরণস্বরূপ, ) তবে ইউরোপে একটি মেশিন রয়েছে (এবং লস আলামোস) যা প্রতিলিপি করে এই ফাংশন (সংখ্যাগতভাবে) আমরা এতে অনেকগুলি জোড়া রাখতে পারি এবং এটি আমাদের z টি মান দেয়। এই সংখ্যার পুনরাবৃত্তি নমুনা দেয় এবং এই প্রক্রিয়াটি মন্টে-কার্লো সিমুলেশন । 1,0000 পুনরাবৃত্তির পরে, আমরা প্রায় জানি ফাংশনটি কী।
ল্যাপারসন মন্টি-কার্লোকে জেনে ধরেছে, এমসিএমসিতে আপনি যখন কোনও বহুমাত্রিক স্থান থেকে স্যাম্পল করছেন তখন আপনার সিপিইউ প্রচেষ্টা / সময় নষ্ট করতে চান না , মান্ট-কার্লো নমুনা হিসাবে। মূল পার্থক্যটি হ'ল এমসিএমসিতে আপনার প্রচেষ্টা পরিচালনার জন্য মানচিত্র হিসাবে আপনার কাছে একটি মার্কভ-চেইন থাকা দরকার।
এই ভিডিওটির (5:50 এ শুরু) অন্তর্দৃষ্টি সম্পর্কে খুব ভাল বিবৃতি রয়েছে।
আপনি এই ছবিতে সবুজ (বহু-মাত্রিক) শাখায় থাকা পয়েন্টগুলি নমুনা করতে চান তা কল্পনা করুন। আপনি যদি সমস্ত কালো সুপার স্পেসের উপরে পয়েন্টগুলি ছুঁড়ে ফেলেছেন এবং তাদের মানটি পরীক্ষা করেন তবে আপনি প্রচুর নমুনা (অনুসন্ধান) করছেন energy সুতরাং আপনার স্যাম্পলিং কৌশলটি (যা স্বয়ংক্রিয়ভাবে করা যেতে পারে) সবুজ শাখাগুলির নিকটবর্তী পয়েন্টগুলি (যেখানে এটি গুরুত্বপূর্ণ) বাছাই করতে নিয়ন্ত্রণ করা আরও অর্থবোধ করে। সবুজ শাখাগুলি একবার দুর্ঘটনাক্রমে (বা নিয়ন্ত্রিত) আঘাত হানার পরে পাওয়া যাবে এবং নমুনা প্রচেষ্টা বাকি অংশ (লাল পয়েন্ট) পরে তৈরি করা হবে। মার্ক সবুজ রেখায় আকৃষ্ট হওয়ার কারণ হ'ল মার্কোভ চেইন ট্রানজিশন ম্যাট্রিক্স যা আপনার স্যাম্পলিং ইঞ্জিন হিসাবে কাজ করে।
সাধারণ ব্যক্তির ভাষায়, এমসিএমসি একটি শক্তি-সঞ্চয় (স্বল্প ব্যয়) স্যাম্পলিং পদ্ধতি, বিশেষত যখন একটি বিশাল এবং 'অন্ধকার' (বহু-মাত্রিক) জায়গায় কাজ করে।