আমি কি প্রতিটি এমসিসিএম পুনরাবৃত্তিতে একটি বড় ডেটাসেট সাবমেল করতে পারি?


8

সমস্যা: আমি একটি বড় ডেটাসেটের চেয়ে কিছু উত্তরোত্তর অনুমান করতে একটি গিবস নমুনা করতে চাই। দুর্ভাগ্যক্রমে, আমার মডেল খুব সহজ নয় এবং এইভাবে নমুনাটি খুব ধীর। আমি পরিবর্তনশীল বা সমান্তরাল পদ্ধতির বিবেচনা করব, তবে এতদূর যাওয়ার আগে ...

প্রশ্ন: আমি জানতে চাই যে আমি প্রতিটি গিবস পুনরাবৃত্তিতে আমার ডেটাসেট থেকে এলোমেলোভাবে নমুনা (প্রতিস্থাপন সহ) করতে পারি কিনা, যাতে আমার প্রতিটি পদক্ষেপে শিখার কম নজির থাকে।

আমার অন্তর্নিহিততা হ'ল আমি নমুনাগুলি পরিবর্তন করেও, আমি সম্ভাবনার ঘনত্ব পরিবর্তন করব না এবং তাই গীবস নমুনার কৌশলটি লক্ষ্য করা উচিত নয়। আমি কি সঠিক? লোকেরা এখানে কাজ করার কিছু রেফারেন্স আছে?


1
একদিকে যেমন: আরেকটি ধারণাটি হ'ল বড় ডেটাসেটের এলোমেলো সাবমেরিতে একাধিক বিশ্লেষণ করা। এইভাবে আপনি ক্রস-বৈধতাও দিতে পারেন।
অনুমান

2
আমি আপনার যথাযথ প্রশ্নের কোনও কর্তৃপক্ষের সাথে উত্তর দিতে পারি না (যদিও আমার সন্দেহ হ'ল আপনি মন্টি কার্লোর সাথে যে অনুমানের ত্রুটিটি কেবল বাড়িয়ে তুলবেন), দুঃখজনক সত্যটি এটি বায়সিয়ান এমসিএমসি বিশ্লেষণের একটি দুর্ভাগ্যজনক দিক: তারা গণনার দিক থেকে ব্যয়বহুল। @ মন্তব্যগুলির মন্তব্যটি একটি দুর্দান্ত ধারণা, তবে সত্যই বিষয়টি ইস্যুটির কেন্দ্রবিন্দুতে আসে না: প্রতিটি ব্যক্তির জন্য এই সমস্ত নমুনা আঁকানো খুব ব্যয়বহুল। আমার সুপারিশটি হ'ল ভারী কাজের জন্য আপনার নিজের সি কোড লিখুন (আর সি সি পি তে পিথন, সিথন ইত্যাদি) এবং সমান্তরাল (যখন কোনও শাখা নির্ভরতা নেই)।

1
@ ধারণাগুলি মাইকেল জর্ডানের ছোট্ট বুটস্ট্র্যাপের ব্যাগের মতো শোনাচ্ছে।
jaradniemi

1
সুপ্ত পরিবর্তনশীল বৃদ্ধি সম্পূর্ণরূপে এড়াতে আমি আপনার নমুনা পরিবর্তন করার পরামর্শ দেব। আপনার আর গীবস স্যাম্পলার থাকবে না, তবে সম্ভাব্যতার স্বাভাবিক আনুমানিকতার উপর ভিত্তি করে একটি প্রস্তাব সহ একটি মহানগর-হেস্টিংস অ্যালগরিদম ঠিক কাজ করবে। বায়েশিয়ান ডেটা অ্যানালাইসিসের দ্বিতীয় সংস্করণের 16.4 ধারা দেখুন।
jaradniemi

6
এটি সক্রিয় গবেষণার একটি ক্ষেত্র যা আপনার জন্য সঠিকভাবে সংক্ষিপ্ত করার জন্য আমি যথেষ্ট ভাল জানি না। উদাহরণস্বরূপ দেখুন jmlr.org / প্রসেসিংস / পেপারস / ভি 32/bardenet14.pdf এবং arxiv.org/pdf/1304.5299v4.pdf
অ্যান্ড্রু এম

উত্তর:


1

সাবসাম্পলিং কৌশলগুলি সম্পর্কে: উদাহরণস্বরূপ দুটি টি পর্যবেক্ষণ এবং বিবেচনা করুন এবং কিছু বিবেচনা করুন এবং ভ্যারিয়েন্স। আসুন , আমরা যে মূল্যায়ন করতে চাই তা হল ta ta Consider এখন দ্বিপদী ভেরিয়েবল । যদি আমরা বেছে , যদি আমরা বেছে তবে নতুন যেখানেএক্স1~এন(μ1,σ12)এক্স2~এন(μ2,σ22)θ=(μ1,μ2,σ12,σ22)

(θ|এক্স1,এক্স2)α(এক্স1|θ)(এক্স2|θ)(θ)
δ~বি(0.5)δ=0এক্স1δ=1এক্স2
(θ,δ|এক্স1,এক্স2)α(এক্স1,এক্স2|δ,θ)(θ)(δ)
(এক্স1,এক্স2|δ,θ)=(এক্স1|θ)δ(এক্স2|θ)1-δ এবং । এখন আপনি যদি গিবস পদক্ষেপের সাথে নমুনা দিতে চান তবে আপনাকে এবং গণনা করতে হবে কারণ । যদি আপনি অন্যথায় মেট্রোপলিস হেস্টিংস ব্যবহার করেন তবে আপনি নতুন রাষ্ট্র এবং আপনাকে প্রস্তাবিত রাজ্যের সাথে সম্পর্কিত একটি এবং মধ্যে কেবল একটি গণনা করতে হবে তবে আপনি মধ্যে এক গনা আছে এবং(δ)=0.5δ(এক্স1|θ)(এক্স2|θ)পি(δ=1)=(এক্স1|θ)(এক্স1|θ)+ +(এক্স2|θ)δ*(এক্স1|θ)(এক্স2|θ)(এক্স1|θ)(এক্স2|θ)এমনকি সর্বশেষ স্বীকৃত রাষ্ট্রের জন্য । তখন আমি নিশ্চিত নই যে মহানগর আপনাকে কিছুটা সুবিধা দেবে। তবুও এখানে আমরা একটি দ্বিবিড়ীয় প্রক্রিয়া বিবেচনা করছি, তবে একটি মাল্টিভারিয়েট প্রক্রিয়া সহ মহানগরের সাথে নমুনা খুব জটিল হতে পারে।δδ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.