বায়েশিয়ানরা কীভাবে মন্টি কার্লো সিমুলেশন পদ্ধতি ব্যবহার করে তাদের পদ্ধতিগুলি যাচাই করে?


11

পটভূমি : আমার সামাজিক মনোবিজ্ঞানে পিএইচডি আছে, যেখানে তাত্ত্বিক পরিসংখ্যান এবং গণিত সীমাবদ্ধভাবে আমার পরিমাণগত পাঠ্যক্রমের মধ্যে আবৃত ছিল। আন্ডারগ্র্যাড এবং গ্রেড স্কুলের মাধ্যমে, "ক্লাসিকাল" ঘন ঘন ঘন কাঠামোর মাধ্যমে আমাকে শেখানো হয়েছিল (আপনার অনেকের মতো সামাজিক বিজ্ঞানেও সম্ভবত) was এখন, আমি আর কেও পছন্দ করি এবং পদ্ধতিগুলি যেভাবে কাজ করে তা যাচাই করতে সিমুলেশন পদ্ধতি ব্যবহার করেগাণিতিক প্রমাণগুলির চেয়ে আমার কাছে আরও জ্ঞান (আবার: একটি পরিমাণগত সামাজিক বিজ্ঞানের পটভূমি, তাত্ত্বিক পরিসংখ্যান নয়)। ক্রমবর্ধমান পদ্ধতি এবং সিমুলেশন পদ্ধতিগুলি একসাথে আমার কাছে প্রচুর পরিমাণে অর্থবোধ করে। কারণ ঘন ঘনবাদীরা সম্ভাবনাটিকে দীর্ঘকালীন প্রতিকূলতা হিসাবে দেখেন (যেমন, আমি যদি এটি নির্বিচারে বহুবার করে থাকি এবং এটি সময়ের 50% হয় তবে তার সম্ভাবনা 50% থাকে)। আমরা মন্টি কার্লো পদ্ধতিতে এই দীর্ঘ রানটি অনুকরণ করতে পারি!

জটিলতা : undergrad সাল থেকে আমি Bayesian পদ্ধতি খুব সচেতন হয়েছে, এবং সেখানে সর্বদা হয়েছে আমার জীবনে মানুষ, Bayesian পাশ থেকে আমাকে আহ্বান এই বলে যে ফলাফল ব্যাখ্যা করা আরো সহজ ছিল, যে আমরা সম্ভাব্যতা পেতে জন্য ডেটা পরিবর্তে একটি হাইপোথিসিস একটি হাইপোথিসিস দেওয়া ইত্যাদি। আমি সত্যিই এটিতে এসেছি এবং একটি বায়সিয়ান ক্লাস নিয়েছি, কিছু বায়সিয়ান বই এবং কাগজপত্র পড়েছি এবং এখন স্টান এবং এর সাথে সম্পর্কিত আর প্যাকেজগুলির সাথে বেশ পরিচিত familiar

মেয়ো প্রবেশ করান : কিছুক্ষণের জন্য "বয়েসিয়ান সম্ভবত ভবিষ্যতের পথ" চিন্তা করার পরে, আমি দেবোরাহ মায়োর পরিসংখ্যানগত অনুভূতিটি গুরুতর পরীক্ষা হিসাবে পড়ি । তিনি বলেছেন যে বইয়ের শুরুতে তিনি কোনও দিক বেছে নেন নি, তবে তিনি করেন: তিনি একজন ঘনঘনবাদী, এবং বইয়ের অনেকগুলি ঘনত্ববাদী পদ্ধতিগুলি রক্ষা করছে def আমি প্রমাণের যেভাবে দেখছি সেটিকে বৈধ বলে মনে করি বা না তা অগত্যা একটি আলোচনায় আসতে চাই না, তবে এটি আমাকে এই ভাবনায় পেয়েছে: বাইয়েস কি আসলেই বিজ্ঞাপন হিসাবে প্রকাশিত সমস্ত কিছু? আমি বোঝাতে চাইছি, বায়েসের ভিড় নিজেই এতটা ভাঙ্গা হয়ে পড়েছে যে আমি প্রায়শই বয়েশিয়ান কাঠামোর মধ্যে ডেটা বিশ্লেষণের "সঠিক" উপায়টিও জানি না। সাধারণত, আমি কেবল ব্যবহার করবrstanarmএবং বর্তমান পয়েন্টের অনুমান এবং বিশ্বাসযোগ্য ব্যবধানগুলি ... যা প্রায়শই ঘন ঘন ঘন ঘন অনুমান এবং আত্মবিশ্বাসের অন্তরগুলির সাথে ঘনিষ্ঠ থাকে। আমি মডেল তুলনা করতে পারি, তবে আমি বয়েস ফ্যাক্টরকে উত্তরীয় সম্ভাবনার তুলনা ইত্যাদি হিসাবে বর্ণনা করতে সবসময়ই ভীত

আরও চিন্তাভাবনা : মায়োর বইয়ের মধ্য দিয়ে আমি যা ভাবছিলাম তা হ'ল: আমাদের ঘন ঘনবাদী পদ্ধতিগুলি কাজ করে তা নিশ্চিত করার জন্য আমরা কম্পিউটারগুলি ব্যবহার করতে পারি, কারণ সম্ভাব্যতা যা আমরা দীর্ঘমেয়াদে দেখি এবং আমরা তা অনুকরণ করতে পারি। বায়েসিয়ানরা এমনকি সম্ভাবনা কী তা নিয়ে একমত হতে পারে না বলে মনে হয়, এটি বায়সিয়ান স্কুল (ডিফল্ট, বিষয়গত ইত্যাদি) উপর নির্ভর করে, যা আমাকে আমার প্রশ্নের দিকে নিয়ে যায়:

প্রশ্ন : বায়েসিয়ানরা কীভাবে যাচাই করে যে তাদের পদ্ধতিগুলি মন্টি কার্লো সিমুলেশন পদ্ধতিগুলি ব্যবহার করে যদি মন্টে কার্লো সিমুলেশন পদ্ধতিগুলি ব্যবহার করে সঠিকভাবে অনিশ্চয়তা (যেমন বৈধ বিশ্বাসযোগ্য অন্তর এবং উত্তর বিতরণ গণনা করে) সংজ্ঞা দেয় তবে যদি সম্ভাবনাটি দীর্ঘকালীন হার হিসাবে সংজ্ঞায়িত না হয়?

উদাহরণ : আমি একটি ডেটা জেনারেটর তৈরি করি। এটি কেবল .5 এর সম্ভাব্যতার সাথে একটি বার্নোল্লি বিতরণ থেকে অনুকরণ করতে চলেছে:

set.seed(1839)
p <- .50
n <- 100
gen_dat <- function(n, p) {
  rbinom(n, 1, p)
}

এখন, আসুন আমি বলি যে আমি নিশ্চিত করতে চাই যে একটি লজিস্টিক রিগ্রেশন-এ আত্মবিশ্বাসের অন্তরগুলি আসলে বৈধ কিনা। আমি প্রচুর সংখ্যক রিগ্রেশন অনুকরণ করতে পারি এবং নিশ্চিত করতে পারি যে প্রকৃত জনসংখ্যার মান 95% আত্মবিশ্বাসের ব্যবধানে 95% সময়ের মধ্যে পড়ে। এটি একটি ইন্টারসেপ্ট-ইন্ডিস্ট মডেল, সুতরাং আমি নিশ্চিত করতে চাই যে আমি pসঠিকভাবে অনুমান করছি :

set.seed(1839)
iter <- 10000
results <- sapply(seq_len(iter), function(zzz) {
  mod <- glm(gen_dat(n, p) ~ 1, binomial)
  conf <- suppressMessages(confint(mod))
  log(p / (1 - p)) < max(conf) & log(p / (1 - p)) > min(conf)
})
mean(results)

এটি চালাতে কয়েক মিনিট সময় নেয় তবে আমরা mean(results)আমাদের কল দিয়ে শেষ করি 0.9416। এটি প্রায় 95%, এবং আমি এই বিষয়ে আত্মবিশ্বাসী যে glmকমান্ডটি একটি বৈধ উপায়ে অনিশ্চয়তার বর্ণনা দিচ্ছে । আমি নিশ্চিত যে আমি যদি আপ করি iterএবং আমার ল্যাপটপে আরও বেশিক্ষণ এখানে অপেক্ষা করতে চাই তবে এটি 95% এ নাকের ডানদিকে কাছে যেতে পারত ।

অন্যদিকে, আসুন একই জিনিসটির জন্য একটি বায়েশিয়ান মডেলটি ফিট করি:

library(rstanarm)
set.seed(1839)
dat <- data.frame(y = gen_dat(n, p))
stan_mod <- stan_glm(y ~ 1, binomial, dat)
summary(stan_mod)

অংশ হিসাবে, এটি আমাকে দেয়:

Estimates:
                mean   sd    2.5%   25%   50%   75%   97.5%
(Intercept)    -0.1    0.2  -0.5   -0.2  -0.1   0.0   0.3  
mean_PPD        0.5    0.1   0.3    0.4   0.5   0.5   0.6  
log-posterior -73.0    0.7 -75.1  -73.1 -72.7 -72.5 -72.5  

বায়েশিয়ানরা যেহেতু আমরা দীর্ঘমেয়াদে যা দেখি তেমন সম্ভাবনার সংজ্ঞা দেয় না, তাই আমি stan_glmঅনিশ্চয়তা সঠিকভাবে ক্যাপচারের চেয়ে যাচাই করার জন্য সিমুলেশন পদ্ধতিগুলি কীভাবে ব্যবহার করতে পারি ? অর্থাত্, সিমুলেশন পদ্ধতি ব্যবহার করে আমি কীভাবে বিশ্বাস করতে পারি যে এই বিশ্বাসযোগ্য অন্তরগুলি বৈধ? এবং এই মুহুর্তে, আমি এমনকি পূর্বের সংজ্ঞা দিচ্ছি না i এখানে বন্দীদের অন্তর্ভুক্তি কীভাবে কার্যকর হবে, যেহেতু এটি আমাদের অনিশ্চয়তার ব্যবস্থাগুলিকে প্রভাবিত করবে?

আমি যখন স্টান থেকে একবারে বাধা মডেল উপাদানটি দিয়ে বিটা রিগ্রেশন লেখার চেষ্টা করছিলাম, তখন আমার কাছে কেউ আমার কাছে পরামর্শ দিয়েছিল: "ডেটা সিমুলেট করুন times এটি বেশ কয়েকবার করুন, এবং সত্যিকারের অনুমানগুলি নির্ভরযোগ্য বিরতিতে 95 এর মধ্যে হওয়া উচিত % সময়." তবে আমার কাছে, এটি বেইসিয়ানরা যে বিশ্বাস করে তার বিপরীতে যায়! যা সম্ভাবনার ঘনত্ববাদী বোঝার উপর নির্ভর করে! সুতরাং একজন বায়েশিয়ান কীভাবে আমাকে বোঝাতে পারবেন যে আমি summary()আমার মডেলটির কল থেকে যে বিশ্বাসযোগ্য ব্যবধানটি পেয়ে যাচ্ছি তা সিমুলেশন পদ্ধতিগুলি ব্যবহার করে অনিশ্চয়তার সঠিকভাবে বর্ণনা করছে?

প্রশ্নের উদ্দেশ্য : এটি একটি তুচ্ছ উদাহরণ, তবে অনেক সময় ক্লায়েন্টরা আমাকে কঠিন সমস্যা সরবরাহ করে। এবং আমি যে জিনিসগুলির সাথে আমি অপরিচিত তা চেষ্টা করি, তাই আমি যা করছি তা বৈধ কিনা তা নিশ্চিত করার জন্য আমি প্রায়শই একটি সিমুলেশন অধ্যয়ন পরিচালনা করি। যদি আমি স্টানে একটি কাস্টম মডেল লিখি, তবে আমি কীভাবে জানব যে আমি যা করছি তা বৈধ? আমি স্ট্যানের মধ্যে যা করছি তা যাচাই করার জন্য আমি কীভাবে সিমুলেশন পদ্ধতি ব্যবহার করতে পারি যা আমি জানতে চাই?


3
ভাল প্রশ্ন. দুটি মন্তব্য: ১. আমরা ঘন ঘনবাদী মডেলগুলিকে "যাচাই করতে" সিম পদ্ধতিগুলি ব্যবহার করতে পারি, তবে একা সিমুলেশন আমাদের ঘন ঘন মডেলটির বিশ্বাসযোগ্যতা সম্পর্কে সম্পূর্ণরূপে জানাতে পারে না। 2: এমন কোনও উপায় রয়েছে যে কোনও বায়েশিয়ান / স্ট্যান মডেল অনুমানের জন্য বিশ্বাসযোগ্য নয়। উদাহরণস্বরূপ, ডাইভারজেন্ট ট্রানজিশনগুলি ওয়ার্ম-আপ পিরিয়ড পরে দেখা গেছে।
জেটিএইচ

1
আমি মনে করি আপনি দুটি ভিন্ন ধরণের "অনিশ্চয়তা" কাটাচ্ছেন। ঘনঘনবাদী পদ্ধতিগুলি অযৌক্তিক অনিশ্চয়তা নিয়ে কাজ করে এবং তাদের দীর্ঘমেয়াদী সম্পত্তি দ্বারা ন্যায্য। বায়েশিয়ান পদ্ধতিগুলি এপিস্টেমিক অনিশ্চয়তার সাথে মোকাবিলা করে এবং তাদের দীর্ঘ-সম্পত্তিগুলির ভিত্তিতে ন্যায়সঙ্গত হওয়ার দরকার নেই। বিশেষত, 95% বিশ্বাসযোগ্য ব্যবধানগুলির জন্য 95% আস্থা অন্তর হওয়া দরকার না। তবুও, বায়েশীয়রাও "ক্যালিব্রেটেড" হতে পারে, অর্থাত্ ফ্রুসিডিনিস্ট সম্ভাবনার সাথে মেলে। দেখুন: রুবিন, ডিবি। "প্রয়োগিত পরিসংখ্যানবিদদের জন্য বায়সিয়ানিয়ালি ন্যায়সঙ্গত এবং প্রাসঙ্গিক ফ্রিকোয়েন্সি গণনা। পরিসংখ্যানের বার্তা 1984: 12: 1151-1172।
এ.আরএফ

যদি আপনি বিষয়ী সম্ভাব্যতা পৃথিবীতে বাস হয়ত আপনি কিছু যাচাই করতে হবে না, আপনি ভুল না হন
Aksakal

অন্তত অন্তর অন্তর অন্তর অন্তর অন্তর অন্তর জন্য আপনি কী করতে যা ভাবছেন তা কেন করতে পারবেন না তা দেখতে আপনি stats.stackexchange.com/questions/2272/… দেখতে চাইতে পারেন ।
ডেভ হ্যারিস

উত্তর:


5

আমি মনে করি আপনি আপনার প্রশ্নের যৌক্তিক সমস্যাটি দেখেছেন। ঘনত্ববাদী দৃষ্টান্তে, জনসংখ্যার সত্য অনুমান করা, তথ্য উত্পন্ন করা এবং অনুমানের ভাল কভারেজ রয়েছে কিনা তা দেখুন, কারণ তারা মনে করে যে এটিই করা হয়। বায়েশিয়ান দৃষ্টান্তে, তবে থেকে ডেটা উত্পন্ন করার কোনও গ্রাউন্ড সত্য নেই! বেইশিয়ানরা এই জাতীয় তথ্যের সম্ভাব্যতা জিজ্ঞাসা করে, তাই সিমুলেশনে আমাদের বিভিন্ন সত্যের প্রয়োজন যা তথ্যকে জন্ম দেয় এবং তারপরে ডেটা শর্ত করে। অনুশীলনে, এক শর্তসাপেক্ষ সম্ভাবনার আইনটি অনুকরণ করে, যা ভাগ্যক্রমে সংজ্ঞা অনুসারে সর্বদা ধারণ করে holds আমি রাউডার, 2014, সাইকোনমিক বুলেটিন এবং পর্যালোচনাতে এই সঠিক সমস্যাটি নিয়েছি। https://dx.doi.org/10.3758/s13423-014-0595-4


1

বায়েসিয়ানরা কীভাবে যাচাই করবে যে তাদের পদ্ধতিগুলি মন্টে কার্লো সিমুলেশন পদ্ধতিগুলি ব্যবহার করে যদি মন্টে কার্লো সিমুলেশন পদ্ধতিগুলি ব্যবহার করে যথাযথভাবে অনিশ্চয়তা (যেমন বৈধ বিশ্বাসযোগ্য অন্তর এবং উত্তর বিতরণ গণনা করে) সংজ্ঞায়িত হয় তবে যদি সম্ভাবনাটি দীর্ঘকালীন হার হিসাবে সংজ্ঞায়িত না হয়?

আমি বিশ্বাস করি যে এখানে বিভ্রান্তি বায়েশিয়ান পরিসংখ্যানগুলিতে সিমুলেশন পদ্ধতিগুলির উদ্দেশ্য সম্পর্কে। গিবস স্যাম্পলিং বা হ্যামিলটোনিয়ান মন্টি কার্লো এর মতো মার্কোভ চেইন মন্টি কার্লো পদ্ধতির একমাত্র উদ্দেশ্য বায়েসের বিধি বিধানের গণনা করা।

অবশ্যই, প্রায়শই অন্যান্য পদ্ধতি উপলব্ধ রয়েছে যা এমসিসিএমকে অহেতুক করে তুলবে। কিছু মডেল কনজুগেসি ব্যবহার করে প্রকাশ করা যেতে পারে, অন্যরা প্যারামিটার স্পেসের উপর সূক্ষ্ম গ্রিড প্রয়োগ করার মাধ্যমে, অন্যদের গ্রহণযোগ্যতা-প্রত্যাখ্যান পরীক্ষার মাধ্যমে সমাধান করা যেতে পারে। যখন এমসিএমসি কার্যকর হয় যখন অবিচ্ছেদ্য আচরণ হয় না।

π(θ|x)=f(X|θ)π(θ)θΘf(X|θ)π(θ)dθ,
f(X|θ)π(θ)f(X|θ)π(θ|X)এক যোগফল। এমসিএমসির লক্ষ্য হ'ল নীচের সংখ্যাটি নির্ধারণ করা। নোট করুন যে নীচের সংখ্যাটি একটি ধ্রুবক। এটি প্রত্যাশিত সম্ভাবনা।

এই সংখ্যার যথার্থতা কিছু প্যারামিটারের অনুমানগুলি নির্ধারণ করে না। আপনি যদি সর্বাধিক কোনও পোস্টেরিয়েরি অনুমানকারী ব্যবহার করে থাকেন তবে এমসিমিসি একটি অপ্রয়োজনীয় পদক্ষেপ। পরিবর্তে আপনার একটি পাহাড়ের আরোহণ অ্যালগরিদম তৈরি করা উচিত। অন্যদিকে, উত্তরোত্তর গড় বা একটি অন্তর নির্ধারণ করা প্রয়োজন। এর কারণ হল যে 95% ব্যবধানটি কোনও কিছুর 95% হতে হবে এবং ডিনোমিনেটর নির্ধারণ করে যে কোনও কিসের স্কেল কী।

বয়েসিয়ান পদ্ধতিগুলিতে এমসিসিএমির লক্ষ্য হ'ল মার্কোভ চেইনগুলি উত্তরীয় ঘনত্বে রূপান্তরিত করা। হ্যাঁ, ওটাই. এটি কোনও কিছুর বৈধতা পরীক্ষা করে না। এটি একটি নির্দিষ্ট পয়েন্টের মান নির্ধারণের চেষ্টা মাত্র। এটি সংখ্যার একীকরণের একটি রূপ। যেহেতু সমস্ত ঘন অঞ্চলগুলি coveredেকে দেওয়া হয়েছে কিনা তা অ্যালগরিদমকে অনন্তের দিকে চালিত না করে জানার কোনও উপায় নেই, তবে মানুষের কিছু রায় রয়েছে is অ্যালগোরিদমের একটি কাট অফ থাকবে যখন এটি বিশ্বাস করে এটি সম্পন্ন হয়েছে, তবে এর অর্থ এই নয় যে এটি আসলে হয়ে গেছে।

ফ্রিকোয়েন্সিস্ট পদ্ধতিতে, এমসিএমসি প্রায়শই কোনও মডেলটির যুক্তিবাদিতা পরীক্ষা করতে বা কোনও বিশ্লেষক পাওয়া না গেলে সমাধানটিকে সংখ্যায়িকভাবে আনুমানিক হিসাবে ব্যবহার করতে ব্যবহৃত হয়। এটি এখানে কোন অনুরূপ উদ্দেশ্য পরিবেশন করে।

যদি আমি স্টানে একটি কাস্টম মডেল লিখি, তবে আমি কীভাবে জানব যে আমি যা করছি তা বৈধ? আমি স্ট্যানের মধ্যে যা করছি তা যাচাই করার জন্য আমি কীভাবে সিমুলেশন পদ্ধতি ব্যবহার করতে পারি যা আমি জানতে চাই?

এই প্রশ্নটি আরও অনেক কঠিন। স্ট্যান একটি দ্রুত অ্যালগরিদম, যার অর্থ এটি অমূলকতার বাড়তি ঝুঁকির জন্য গতি ব্যবসা করে। স্ট্যান, নির্মাণ করে, প্রায়শই ভুলের চেয়ে সঠিক হবে। এমন অন্যান্য অ্যালগরিদম রয়েছে যেগুলি স্থানীয় সর্বাধিকের জন্য পরামিতি স্পেসটি ব্যাপকভাবে অনুসন্ধানের জন্য ডিজাইন করা হয়েছে যা আরও সঠিক হতে পারে তবে এটি খুব ধীর হবে।

θΘf(X|θ)π(θ)dθ.

দ্বিতীয়টি যা আপনি করতে পারেন তা হ'ল বিকল্প অ্যালগরিদম দিয়ে এটি যাচাই করা। সংখ্যাগুলি কখনই মেলে না, তবে আপনি যদি এগুলি যথেষ্ট কাছে দেখেন তবে আপনি ভাল আছেন।

তৃতীয়ত, বেশিরভাগ প্রাক-বিল্ট প্যাকেজগুলি হুঁশিয়ারি দেয় যে কিছু ভুল হতে পারে। যদি কোনও সতর্কতা আসে তবে সমস্যার উত্সটি অনুসন্ধানের পরে অন্য কিছু ব্যবহার করুন, যাতে আপনি এটি অন্য অ্যালগরিদমে পুনরায় তৈরি করবেন না।

Pr(μ)=N(7,22)σ2N(25,.12)

পঞ্চম এবং আপনি স্টানকে প্রথমে শুরু করার আগে এটি করা উচিত, আপনার প্রান্তিক সম্ভাবনাগুলি এক বা দুটি মাত্রায় গ্রাফ করুন। অ্যালগরিদমের সাথে হস্তক্ষেপ করতে পারে এমন কোনও আশ্চর্য কি আছে?

যেহেতু বায়েসীয়রা আমরা দীর্ঘমেয়াদে যা দেখি তেমন সম্ভাবনার সংজ্ঞা দেয় না, সুতরাং স্ট্যান_জিএলএম সঠিকভাবে অনিশ্চয়তা ক্যাপচার করার চেয়ে আমি কীভাবে যাচাই করতে সিমুলেশন পদ্ধতি ব্যবহার করতে পারি? অর্থাত্, সিমুলেশন পদ্ধতি ব্যবহার করে আমি কীভাবে বিশ্বাস করতে পারি যে এই বিশ্বাসযোগ্য অন্তরগুলি বৈধ? এবং এই মুহুর্তে, আমি এমনকি পূর্বের সংজ্ঞা দিচ্ছি না i এখানে বন্দীদের অন্তর্ভুক্তি কীভাবে কার্যকর হবে, যেহেতু এটি আমাদের অনিশ্চয়তার ব্যবস্থাগুলিকে প্রভাবিত করবে?

আপনি যদি পূর্বের সংজ্ঞা না দেন তবে আপনার মডেলটি বৈধ নয়। আপনি যদি যুক্তিসঙ্গত পূর্বের ঘনত্বটি সংজ্ঞায়িত না করে থাকেন তবে আপনি কেন বায়েশিয়ান মডেল ব্যবহার করবেন? ঘন ঘন মডেলগুলি সর্বাধিক ক্ষতির ঝুঁকি হ্রাস করে যা খারাপ নমুনা সংগ্রহের ফলে ঘটতে পারে। এগুলি খুব হতাশাবাদী এবং বায়সিয়ান পদ্ধতিতে একই ফলাফল তৈরি করতে প্রায়শই আরও তথ্য লাগে।

তবুও, ভাল পূর্বে ঘনত্ব ব্যবহার না করে এটি কোনও কাজে আসে না। পূর্বের ঘনত্বটি বায়েশিয়ান পদ্ধতিটিকে কোনও খারাপ নমুনা বেছে নেওয়া থেকে গড় ক্ষতি হ্রাস করতে সহায়তা করে। পূর্বের তথ্যগুলি ওজন স্কিম হিসাবে কাজ করে যাতে কিছু চরম নমুনা দুর্ভাগ্যজনক সুযোগ দ্বারা বেছে নেওয়া হলে পূর্বের ডেটা যে ভূমিকা পালন করে তা দুর্বল করে দেয়।

সম্পাদনা আমি বুঝতে পেরেছিলাম যে আমি একটি নির্দিষ্ট উত্তর সরবরাহ করি নি। এটা ছিল প্রশ্ন

আমি স্ট্যানের মধ্যে যা করছি তা যাচাই করার জন্য আমি কীভাবে সিমুলেশন পদ্ধতি ব্যবহার করতে পারি যা আমি জানতে চাই?

এই প্রশ্নটি কী চ্যালেঞ্জিং করে তা হ'ল বায়েশিয়ান দৃষ্টান্তে নির্দিষ্ট পয়েন্টগুলি হল , নমুনা। ফ্রিকোয়েন্সিস্ট পদ্ধতিতে প্যারামিটারগুলি স্থির হয় এবং হাজার হাজার অদৃশ্য নমুনা তৈরি করা হয়। মুদ্রার বায়েশিয়ান দিকে, এটি নির্দিষ্ট করা নমুনা is আপনার কয়েক হাজার সমান্তরাল মহাবিশ্বের অনুকরণ করতে হবে।X

এটি কেমন হতে পারে তা দেখতে, মুদ্রার সমস্ত ঘনত্বের কার্যগুলি কল্পনা করুন যে মাথা হওয়ার অজানা সম্ভাবনা এবং লেজ হওয়ার রয়েছে with আপনি ছয় মাথা এবং দুটি লেজ পালন করেন একটি ছোট প্যারামিটার স্থান কল্পনা যেখানে । আপনার সিমুলেশন সমস্ত ক্ষেত্রে বিবেচনা করবে যেখানে তিনটি উদ্দেশ্যমূলক দ্বিপদী বিতরণে ছয়টি মাথা পাওয়া যায়। উত্তরকোষ হ'ল প্রতিটি প্যারামিটারের মান হ'ল গড় মান average আপনার ভবিষ্যদ্বাণীমূলক বিতরণটি ওজনযুক্ত দ্বিপদী বিতরণের যোগফল হবে।p1pp{1/3,1/2,2/3}

আপনার কাছে গুরুত্বপূর্ণ, বায়েশিয়ান পূর্বাভাসের পক্ষে সত্যিকারের বিতরণ হওয়া কখনও অসম্ভব। তিনটি বিতরণের একটি হ'ল আসল বিতরণ। বয়েশিয়ান পদ্ধতিগুলি পর্যবেক্ষণ করা মান এবং পূর্বেরগুলির উপর ভিত্তি করে তাদের সম্ভাব্যতা ওজন করে। উত্তরোত্তর কখনই সত্য বিতরণ হতে পারে না বা ভবিষ্যদ্বাণীমূলক ঘনত্বও হতে পারে না।

এটি জিজ্ঞাসা করছে "সমস্ত সম্ভাব্য ব্যাখ্যার (পরামিতি, মডেল ইত্যাদি) সেট করে ছয় মাথা এবং দুটি লেজ দেখার সম্ভাবনা কী?"

ফ্রিকোয়েন্সিস্ট তিনটি পছন্দকেই শূন্য করে আসল মান বলে দিতেন। ছয়টি মাথা এবং দুটি লেজ কে মিথ্যা তবে অন্যগুলি নয়। যদি, সুযোগক্রমে, আপনি তিনটি বিতরণের মধ্যে একটি সঠিকটি চয়ন করেছেন, তবে আপনি পুরোপুরি সঠিক। অন্যথায়, আপনি ভুল হতে হবে।H0:p=1/3,

যদি আপনি কোনও নমুনা স্থির রাখতে সিমুলেশনগুলি ব্যবহার করেন তবে আপনি দেখতে পাবেন যে স্টান প্রশংসনীয়ভাবে পারফর্ম করবেন কারণ বয়েস উপপাদ্য একটি গাণিতিক উপপাদ্য। এটি প্রাক্তন পোস্ট অনুকূল। আপনি যা দেখতে পাবেন তা হ'ল আলগোরিদিম ডিনোমিনেটরটি প্রাক্কলন করতে প্রাকৃতিক ত্রুটি স্তর পর্যন্ত বেইস উপপাদকে সঠিকভাবে প্রয়োগ করেছিল।

তিনটি জিনিস আপনি করতে পারেন। প্রথমত, আপনি নমুনা ছাড়াই ডেটা জন্য মডেল স্কোরিং পদ্ধতি ব্যবহার করতে পারেন। দ্বিতীয়ত, আপনি একটি বায়সিয়ান মডেল নির্বাচন বা মডেল গড় প্রক্রিয়া ব্যবহার করতে পারেন। তৃতীয়ত, আপনি এটিকে একটি ফ্রিকোয়েন্সিস্ট সমস্যা হিসাবে গণ্য করতে পারেন এবং অনুমানকারীদের নমুনা বিতরণ তৈরি করতে পারেন।

প্রথমটির জন্য, স্কোরিং পদ্ধতিগুলি নিজের কাছে একটি সম্পূর্ণ সাহিত্য। আপনি তাদের গবেষণা করা উচিত। বায়েশিয়ান মডেল নির্বাচন এবং মডেলগুলি গড় পরামিতি হিসাবে গণ্য মডেল। মডেল নির্বাচনের জন্য, মডেলগুলির সত্য হওয়ার সম্ভাবনা গণনা করা হয়। সম্ভাব্যতা গড়ের মডেলটির জন্য প্রতিটি মডেল সত্য হয় গণনা করা হয় এবং এটি মডেলের জায়গার উপরে ওজন হিসাবে কাজ করে। অবশেষে, আপনি এটি ফ্রিকোয়েন্সিস্ট মডেল হিসাবে বিবেচনা করতে পারেন।

পূর্বের কারণে অনেকগুলি স্ট্যান্ডার্ড ক্ষেত্রে সর্বশেষ একটি সমস্যা হবে। তিন বা ততোধিক মাত্রা এবং একটি সাধারণ বিতরণ সহ মডেলগুলির জন্য, পূর্ববর্তী ঘনত্ব সঠিক ঘনত্ব না হলে উত্তরীয় ঘনত্ব একতার সাথে একীভূত হবে না। অন্য কথায়, আপনাকে বুলেট কামড়তে হবে এবং কোনও বাস্তব জটিলতার সাথে কোনও মডেলের জন্য পূর্বনির্ধারণ করতে হবে।

সঠিকভাবে কেন্দ্রিক যথাযথ পূর্বের উপস্থিতি সেই ক্ষেত্রে কেসকে বাধ্য করে যেখানে উন্নত তথ্যের কারণে বায়েশিয়ান পদ্ধতি সংশ্লিষ্ট ফ্রিকোয়ালিস্ট পদ্ধতির তুলনায় উচ্চতর হবে। বেয়েসিয়ান পদ্ধতিটি যে কোনও যুক্তিসঙ্গত মানের অধীনে জিতবে। এটি ফ্রিকোয়েন্সিবাদী পদ্ধতির কোনও ত্রুটির কারণে নয়, তবে বায়সিয়ান পদ্ধতিটি বহিরাগত তথ্য ধরে নিয়েছে। কেবলমাত্র নমুনার তথ্য বিবেচনা করে ফ্রিকোয়েন্সিস্ট পদ্ধতিতে আপনার যদি সত্যিকারের পূর্ব থাকে তবে এতে কম তথ্য থাকবে will

আবার, যদি আপনার কাছে সত্যিকারের পূর্বের ব্যবস্থা না থাকে তবে আপনি কেন বায়েশিয়ান পদ্ধতি ব্যবহার করছেন?


@ আকসাল আমি আপনার সাথে একমত, এটি সিদ্ধান্ত এবং বিশ্লেষণের সাথে মিটমাট করে না। আমি এটি সরিয়েছি।
ডেভ হ্যারিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.