বায়েসিয়ান মডেল অ্যাভারেজিংয়ের (বিএমএ) সুবিধাগুলি দেখায় এমন সাধারণ উদাহরণ


12

আমি আমার গবেষণায় একটি বায়সিয়ান মডেল অ্যাভারেজিং (বিএমএ) পদ্ধতির অন্তর্ভুক্ত করছি এবং শীঘ্রই আমার সহকর্মীদের কাছে আমার কাজ সম্পর্কে একটি উপস্থাপনা দেব। যাইহোক, বিএমএ আমার ক্ষেত্রে এটি এতটা সুপরিচিত নয়, সুতরাং এগুলি সমস্ত তত্ত্বের সাথে উপস্থাপন করার পরে এবং এটি আমার সমস্যার সাথে প্রয়োগ করার আগে, কেন বিএমএ কাজ করে সে সম্পর্কে আমি একটি সহজ, তবুও শিক্ষামূলক উদাহরণ উপস্থাপন করতে চাই।

আমি দুটি সাধারণ মডেলগুলির মধ্যে একটি বেছে নিতে পারে এমন একটি সাধারণ উদাহরণ সম্পর্কে ভাবছিলাম, তবে প্রকৃত তথ্য উত্পন্ন মডেল (ডিজিএম) এর মধ্যে কোথাও রয়েছে এবং প্রমাণগুলি সত্যই তাদের কোনওটির পক্ষে নয়। সুতরাং আপনি যদি কোনওটি চয়ন করেন এবং সেগুলি থেকে চালিয়ে যান, আপনি মডেল অনিশ্চয়তা উপেক্ষা করে একটি ত্রুটি করবেন, কিন্তু বিএমএ, যদিও সত্যিকারের মডেলটি মডেলের সেটটির অংশ নয়, অন্তত সুদের পরামিতিগুলির সঠিক উত্তর ঘনত্ব দেয়। উদাহরণস্বরূপ, এখানে প্রতিদিন দুটি আবহাওয়ার পূর্বাভাস রয়েছে (এ এবং বি) এবং একজন আবহাওয়ার সেরা পূর্বাভাস দিতে চায়, তাই শাস্ত্রীয় পরিসংখ্যানগুলিতে আপনি প্রথমে দুজনের মধ্যে সেরা পূর্বাভাসীর সন্ধানের চেষ্টা করবেন, তবে যদি সত্য কোথাও কোথাও থাকে (এটি, কখনও কখনও এ ঠিক হয়, কখনও কখনও বি)। তবে আমি তা আনুষ্ঠানিক করতে পারিনি। এরকম কিছু তবে আমি ধারণাগুলির কাছে খুব উন্মুক্ত। আমি আশা করি এই প্রশ্নটি যথেষ্ট নির্দিষ্ট!

সাহিত্যে, আমি এতক্ষণ যা পড়েছি তার থেকে সুন্দর কোনও উদাহরণ পাই নি:

  • ক্রুশ্চে (২০১১) যদিও বায়সিয়ান পরিসংখ্যানের দুর্দান্ত পরিচয়, তবুও বিএমএ এবং মুদ্রার টস উদাহরণটিতে তিনি ৪ য় অধ্যায়ে বায়েসিয়ান পরিসংখ্যান উপস্থাপনের জন্য দুর্দান্ত মনোযোগ দিচ্ছেন না, তবে সত্যই কোনও সহ গবেষককে বিএমএ ব্যবহার করতে রাজি করেননি। ("আমার কাছে আবার তিনটি মডেল কেন, একটি বলে মুদ্রাটি ন্যায্য এবং দুটি বলে এটি উভয় পক্ষেই পক্ষপাতদুষ্ট?")
  • আমি যে অন্যান্য সমস্ত জিনিস পড়েছি ( কোপ ২০০৩ , কোপ / পোয়ুরিয়ার / টোবিয়াস (২০০)) , হোয়েটিং এট আল (১৯৯৯) এবং অন্যান্য প্রচুর পরিমাণে) তা উল্লেখযোগ্য তবে আমি এগুলির মধ্যে খেলনার সহজ উদাহরণ খুঁজে পাই নি।

তবে আমি এখানে একটি ভাল উত্স মিস করেছি।

সুতরাং বিএমএ পরিচয় করিয়ে দেওয়ার জন্য কারও কি তার উদাহরণ রয়েছে? সম্ভবত এমনকি সম্ভাবনাগুলি এবং পোস্টেরিয়ারগুলি দেখিয়েও কারণ আমি মনে করি এটি যথেষ্ট শিক্ষামূলক হবে।


একটি সংক্ষিপ্ত আপডেট: আমি সবেমাত্র এই উপস্থাপনাটি জুড়ে এসেছি যা বিভাগ 2 এর মধ্যে ফ্রিডম্যানের প্যারাডক্সকে বোঝায় একটি সংক্ষিপ্ত উদাহরণ রয়েছে যেখানে 39 র্যান্ডম covariates সিমুলেটেড হয় এবং যদি কেউ কেবল সেরা মডেলের সন্ধান করে, একজন অবশেষে উল্লেখযোগ্য সমবায়ীদের সন্ধান করে। মডেলের গড়পড়তা এই সমস্যাটির নিরাময়ে নিরাময়। আমি এখানে কোড সহ একটি সমাধান পোস্ট করছি না কারণ খোলামেলাভাবে, আমি জানি না সেখানকার পরিসংখ্যানগুলি কীভাবে উত্পন্ন হয়।
ক্রিস্টোফ_জে

(অবিরত) তারা গড়পড়তা গড়পড়তা কী করছে? সেরা পরামিতি? সমস্ত পরামিতি (আমি মনে করি এটি কেবলমাত্র এই নির্দিষ্ট উদাহরণে অর্থবোধ করবে)। তবুও, আমি মনে করি ফ্রেডম্যানের প্যারাডক্সের ইঙ্গিতটির সাথে মিশ্রিত চার্টগুলি বেশ সহায়ক। হতে পারে এটি কিছু সাহায্য করে।
ক্রিস্টোফ_জে

উত্তর:


8

আমি সম্প্রতি কিছু অনুরূপ করেছি। অন্যকে বোঝানোর জন্য এতটা চেষ্টা করা নয়, একটি ছোট প্রকল্প করা যা আমাকে বিএমএর স্বাদ পেতে একটু অনুমতি দেয়। আমি যা করেছি তা হ'ল বাইনারি প্রতিক্রিয়া সহ একটি ডেটাসেট জেনারেট করা, তিনটি স্বতন্ত্র ভেরিয়েবল যার প্রতিক্রিয়াতে প্রভাব ফেলেছিল এবং সাতটি ভেরিয়েবল যার প্রতিক্রিয়াতে কোনও প্রভাব ফেলেনি। আমি তখন বিএমএ ফলাফলগুলিকে লজিস্টিক রিগ্রেশনে ঘন ঘন অনুমানের সাথে তুলনা করেছি। আমি মনে করি যে এই ক্ষেত্রে কমপক্ষে বিএমএর পদ্ধতিটি বেশ ভাল বলে মনে হচ্ছে। আপনি যদি এটি আরও অ্যাক্সেসযোগ্য করতে চান তবে আপনি সর্বদা ভেরিয়েবলগুলি বা জেনেরিক এবং বলার পরিবর্তে কোনও কিছুর নাম রাখতে পারেন ।ওয়Xy

আমি এর জন্য ব্যবহৃত আর কোডটি নীচে উপস্থাপন করা হয়েছে। আশা করি এটি আপনাকে অনুপ্রাণিত করতে পারে!

# The sample size
n <- 100

# The 'true' coefficient vector
Beta <- cbind(c(-1.5, 0.45, -3))

# Generate the explanatory variables which have an effect on the outcome
set.seed(1)
X <- cbind(rnorm(n, 0, 1), rnorm(n, 4, 2), rnorm(n, 0.5, 1))

# Convert this into probabilities
prob <- 1/(1+exp(-X %*% Beta))

# Generate some uniform numbers. If the elements are smaller than the corresponding elements in the prob vector, then return 1.
set.seed(2)
runis <- runif(n, 0, 1)
y <- ifelse(runis < prob, 1, 0)

# Add the nonsense variables
X <- cbind(X, rpois(n, 3))        # Redundant variable 1 (x4)
X <- cbind(X, rexp(n, 10))        # Redundant variable 2 (x5)
X <- cbind(X, rbeta(n, 3, 10))    # Redundant variable 3 (x6)
X <- cbind(X, rbinom(n, 10, 0.5)) # Redundant variable 4 (x7)
X <- cbind(X, rpois(n, 40))       # Redundant variable 5 (x8)
X <- cbind(X, rgamma(n, 10, 20))  # Redundant variable 6 (x9)
X <- cbind(X, runif(n, 0, 1))     # Redundant variable 7 (x10)


# The BMA
library(BMA)
model <- bic.glm(X, y,  glm.family="binomial", factor.type=FALSE, thresProbne0 = 5, strict = FALSE)

# The frequentist model
model2 <- glm(y~X, family = "binomial")

old.par <- par()
par(mar=c(3,2,3,1.5))
plot(model, mfrow=c(2,5))
par(old.par)

summary(model)
summary(model2)

2
এটি একটি দুর্দান্ত উদাহরণ, সুতরাং এটির জন্য +1। তবে, যেমন আপনি ইতিমধ্যে চিহ্নিত করেছেন, এটি অন্যকে বিএমএ ব্যবহারের ব্যাপারে নিশ্চিত করতে সত্যই সহায়তা করে না। প্রকৃতপক্ষে, আমি এটি চালিয়েছি এবং এমনকি এটি আমাকে বোঝাতে কিছুটা সময় নিয়েছিল যে ক্লাসিকাল পদ্ধতির চেয়ে বিএমএ এখানে আরও ভাল: সেরা মডেলটি সত্য মডেল নয় (সেরা মডেলটিতে কেবল এক্স 2 এবং এক্স 3 রয়েছে) এবং মডেল 2 এর পরামিতিগুলি নয় অন্তত প্রাসঙ্গিক পরামিতিগুলির জন্য এটি অনেকটা বন্ধ। যাইহোক, এটি কিছু উল্লেখযোগ্য প্যারামিটারগুলি x5 এবং x6 দেখায় যা সেখানে থাকা উচিত নয় এবং বিএমএ আপনাকে জানায় যে এটি তাত্পর্যপূর্ণ নয়, তাই এটি বিএমএর জন্য একটি প্লাস।
ক্রিস্টোফ_জে

2

এর জন্য একটি দুর্দান্ত উত্স হ'ল:
বেইসিয়ান মডেল গড়পড়া বিএমএসের সাথে স্টেফান জিউগনার (২০১২)

এটি আর-প্যাকেজ বিএমএস ব্যবহার করছে , আরও তথ্য এখানে পাওয়া যাবে:
http://bms.zeugner.eu/

প্যাকেজটির সাথে বাস্তব-জগতের উদাহরণগুলি পুনঃপ্রমাণের জন্য দুটি হ্যান্ডস অন টিউটোরিয়াল এখানে পাওয়া যাবে:

বায়েশিয়ান পদ্ধতিগুলির আরও সাধারণ প্রেরণাদায়ক এবং বর্তমান পরিচয় নীচের কাগজটি হল:

সময় এসেছে: জন কে ক্রুশকে, হারমান আগুইনিস এবং হ্যারি জুয়ের সাংগঠনিক বিজ্ঞানে ডেটা বিশ্লেষণের জন্য বেয়েসিয়ান পদ্ধতিগুলি


লিঙ্কগুলির জন্য ধন্যবাদ, তবে তারা আসলে আমি যা করছি তা নয়। আমি প্যাকেজটি আসলে জানতাম এবং ব্যবহার করেছি (এটি দুর্দান্ত) এবং আমি সম্মত হই যে তাদের ডকুমেন্টেশন সত্যই শিক্ষণীয়। তবে আবার, লেখকদের উদ্দেশ্য কাউকে বোঝানো নয় (আশা করা যায় 5 মিনিটেরও কম সময়ে) কেন তাদের বিএমএ ব্যবহার করা উচিত, তবে তারা যে এটি ব্যবহার করতে চান তা তাদের প্যাকেজ দিয়ে কীভাবে করবেন। সুতরাং তারা attitudeউদাহরণ দিয়ে শুরু করে এবং আপনি যদি আপনার প্রথম লিঙ্কটি স্ক্রোল করেন তবে সত্যিই এমন কোনও টেবিল বা চিত্র নেই যেখানে আপনি চিৎকার করবেন: "গীজ, আমি বিএমএ ব্যবহার করে খুশি!"
ক্রিস্টোফ_জে

অবিরত: কেবল স্পষ্ট করে বলতে গেলে, এটি অবশ্যই কোনওভাবেই তাদের ডকুমেন্টেশনের সমালোচনা নয়: এটি প্রথম দিকে তাদের উদ্দেশ্য নয়। একটি উদাহরণ দিতে আমি পরে আছি। আসুন ধরে নেওয়া যাক আপনি লিনিয়ার রিগ্রেশনটিতে প্রবাসীদের সমস্যাটি ব্যাখ্যা করতে চান। আপনি সম্ভবত এখানে চার্ট মত কিছু দিয়ে শুরু হবে । অবশ্যই, বাস্তব ডেটাতে সমস্যাটি এত সহজ কখনও হবে না। আপনি কোনও আউটলেটর ইত্যাদি কীভাবে সংজ্ঞায়িত করবেন তা শক্ত হয়ে উঠবে তবে এই জাতীয় চার্টের সাহায্যে সবাই জানেন যে কী চলছে।
ক্রিস্টোফ_জে

3
@ ক্রিস্টোফ_জে: আপনি কি এই কাগজটি জানেন: indiana.edu/~kruschke/articles/ KruschkeAJ2012.pdf - এটি বিএমএ সম্পর্কে তেমন কিছু নয় তবে কাউকে প্রথমে বায়েশিয়ান পদ্ধতি ব্যবহার করতে রাজি করা সম্পর্কে - সম্ভবত এটি এমন কিছু যা সহায়ক জন্য সহায়ক আপনি :-)
ভোনজড

1
আমি জানতাম না যে এটি একটি এবং এটি বেয়েসিয়ান পদ্ধতিগুলির জন্য একটি খুব ভাল সূচনাপত্র, সুতরাং লিঙ্কটির জন্য +1। ধন্যবাদ।
ক্রিস্টোফ_জে

@ ক্রিস্টোফ_জে: আমি সেই অনুযায়ী পোস্টটি সম্পাদনা করেছি: উত্তরের জন্য আপনার +1 কাজ করেনি, এটি এখনও 0 (?!) তাই আপনি আবার এটি করতে পারেন - ধন্যবাদ :-)
ভনজড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.