মোটামুটি স্বাভাবিক বিতরণের স্কেল অনুমানের জন্য শক্তিশালী বায়েশিয়ান মডেলটি কী হবে?


32

স্কেলের শক্তিশালী অনুমানের সংখ্যা রয়েছে । একটি উল্লেখযোগ্য উদাহরণ হ'ল মাঝারি পরম বিচ্যুতি যা হিসাবে স্ট্যান্ডার্ড বিচ্যুতির সাথে সম্পর্কিত । বায়েশিয়ান কাঠামোয় মোটামুটিভাবে সাধারণ বিতরণের অবস্থান সম্পর্কে দৃ rob়ভাবে অনুমান করার বিভিন্ন উপায় রয়েছে (উদাহরণস্বরূপ, বহিরাগতদের দ্বারা দূষিত একটি সাধারণ বলুন) উদাহরণস্বরূপ, কেউ ধরে নিতে পারে যে ডেটা বিতরণ বা ল্যাপ্লেস বিতরণ হিসাবে ডেটা বিতরণ করা হয়েছে। এখন আমার প্রশ্ন:σ=এমএকজনডি1,4826

শক্তিশালী উপায়ে মোটামুটি সাধারণ বিতরণের স্কেল পরিমাপের জন্য বায়েসীয় মডেল কী হবে , এমএডি বা অনুরূপ শক্তিশালী অনুমানকারীগুলির মতো একই অর্থে শক্তিশালী?

এমএডির ক্ষেত্রে যেমন হয়, ততক্ষণে বায়েশিয়ান মডেল যদি তথ্য বিতরণ করা হয় যখন সাধারণত বিতরণ করা হয় তখন একটি সাধারণ বিতরণের এসডির কাছে যেতে পারত ne

সম্পাদনা 1:

একটি মডেল একটি আদর্শ উদাহরণ যে দূষণ / outliers বিরুদ্ধে জোরালো হয় ডেটা অভিমানী হয় মোটামুটিভাবে স্বাভাবিক মত বন্টন এ ব্যবহার করছে:Yআমি

Yআমি~টি(মি,গুলি,ν)

কোথায় গড় করা হয়, স্কেল, এবং ডিগ্রী অফ স্বাধীনতা। উপর উপযুক্ত গতকাল দেশের সর্বোচ্চ তাপমাত্রা সঙ্গে এবং , গড় একটি অনুমান হতে হবে যে outliers বিরুদ্ধে জোরালো হবে। যাইহোক, on উপর নির্ভরশীল হিসাবে এর এসডির একটি ধারাবাহিক অনুমান হবে না । উদাহরণস্বরূপ, যদি 4.0 নির্ধারিত এবং হবে উপরে একটি থেকে নমুনা একটি বিশাল সংখ্যা লাগানো যেতে হবে মডেল বন্টন তারপরমিগুলিνমি,গুলিνমিYআমিগুলিYআমিগুলিννNorm(μ=0,σ=1)গুলিপ্রায় 0.82 হবে। আমি যা খুঁজছি তা এমন একটি মডেল যা শক্ত, টি মডেলের মতো, তবে এসডিটির পরিবর্তে (বা অতিরিক্ত হিসাবে) গড়টি নয়।

সম্পাদনা 2:

এখানে উল্লিখিত টি-মডেলটি কীভাবে গড়ের প্রতি শ্রদ্ধাশীল সে সম্পর্কে আর এবং জাএজিএস-এর একটি কোডিত উদাহরণ অনুসরণ করুন।

# generating some contaminated data
y <- c( rnorm(100, mean=10, sd=10), 
        rnorm(10, mean=100, sd= 100))

#### A "standard" normal model ####
model_string <- "model{
  for(i in 1:length(y)) {
    y[i] ~ dnorm(mu, inv_sigma2)
  }

  mu ~ dnorm(0, 0.00001)
  inv_sigma2 ~ dgamma(0.0001, 0.0001)
  sigma <- 1 / sqrt(inv_sigma2)
}"

model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=10000)
summary(mcmc_samples)

### The quantiles of the posterior of mu
##  2.5%   25%   50%   75% 97.5% 
##   9.8  14.3  16.8  19.2  24.1 

#### A (more) robust t-model ####
library(rjags)
model_string <- "model{
  for(i in 1:length(y)) {
    y[i] ~ dt(mu, inv_s2, nu)
  }

  mu ~ dnorm(0, 0.00001)
  inv_s2 ~ dgamma(0.0001,0.0001)
  s <- 1 / sqrt(inv_s2)
  nu ~ dexp(1/30) 
}"

model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=1000)
summary(mcmc_samples)

### The quantiles of the posterior of mu
## 2.5%   25%   50%   75% 97.5% 
##8.03  9.35  9.99 10.71 12.14 

হতে পারে এটি যথেষ্ট শক্তিশালী নয়, তবে চি-স্কোয়ার ডিস্ট্রিবিউশনটি বৈকল্পিকের বিপরীত হওয়ার আগে সাধারণত নির্বাচিত সংযুক্তি j
মাইক ডুনলাভে

আপনি দেখতে চাইতে পারেন stats.stackexchange.com/questions/6493/… এই প্রশ্নের প্রথম উত্তরটি আপনার পক্ষে যথেষ্ট কিনা ; এটি ভাল নাও হতে পারে, তবে হতে পারে।
jboman

দূষণের স্তরের জন্য আপনি কী আগে? দূষণ কি নিয়মতান্ত্রিক হবে? এলোমেলো? এটি কি একক বিতরণ, বা একাধিক বিতরণ দ্বারা উত্পাদিত হবে? আমরা শব্দ শব্দ বিতরণ (গুলি) সম্পর্কে কিছু জানি? যদি উপরের জিনিসগুলির মধ্যে কমপক্ষে কিছু জানা থাকে তবে আমরা কোনও মিশ্রণ মডেলটি ফিট করতে পারি। অন্যথায়, আমি নিশ্চিত নই যে এই সমস্যাটি সম্পর্কে আপনার বিশ্বাসগুলি আসলে কী এবং আপনার যদি এটির কিছু না থাকে তবে এটি খুব অস্পষ্টতার মতো বলে মনে হচ্ছে। আপনাকে কিছু ঠিক করতে হবে, অন্যথায় আপনি এলোমেলোভাবে একটি পয়েন্ট বাছাই করতে পারেন এবং এটিকে কেবল গাউসিয়ান উত্পন্ন পয়েন্ট হিসাবে ঘোষণা করতে পারেন।
অর্থ-অর্থ-

তবে সাধারণভাবে, আপনি হয় টি-বিতরণ ফিট করতে পারেন যা বিদেশীদের বিরুদ্ধে আরও প্রতিরোধী, বা টি-বিতরণের মিশ্রণ। আমি নিশ্চিত অনেক কাগজপত্র, এখানে বিশপ দ্বারা এক research.microsoft.com/en-us/um/people/cmbishop/downloads/... এবং এখানে হইয়া মিশ্রণ একটি r-প্যাকেজ: maths.uq.edu। এউ / ~ জিজেএম / মিক্স_সোফ্ট / ইএমএমআইএক্স_আর / ইএমএমআইএক্স-ম্যানুয়াল.পিডিএফ
অর্থ-

1
আপনারσ=MAD1,4826 সাধারণভাবে বিতরণ করা জনগোষ্ঠীর পক্ষে সত্য তবে অন্যান্য বিতরণের ক্ষেত্রে নয়
হেনরি

উত্তর:


10

একটি উপযুক্ত পূর্বের সাথে টি শব্দের মডেলটিতে বায়েশিয়ান অনুমানের অবস্থান এবং স্কেল সম্পর্কে একটি শক্তিশালী অনুমান দেবে। সম্ভাব্যতা এবং পূর্বের প্রয়োজনীয়তাগুলি সুনির্দিষ্ট করার জন্য অ্যান্ড্রেড এবং ও'গান (২০১১) দ্বারা অবস্থান এবং স্কেল পরামিতির মডেলিং বায়েশিয়ান দৃust়তা মডেলিংয়ে দেওয়া হয়েছে । অনুমানগুলি এই অর্থে দৃ sense় যে কোনও একক পর্যবেক্ষণ অনুমানগুলি ইচ্ছাকৃতভাবে বড় করতে পারে না, যেমনটি কাগজের 2 নং চিত্রে প্রদর্শিত হয়েছে।

যখন ডেটা স্বাভাবিকভাবে বিতরণ করা হয়, লাগানো টি বন্টন (সংশোধন করা হয়েছে জন্য এসডি ) উৎপাদিত বিতরণের এসডি সাথে মিলছে না। তবে এটি ঠিক করা সহজ। যাক σ উৎপাদিত বিতরণের স্ট্যানডার্ড ডেভিয়েশন হতে হবে এবং দিন গুলি লাগানো টি বিতরণের স্ট্যানডার্ড ডেভিয়েশন হও। যদি ডেটা 2 দিয়ে মাপানো হয়, তবে সম্ভাবনার ফর্ম থেকে আমরা জানি যে গুলি 2 দ্বারা স্কেল করা আবশ্যক This এটি বোঝায় যে s = σ f (νσss কিছু নির্দিষ্ট ফাংশন জন্য । এই ফাংশনটি একটি স্ট্যান্ডার্ড নরমাল থেকে সিমুলেশন করে সংখ্যার সাথে গণনা করা যায়। এটি করার কোডটি এখানে:s=σf(ν)f

library(stats)
library(stats4)
y = rnorm(100000, mean=0,sd=1)
nu = 4
nLL = function(s) -sum(stats::dt(y/s,nu,log=TRUE)-log(s))
fit = mle(nLL, start=list(s=1), method="Brent", lower=0.5, upper=2)
# the variance of a standard T is nu/(nu-2)
print(coef(fit)*sqrt(nu/(nu-2)))

উদাহরণস্বরূপ, আমি f ( ν ) = 1.18 পেয়েছি । পছন্দসই মূল্নির্ধারক তারপর σ = গুলি /( ν )ν=4f(ν)=1.18σ^=s/f(ν)


1
সুন্দর উত্তর (+1)। 'এই অর্থে যে একটি একক পর্যবেক্ষণ অনুমানগুলি নির্বিচারে বৃহত্তর করতে পারে না, "সুতরাং ভাঙ্গন পয়েন্টটি 2 / এন (আমি এটি সম্পর্কে ভাবছিলাম) .... তুলনার একটি বিষয় হিসাবে, আমার উত্তরে বর্ণিত পদ্ধতিটির জন্য এটি N / 2।
ব্যবহারকারী 60

ওহ ধন্যবাদ! অস্পষ্ট প্রশ্ন অনুসরণ তাহলে কি স্কেলটি "সংশোধন" করার তাৎপর্য বোধ করবে তাই এটি সাধারণ ক্ষেত্রে এসডির সাথে সামঞ্জস্যপূর্ণ? আমি যে ব্যবহারের ক্ষেত্রেটির কথা ভাবছি তা হ'ল ছড়িয়ে পড়া পরিমাপের প্রতিবেদন করার সময়। আমার স্কেল রিপোর্ট করার ক্ষেত্রে কোনও সমস্যা হবে না তবে এসডি এর সাথে সামঞ্জস্যপূর্ণ এমন কোনও কিছু জানানো ভাল লাগবে কারণ এটি ছড়িয়ে যাওয়ার সবচেয়ে সাধারণ পরিমাপ (অন্তত মনোবিজ্ঞানে)। আপনি কি এমন পরিস্থিতি দেখেন যেখানে এই সংশোধনটি অদ্ভুত এবং বেমানান অনুমানের দিকে পরিচালিত করবে?
রাসমাস বুথ

6

আপনি একটি খুব সুনির্দিষ্ট সমস্যা (শক্তিশালী অনুমান) সম্পর্কে কোনও প্রশ্ন জিজ্ঞাসা করার সময়, আমি আপনাকে একটি সমান সুনির্দিষ্ট উত্তর দেব। যাইহোক, প্রথমে, আমি একটি অযৌক্তিক ধারণা অনুমান করার চেষ্টা করব। এটি সত্য নয় যে অবস্থানের শক্তিশালী বেয়েসিয়ান প্রাক্কলন রয়েছে (অবস্থানগুলির বায়সিয়ান অনুমান আছে তবে আমি নীচে চিত্রিত করেছি যে তারা শক্তিশালী নয় এবং, সম্ভবত স্পষ্টতই , এমনকি অবস্থানটির সহজতম দৃ esti় অনুমানকও বায়সিয়ান নয়)। আমার মতে, লোকেশনের ক্ষেত্রে 'বায়সিয়ান' এবং 'রোবস্ট' দৃষ্টান্তের মধ্যে ওভারল্যাপ না থাকার কারণগুলি ব্যাখ্যা করার ক্ষেত্রে অনেক বেশি এগিয়ে যায় যে কেন ছড়িয়ে ছিটিয়ে থাকা কোনও অনুমানকারী নেই যা শক্তিশালী এবং বেয়েসিয়ান উভয়ই নয়।

এবং on এ যথাযথ প্রিয়ার সহ , এম হ'ল ওয়াই i এর গড় অনুমান হবে যা বিদেশীদের বিরুদ্ধে শক্তিশালী হবে।m,sνmyi

আসলে না. ফলাফল অনুমানগুলি কেবল শক্ত শব্দটির খুব দুর্বল অর্থেই দৃust় হবে। যাইহোক, যখন আমরা বলি যে মিডিয়ানটি শক্তিশালী outliers আমরা শব্দার্থ শক্তসমর্থ অনেক শক্তিশালী অর্থে। এটি হ'ল দৃ statistics় পরিসংখ্যানগুলিতে, মধ্যকের দৃ of়তা সেই সম্পত্তিটিকে বোঝায় যে আপনি যদি ইউনি-মডেল, অবিচ্ছিন্ন মডেল থেকে আঁকা পর্যবেক্ষণের ডেটা-সেট-এর জন্য মিডিয়েনটি গণনা করেন এবং তারপর এই পর্যবেক্ষণগুলির অর্ধেকেরও কম স্থানে নির্বিচার মানগুলি প্রতিস্থাপন করেন , দূষিত ডেটাতে গণনা করা মধ্যমানের মানটি আপনার মূল (অনিয়ন্ত্রিত) ডেটা সেটে গণনা করতে পারলে আপনি যে মানটি পেতেন তার কাছাকাছি। তারপরে, এটি দেখানো সহজ যে আপনি উপরে অনুচ্ছেদে উল্লিখিত অনুচ্ছেদে যে অনুমানের কৌশলটি প্রস্তাব করেছেন তা অবশ্যই নয় মধ্যবর্তীদের জন্য শব্দটি সাধারণত কীভাবে বোঝা যায় সেই অর্থে দৃust় হয়।

আমি বায়েশিয়ান বিশ্লেষণের সাথে সম্পূর্ণ অপরিচিত। যাইহোক, আমি ভাবছিলাম যে নিম্নলিখিত কৌশলটি ভুল, কারণ এটি সহজ, কার্যকর বলে মনে হচ্ছে এবং এখনও অন্য উত্তরে বিবেচনা করা হয়নি। পূর্বেরটি হ'ল ডেটাটির ভাল অংশটি একটি প্রতিসম বিতরণ থেকে অঙ্কিত হয় এবং দূষণের হার অর্ধেকেরও কম হয়। তারপরে, একটি সহজ কৌশলটি হ'ল:F

  1. আপনার ডেটাসেটের মিডিয়ান / পাগল গণনা করুন। তারপরে গণনা করুন:
    zi=|ximed(x)|mad(x)
  2. পর্যবেক্ষণ, যার জন্য অগ্রাহ্য (এই হল α বিতরণের সমাংশক z- র যখন এক্স ~ এফ )। এই পরিমাণটি F এর অনেক পছন্দের জন্য উপলভ্য এবং অন্যদের জন্য বুটস্ট্র্যাপ করা যায়।zi>qα(z|xF)αzxFF
  3. অ-প্রত্যাখ্যানিত পর্যবেক্ষণগুলির জন্য একটি (সাধারণ, অ-শক্তিশালী) বায়েশিয়ান বিশ্লেষণ চালান।

সম্পাদনা করুন:

সমস্যার একটি বোনডা বেডেসিয়ান বিশ্লেষণ পরিচালনা করার জন্য একটি স্বতঃপরিচিত আর কোড সরবরাহ করার জন্য ওপিকে ধন্যবাদ।

নীচের কোডটি শক্তিশালী পরিসংখ্যান সাহিত্যের থেকে বিকল্প হিসাবে ওপি কর্তৃক প্রস্তাবিত বায়সিয়ান পদ্ধতির তুলনা করে (উদাহরণস্বরূপ গাউস প্রস্তাবিত ফিটিং পদ্ধতির ক্ষেত্রে যেখানে ডেটাতে বহিরাগতের পরিমাণ থাকতে পারে এবং বিতরণ করা হয় তথ্যের ভাল অংশটি হল গাউসিয়ান)।n/22

তথ্য কেন্দ্রীয় অংশ হ'ল :N(1000,1)

n<-100
set.seed(123)
y<-rnorm(n,1000,1)

কিছু পরিমাণ দূষক যুক্ত করুন:

y[1:30]<-y[1:30]/100-1000 
w<-rep(0,n)
w[1:30]<-1

সূচক ডাব্লু বহিরাগতদের জন্য মান 1 নেয় আমি ওপি দ্বারা প্রস্তাবিত পদ্ধতির সাথে শুরু:

library("rjags")
model_string<-"model{
  for(i in 1:length(y)){
    y[i]~dt(mu,inv_s2,nu)
  }
  mu~dnorm(0,0.00001)
  inv_s2~dgamma(0.0001,0.0001)
  s<-1/sqrt(inv_s2)
  nu~dexp(1/30) 
}"

model<-jags.model(textConnection(model_string),list(y=y))
mcmc_samples<-coda.samples(model,"mu",n.iter=1000)
print(summary(mcmc_samples)$statistics[1:2])
summary(mcmc_samples)

আমি পাই:

     Mean        SD 
384.2283  97.0445 

এবং:

2. Quantiles for each variable:

 2.5%   25%   50%   75% 97.5% 
184.6 324.3 384.7 448.4 577.7 

(লক্ষ্য মান থেকে অনেক দূরে শান্ত)

শক্তিশালী পদ্ধতির জন্য,

z<-abs(y-median(y))/mad(y)
th<-max(abs(rnorm(length(y))))
print(c(mean(y[which(z<=th)]),sd(y[which(z<=th)])))

এক পায়:

 1000.149 0.8827613

(লক্ষ্য মানগুলির খুব কাছে)

দ্বিতীয় ফলাফলটি প্রকৃত মূল্যবোধের অনেক কাছাকাছি। তবে এটি সবচেয়ে খারাপ হয়। যদি আমরা সেই পর্যবেক্ষণগুলিকে আউটলিয়ার হিসাবে শ্রেণিবদ্ধ করি যার জন্য অনুমিত স্কোরটি বৃহত্তর (মনে রাখবেন যে পূর্ববর্তীটি এফ গাউসিয়ান) তবে বাইশিয়ান পদ্ধতির সন্ধান পাওয়া যায় যে সমস্ত পর্যবেক্ষণগুলি বিদেশী (শক্তিশালী পদ্ধতি, বিপরীতে, সমস্ত পতাকাঙ্কিত করে এবং যেমন কেবল আগতরা)। এটিও বোঝায় যে আপনি যদি শক্ত পদ্ধতির দ্বারা বিদেশী হিসাবে শ্রেণিবদ্ধ না করা ডেটাগুলির উপর একটি নিয়মিত (অ-শক্তিশালী) বেইসিয়ান বিশ্লেষণ চালাতে চান তবে আপনার অবশ্যই জরিমানা করা উচিত (যেমন আপনার প্রশ্নে বর্ণিত উদ্দেশ্যগুলি পূরণ করুন)।zthF
এটি কেবল একটি উদাহরণ, তবে এটি দেখানোর পক্ষে এটি মোটামুটি সোজা ward (এবং এটি আনুষ্ঠানিকভাবে করা যেতে পারে, উদাহরণস্বরূপ দেখুন, [১] এর দ্বিতীয় অধ্যায়ে) দূষিত উপাত্তগুলিতে লাগানো শিক্ষার্থীর বিতরণের প্যারামিটারগুলি প্রকাশ করার উপর নির্ভর করা যায় না outliers। t

  • [1] রিকার্ডো এ মেরোনা, ডগলাস আর মার্টিন, ভিক্টর জে যোহাই (2006)। দৃust় পরিসংখ্যান: তত্ত্ব এবং পদ্ধতি (সম্ভাব্যতা এবং পরিসংখ্যানে উইলি সিরিজ)।
  • হুবার, পিজে (1981)। দৃ Stat় পরিসংখ্যান নিউ ইয়র্ক: জন উইলি অ্যান্ড সন্স

1
ভাল, টি প্রায়শই সাধারণ বিতরণের শক্তিশালী বিকল্প হিসাবে প্রস্তাবিত। আমি জানি না এটি দুর্বল অর্থে আছে কি না। উদাহরণস্বরূপ দেখুন: ল্যাঞ্জ, কেএল, লিটল, আরজে, এবং টেলর, জেএম (1989)। টি বিতরণ ব্যবহার করে দৃust় পরিসংখ্যানের মডেলিং। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল , 84 (408), 881-896। পিডিএফ
রাসমাস বুথ

1
এটাই দুর্বল জ্ঞান। আপনার যদি প্রস্তাবিত পদ্ধতিটি কার্যকর করে এমন কোনও আর কোড রয়েছে তবে আমি একটি উত্তর দিয়ে আমার উত্তরটি বর্ণনা করতে পেরে খুশি হব। অন্যথায় আপনি এই পাঠ্যপুস্তকের দ্বিতীয় অধ্যায়ে আরও ব্যাখ্যা পেতে পারেন ।
ব্যবহারকারী 60

আমার প্রস্তাবিত পদ্ধতিটি মূলত এখানে বর্ণিত হয়েছে: india.edu/~kruschke/BEST আর কোড সহ। আমি আপনার সমাধান সম্পর্কে চিন্তা করতে হবে! এটি অবশ্য বায়েশিয়ানকে এই অর্থে মনে হয় না যে এটি সমস্ত উপাত্তকে মডেল করে না, কেবলমাত্র সাবসেটটি যে "টিকে আছে" পদক্ষেপ ২
রাসমাস বুথ


1
আমি এখন তাই করেছি!
রাসমুস বুথ

1

বৈসিয়ান বিশ্লেষণে নির্ভুলতার জন্য পূর্ববর্তী হিসাবে বিপরীত গামা বিতরণ ব্যবহার করা (বৈকল্পিকের বিপরীত) একটি সাধারণ পছন্দ। বা মাল্টিভারিয়েট মডেলগুলির জন্য বিপরীত উইশার্ট বিতরণ। বৈকল্পিকটিতে পূর্বের যোগ করা বিদেশীদের বিরুদ্ধে দৃust়তার উন্নতি করে।

অ্যান্ড্রু গেলম্যানের একটি সুন্দর কাগজ রয়েছে: "শ্রেণিবদ্ধ মডেলগুলিতে বৈকল্পিক পরামিতিগুলির জন্য পূর্ব বিতরণ" যেখানে তিনি বৈকল্পিকগুলিতে প্রিরিয়ারদের জন্য কী ভাল পছন্দ হতে পারে তা নিয়ে আলোচনা করেন।


4
আমি দুঃখিত তবে এটি প্রশ্নের উত্তর কীভাবে দেয় তা আমি ব্যর্থ হয়েছি। আমি শক্তিশালী আগে চাইনি, বরং শক্তিশালী মডেলের জন্য চাই
রাসমুস বুথ

0

μNσ2μtN

σD

D|μ,σN(μ,σ2)
D(d1,,dN)
p(D|μ,σ2)=1(2πσ)Nexp(N2σ2((mμ2)+s2))
ms2
m=1Ni=1Ndis2=1Ni=1Ndi2m2
p(μ,σ2|D)p(D|μ,σ2)p(μ,σ2)
(μ,σ2)p(μ,σ2|D)p(σ2|D)
σ2|DIG(α+N/2,2β+Ns2)α,β>0
σ2αβtμ

1
σ2

1
এটি শক্তিশালী বলতে কী বোঝায় তার উপর নির্ভর করে। আপনি এখনই যা বলছেন তা হ'ল আপনি দৃust়তা আর্ট ডেটা চান। আমি যা প্রস্তাব করছি তা হ'ল দৃust়তা আর্ট মডেলটির ভুল-স্পেসিফিকেশন। তারা উভয়ই দৃust়তার বিভিন্ন ধরণের।
ইয়ানিক

2
আমি বলব যে আমি যে উদাহরণগুলি দিয়েছি, এমএডি এবং ডেটা বন্টন হিসাবে বিতরণে ব্যবহার করা হ'ল ডেটার সাথে সম্মানের সাথে দৃ .়তার উদাহরণ।
রাসমুস বুথ

আমি বলব যে রাসমাস ঠিকই আছে এবং বিডিএ 3-তেও গেলম্যান ইর আল, যেমন একটি প্রাথমিক ধারণা হবে যে একই স্থানের প্যারামিটারের জন্য সাধারণ তুলনায় আরও বেশি ফ্যাট লেজ রয়েছে
ব্র্যাশ ইক্যুইলিরিয়াম

0

আমি আসল প্রশ্ন থেকে আলোচনা অনুসরণ করেছি। রাসমাস যখন আপনি দৃness়তা বলেন আমি নিশ্চিত যে আপনি ডেটাতে বোঝাচ্ছেন (বহিরাগতরা, বিতরণগুলির মিস-স্পেসিফিকেশন নয়)। আমি ডেটা বন্টনকে টি-বিতরণের পরিবর্তে ল্যাপ্লেস বিতরণ হিসাবে নেব, তারপরে আমরা যেমন সাধারণ প্রতিরোধের মতো যেখানে গড়কে মডেল করি, আমরা এখানে মিডিয়েন (খুব শক্তিশালী) ওরফে মিডিয়ান রিগ্রেশন (আমরা সবাই জানি) মডেল করব। মডেলটি হতে দিন:

Y=βX+ϵϵ(0,σ2)

f(β,σ,Y,X)βσ2। গিবস স্যাম্পলারের সাথে কি হয়? স্বাভাবিক পূর্ববর্তী + লাইলস লাইকহুড = ???? আমরা জানি। এছাড়াও চি-স্কোয়ারের পূর্ববর্তী + ল্যাপেলের সম্ভাবনা = ??? আমরা বিতরণ জানি না। সৌভাগ্যক্রমে আমাদের জন্য একটি অধ্যক্ষ আছে (আসলান, ২০১০) যা একটি সাধারণ স্তরের বিতরণের সম্ভাবনাকে সাধারণ বিতরণের স্কেল মিশ্রণে রূপান্তরিত করে যা আমাদের প্রিয়ারদের সংশ্লেষিত বৈশিষ্ট্য উপভোগ করতে সক্ষম করে। আমি মনে করি বর্ণিত পুরো প্রক্রিয়াটি বিদেশীদের ক্ষেত্রে পুরোপুরি শক্ত। একটি মাল্টিভারিয়েট সেটিংয়ে চি-স্কোয়ারটি অচিচার্ট বিতরণে পরিণত হয় এবং আমরা মাল্টিভারিয়েট লেলেস এবং সাধারণ বিতরণ ব্যবহার করি।


2
আপনার সমাধানটি অবস্থানটির দৃ esti় অনুমানের (মানে / মধ্যমা) ফোকাস বলে মনে হচ্ছে। আমার প্রশ্নটি বরং এসডি পুনরুদ্ধার করার ক্ষেত্রে সঙ্গতিপূর্ণ সম্পত্তি নিয়ে স্কেল অনুমানের বিষয়ে ছিল যখন ডেটা উত্পন্ন বিতরণটি স্বাভাবিক থাকে normal
রাসমুস বুথ

অবস্থানটির শক্তিশালী অনুমানের সাথে, অবস্থানটির কার্যকারিতা হিসাবে স্কেল অবিলম্বে অবস্থানের দৃ the়তা থেকে উপকৃত হয়। স্কেল শক্তিশালী করার অন্য কোনও উপায় নেই।
চেম্বারলাইন ফঞ্চা

যাইহোক, আমি অবশ্যই বলতে চাই যে আমি কীভাবে এই সমস্যাটিকে সবচেয়ে বেশি বিশেষত একটি সাধারণ বিতরণ দিয়ে মোকাবেলা করব যাতে আপনি জোর দিয়েছিলেন তা দেখার জন্য অধীর আগ্রহে অপেক্ষা করছি।
চেম্বারলাইন ফঞ্চা

0

Kxk1KVar(yk)[0,)ln[Var(yk)]tn

পরিবর্তে যদি আপনি কোনও সাধারণ বিতরণের জন্য স্কেল প্যারামিটারের উপর পূর্ব বিতরণ বরাদ্দ করে থাকেন তবে অনুরূপ যুক্তি প্রযোজ্য। স্পর্শকাতরভাবে, লঘনোর্মাল এবং বিপরীত-গামা বিতরণগুলি যদি আপনি পূর্ববর্তী মোডের সান্নিধ্যের উদ্দেশ্যে অগ্রসর না হয়ে সীমানা গঠন করতে চান তবে আপনি মোড় শূন্যের কাছাকাছি পৌঁছানোর কারণে যদি আপনি তাদের পরামিতি করেন তবে তারা তীব্রভাবে শীর্ষে চলে যায়। আলোচনার জন্য বিডিএ 3 অধ্যায়টি দেখুন। সুতরাং লেজ বেধের ক্ষেত্রে একটি শক্তিশালী মডেল সনাক্তকরণ ছাড়াও, মনে রাখবেন যে কুর্তোসিসটি আপনার অনুক্রমের পক্ষেও গুরুত্বপূর্ণ।

আমি আশা করি এটি আমার সাম্প্রতিক প্রশ্নের একটিতে আপনার উত্তর যতটা সহায়তা করেছে আপনাকে ততটাই সহায়তা করবে।


1
আমার প্রশ্ন পরিস্থিতি সম্পর্কে ছিল যখন আপনার একটি গ্রুপ রয়েছে এবং কীভাবে দৃ group়ভাবে সেই গোষ্ঠীর স্কেলটি অনুমান করা যায়। বহিরাগতদের ক্ষেত্রে আমি বিশ্বাস করি না যে নমুনা বৈকল্পিককে শক্তিশালী বলে মনে করা হয়।
রাসমুস বুথ

যদি আপনার একটি গোষ্ঠী থাকে এবং আপনি এর স্বাভাবিক বন্টন অনুমান করছেন তবে আপনার প্রশ্নটি এর স্কেল পরামিতিটির চেয়ে পূর্বের আকারে প্রযোজ্য। আমার উত্তর থেকে বোঝা যায়, আপনি এর লগ রূপান্তরকরণের উপর বিতরণে ব্যবহার করতে পারেন বা এর কুর্তোসিসের মতো বিতরণের অন্যান্য দিকগুলি সম্পর্কে সতর্ক হয়ে ইতিবাচক বাস্তব সমর্থন সহ একটি চর্বিযুক্ত লেজযুক্ত বিতরণ চয়ন করতে পারেন। নীচের লাইন, আপনি যদি কোনও স্কেল প্যারামিটারের জন্য একটি শক্ত মডেল চান তবে এর লগ রূপান্তর বা অন্য কোনও ফ্যাট লেজযুক্ত বিতরণ বিতরণে ব্যবহার করুন।
ব্রাশ ভারসাম্য
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.