বুটস্ট্র্যাপ বিতরণের মানক ত্রুটি ব্যবহার


19

(প্রয়োজনে আর কোডটি উপেক্ষা করুন, কারণ আমার মূল প্রশ্নটি ভাষা-স্বতন্ত্র)

যদি আমি একটি সাধারণ পরিসংখ্যানের (যেমন: অর্থ) পরিবর্তনশীলতাটি দেখতে চাই তবে আমি জানি যে আমি এটি তত্ত্বের মাধ্যমে এটি করতে পারি:

x = rnorm(50)

# Estimate standard error from theory
summary(lm(x~1))
# same as...
sd(x) / sqrt(length(x))

বা বুটস্ট্র্যাপের মতো:

library(boot)

# Estimate standard error from bootstrap
(x.bs = boot(x, function(x, inds) mean(x[inds]), 1000))
# which is simply the standard *deviation* of the bootstrap distribution...
sd(x.bs$t)

তবে, আমি যা ভাবছি তা হ'ল, কিছু পরিস্থিতিতে বুটস্ট্র্যাপ বিতরণের মানক ত্রুটির দিকে নজর দেওয়া কি কার্যকর / বৈধ (?) হতে পারে ? যে পরিস্থিতিটির সাথে আমি মুখোমুখি হচ্ছি তা একটি তুলনামূলক কোলাহলহীন লাইনযুক্ত ফাংশন, যেমন:

# Simulate dataset
set.seed(12345)
n   = 100
x   = runif(n, 0, 20)
y   = SSasymp(x, 5, 1, -1) + rnorm(n, sd=2)
dat = data.frame(x, y)

এখানে মডেলটি মূল ডেটা সেট ব্যবহার করে রূপান্তর করে না,

> (fit = nls(y ~ SSasymp(x, Asym, R0, lrc), dat))
Error in numericDeriv(form[[3L]], names(ind), env) : 
  Missing value or an infinity produced when evaluating the model

সুতরাং পরিবর্তে আমি যে পরিসংখ্যানগুলিতে আগ্রহী সেগুলি হ'ল এই এনএলএস প্যারামিটারগুলির আরও স্থিতিশীল অনুমান - সম্ভবত তাদের বেশ কয়েকটি বুটস্ট্র্যাপের অনুলিপিগুলিতে means

# Obtain mean bootstrap nls parameter estimates
fit.bs = boot(dat, function(dat, inds)
              tryCatch(coef(nls(y ~ SSasymp(x, Asym, R0, lrc), dat[inds, ])),
                       error=function(e) c(NA, NA, NA)), 100)
pars = colMeans(fit.bs$t, na.rm=T)

এগুলি প্রকৃতপক্ষে বল পার্কে আমি আসল তথ্যগুলি অনুকরণ করার জন্য ব্যবহার করি:

> pars
[1]  5.606190  1.859591 -1.390816

একটি চক্রান্ত করা সংস্করণ এর মত দেখাচ্ছে:

# Plot
with(dat, plot(x, y))

newx = seq(min(x), max(x), len=100)
lines(newx, SSasymp(newx, pars[1], pars[2], pars[3]))

lines(newx, SSasymp(newx, 5, 1, -1), col='red')
legend('bottomright', c('Actual', 'Predicted'), bty='n', lty=1, col=2:1)

এখানে চিত্র বর্ণনা লিখুন

এখন, আমি যদি এই স্থিতিশীল পরামিতি অনুমানগুলির পরিবর্তনশীলতা চাই তবে আমি মনে করি যে আমি এই বুটস্ট্র্যাপ বিতরণের স্বাভাবিকতা ধরে রেখে কেবল তাদের স্ট্যান্ডার্ড ত্রুটিগুলি গণনা করতে পারি:

> apply(fit.bs$t, 2, function(x) sd(x, na.rm=T) / sqrt(length(na.omit(x))))
[1] 0.08369921 0.17230957 0.08386824

এটি কি কোনও বুদ্ধিমান পন্থা? এর মতো অস্থির ননলাইনার মডেলগুলির পরামিতিগুলিতে অনুমানের জন্য আরও ভাল সাধারণ পদ্ধতির কি নেই? (আমি মনে করি আমি শেষ বিটের জন্য তত্ত্বের উপর নির্ভর না করে এখানে পুনরায় মডেলিংয়ের দ্বিতীয় স্তরটি করতে পারতাম, তবে এটি মডেলের উপর নির্ভর করে অনেক সময় নিতে পারে still তবুও, আমি নিশ্চিত নই যে এই স্ট্যান্ডার্ড ত্রুটিগুলি হবে কিনা) যে কোনও কিছুর জন্য উপকারী হবেন, যেহেতু আমি যদি বুটস্ট্র্যাপের প্রতিরূপের সংখ্যা বাড়িয়ে তুলি তবে তারা 0-এ পৌঁছাবে)

অনেক ধন্যবাদ, এবং, যাইহোক, আমি একজন প্রকৌশলী তাই দয়া করে আমাকে আশেপাশের একটি আপেক্ষিক নবাগত হিসাবে ক্ষমা করুন।

উত্তর:


13

এই প্রশ্নে বেশ কয়েকটি সমস্যা রয়েছে। প্রথমত, পৃথক বুটস্ট্র্যাপযুক্ত কিছু অনুমানকারী গণনাযোগ্য না হলেও (সমাধানের অভাব, সমাধানের অস্তিত্ব) এমনকি বুটস্ট্র্যাপযুক্ত গড়গুলি বুদ্ধিমান অনুমানযোগ্য কিনা তা নিয়ে প্রশ্ন রয়েছে। দ্বিতীয়ত, বুটস্ট্র্যাপযুক্ত অনুমানকগুলি বোধগম্য, এই অনুমানের জন্য কীভাবে আত্মবিশ্বাসের ব্যবধান বা কেবলমাত্র স্ট্যান্ডার্ড ত্রুটিগুলি পাওয়া যায় সে সম্পর্কে একটি প্রশ্ন রয়েছে।

--

তথ্যের উদ্দেশ্যটি হল, যদিও হিসাবগুলি হিসাব করার জন্য অ্যালগরিদম মাঝে মধ্যে ব্যর্থ হতে পারে বা যেখানে অনুমানকারী মাঝে মাঝে অপরিজ্ঞাত থাকে সে ক্ষেত্রেও অনুমান উত্পাদন করা। সাধারণ পদ্ধতির হিসাবে একটি সমস্যা রয়েছে:

  • বুটস্ট্র্যাপযুক্ত অনুমানের গড় গড় যখন বুটস্ট্র্যাপযুক্ত নমুনাগুলি অন্ধভাবে ফেলে দেয় যার জন্য অনুমানগুলি গণনাযোগ্য না হয় সাধারণভাবে পক্ষপাতিত্বমূলক ফলাফল দেয়।

সাধারণ সমস্যাটি কতটা তীব্র তা নির্ভর করে বেশ কয়েকটি বিষয়ের উপর। উদাহরণস্বরূপ, প্রায়শই অনুমানটি গণনাযোগ্য নয় এবং অনুমানটি গণনাযোগ্য নয় এমন নমুনার শর্তসাপেক্ষ বিতরণ যে হিসাবটি গণনাযোগ্য নয় তা প্রদত্ত নমুনার শর্তসাপেক্ষ বিতরণ থেকে পৃথক কিনা। আমি পদ্ধতিটি ব্যবহার করার পরামর্শ দেব না।

এক্সθ^θ^(এক্স)ওয়াই

θ~(এক্স)=(θ^(ওয়াই)|এক্স,একজন(এক্স))
একজন(এক্স)এক্সθ^(ওয়াই)এন-এক্সএকজন(এক্স)θ~(এক্স)

θ^(ওয়াই)এক্সএকজন(এক্স)θ~(এক্স)

একজন(এক্স)θ~(এক্স)

সম্পাদনা করুন :

ইফ্রন দ্বারা মডেল নির্বাচনের পরে খুব সুন্দর কাগজ অনুমান এবং নির্ভুলতা বুটস্ট্র্যাপিংয়ের দ্বিতীয় স্তরটি ব্যবহার না করে ব্যাগযুক্ত হিসাবরক্ষকের স্ট্যান্ডার্ড ত্রুটি অনুমান করার জন্য একটি সাধারণ পদ্ধতি দেয়। কাগজটি এমন অনুমানকারীগুলির সাথে স্পষ্টভাবে আচরণ করে না যা মাঝে মধ্যে গণনাযোগ্য হয় না।


ভয়ঙ্কর উত্তরের জন্য ধন্যবাদ। বিন্দু পক্ষপাত বিশেষত ভালভাবে নেওয়া হয়। আপনি এমন একটি চূড়ান্ত কেসটি কল্পনা করতে পারেন যেখানে পয়েন্ট ক্লাউডটি সম্পূর্ণ অভিন্ন, দূরবর্তী পয়েন্টগুলির একক সেটকে সংরক্ষণ করুন যা মডেলটি খুব সুন্দরভাবে ফিট করে। ফিটগুলির সিংহভাগ nlsব্যর্থ হতে পারে তবে একত্রিত হওয়াগুলির মধ্যে পক্ষপাত বিশাল হবে এবং পূর্বাভাসিত স্ট্যান্ডার্ড ত্রুটিগুলি / সিআই খুব সহজেই ছোট হবে। nlsBoot50% সফল ফিটের অ্যাডহক প্রয়োজনীয়তা ব্যবহার করে, তবে আমি আপনাকে সম্মত করি যে শর্তাধীন বিতরণগুলির (ডিস্ক) মিলটি সমানভাবে উদ্বেগজনক।
জন কলবি

(এই সাইটটি যদি আমাকে এসওয়ের মতো অনুমতি দেয় তবে আমি আগামীকাল আপনাকে একটি বোনাস দেওয়ার চেষ্টা করব)
জন কলবি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.