একটি সাধারণ উদাহরণের জন্য ধরে নিন যে দুটি লিনিয়ার রিগ্রেশন মডেল রয়েছে
- মডেল 1 গেছে তিন ভবিষ্যতবক্তা,
x1a
,x2b
, এবংx2c
- মডেল 2 এর মডেল 1 থেকে তিনটি ভবিষ্যদ্বাণী এবং দুটি অতিরিক্ত ভবিষ্যদ্বাণী
x2a
এবংx2b
একটি জনসংখ্যার রিগ্রেশন সমীকরণ রয়েছে যেখানে জনসংখ্যার বৈচিত্রটি বর্ণিত হয়েছে মডেল 1 এর জন্য এবং মডেল 2 এর জন্য is জনসংখ্যার মডেল 2 দ্বারা বর্ণিত বর্ধিত পরিবর্তনগুলি হ'ল
আমি এর একজন অনুমানকারীর জন্য স্ট্যান্ডার্ড ত্রুটি এবং আত্মবিশ্বাসের । উদাহরণটিতে যথাক্রমে 3 এবং 2 ভবিষ্যদ্বাণী জড়িত রয়েছে, আমার গবেষণার আগ্রহটি বিভিন্ন সংখ্যক ভবিষ্যদ্বাণী (যেমন, 5 এবং 30) এর বিস্তৃত বিষয় নিয়ে উদ্বেগ প্রকাশ করে। আমার প্রথম চিন্তাটি ছিল একটি অনুমানকারী হিসাবে ব্যবহার করুন এবং এটি বুটস্ট্র্যাপ করুন তবে আমি নিশ্চিত নই যে এটি হবে কিনা উপযুক্ত হতে
প্রশ্নাবলি
- Is একটি যুক্তিসঙ্গত মূল্নির্ধারক ?
- জনসংখ্যার আর-বর্গ পরিবর্তনের জন্য আত্মবিশ্বাসের ব্যবধান কীভাবে পাওয়া যাবে (যেমন, ) ? )?
- আত্মবিশ্বাসের ব্যবধান গণনার জন্য কি বুটস্ট্র্যাপিং উপযুক্ত হবে?
সিমুলেশন বা প্রকাশিত সাহিত্যের কোনও উল্লেখও সর্বাধিক স্বাগত জানায়।
উদাহরণ কোড
যদি এটি সহায়তা করে তবে আমি আর তে সামান্য সিমুলেশন ডেটাসেট তৈরি করেছি যা একটি উত্তর প্রদর্শনের জন্য ব্যবহার করা যেতে পারে:
n <- 100
x <- data.frame(matrix(rnorm(n *5), ncol=5))
names(x) <- c('x1a', 'x1b', 'x1c', 'x2a', 'x2b')
beta <- c(1,2,3,1,2)
model2_rho_square <- .7
error_rho_square <- 1 - model2_rho_square
error_sd <- sqrt(error_rho_square / model2_rho_square* sum(beta^2))
model1_rho_square <- sum(beta[1:3]^2) / (sum(beta^2) + error_sd^2)
delta_rho_square <- model2_rho_square - model1_rho_square
x$y <- rnorm(n, beta[1] * x$x1a + beta[2] * x$x1b + beta[3] * x$x1c +
beta[4] * x$x2a + beta[5] * x$x2b, error_sd)
c(delta_rho_square, model1_rho_square, model2_rho_square)
summary(lm(y~., data=x))$adj.r.square -
summary(lm(y~x1a + x1b + x1c, data=x))$adj.r.square
বুটস্ট্র্যাপ নিয়ে উদ্বেগের কারণ
আমি প্রায় 300 টি কেস সহ কিছু ডেটা, এবং সাধারণ মডেলটিতে 5 ভবিষ্যদ্বাণী এবং সম্পূর্ণ মডেলটিতে 30 ভবিষ্যদ্বাণী নিয়ে একটি বুটস্ট্র্যাপ চালিয়েছি। সামঞ্জস্য করা আর-বর্গ পার্থক্য ব্যবহার করে নমুনা অনুমান করার সময় 0.116
, বুস্ট্রিপড আত্মবিশ্বাসের ব্যবধানটি বেশিরভাগ ক্ষেত্রে সিআই 95% (0.095 থেকে 0.214) বেশি ছিল এবং বুটস্ট্র্যাপগুলির গড় নমুনা অনুমানের কাছাকাছি ছিল না। বরং উত্সাহিত নমুনার গড়টি নমুনায় আর-স্কোয়ারের মধ্যে পার্থক্যের নমুনা অনুমানকে কেন্দ্র করে প্রদর্শিত হয়েছিল। এটি পার্থক্যটি অনুমান করার জন্য আমি নমুনা সমন্বিত আর-স্কোয়ারগুলি ব্যবহার করছিলাম তা সত্ত্বেও এটি।
মজার বিষয় হল, আমি হিসাবে বিকল্প উপায় চেষ্টা করেছি
- নমুনা আর-বর্গ পরিবর্তনের গণনা করুন
- স্ট্যান্ডার্ড অ্যাডজাস্টেড আর-বর্গ সূত্র ব্যবহার করে নমুনা আর-বর্গ পরিবর্তনকে সামঞ্জস্য করুন
নমুনা তথ্য প্রয়োগ যখন এই হিসেব কমিয়ে থেকে কিন্তু আস্থা অন্তর .118 গড় সঙ্গে পদ্ধতি আমি প্রথম উল্লেখ করা হয়েছে, CI95% (.062, .179) জন্য উপযুক্ত বলে মনে হলো।.082
বিস্তৃতভাবে, আমি উদ্বিগ্ন যে বুটস্ট্র্যাপিং অনুমান করে যে নমুনাটি জনসংখ্যা, এবং অতএব অনুমান করা হয় যে ওভারফিটিংয়ের জন্য হ্রাস যথাযথভাবে সম্পাদন করতে পারে না।