নমুনা বুটস্ট্র্যাপ করার সময় কেন কেন্দ্রিংয়ের প্রয়োজন?


13

কীভাবে নমুনার বন্টন আনুমানিক করবেন তা পড়ার অর্থ আমি ননপ্যারমেট্রিক বুটস্ট্র্যাপ পদ্ধতিটি পেরিয়ে এসেছি। দৃশ্যত এক বিতরণের অনুমান করতে পারে বন্টনের দ্বারা ˉ এক্স * এন - ˉ এক্স এন , যেখানে ˉ এক্স * এন বুটস্ট্র্যাপ নমুনা নমুনা গড় উল্লেখ করে।X¯nμX¯nX¯nX¯n

আমার প্রশ্নটি তখন: আমার কি কেন্দ্রীকরণ প্রয়োজন? কিসের জন্য?

আমি কি P ( ˉ Xnx ) দ্বারা প্রায় আনুমানিক পারি না ?P(X¯nx)P(X¯nx)


আপনার কিছু কেন কেন প্রয়োজন তা আমি দেখতে পাচ্ছি না। এখানে আলোচিত সমস্ত নমুনা কি একই আকারের?
বিটওয়াইজ

হ্যাঁ, একই আকার। কেন্দ্রীকরণের কারণ আমি দেখছি না। কেউ কি গাণিতিক ব্যাখ্যা নিয়ে আসতে সক্ষম হবেন কেন বা কেন আমাদের তা করতে হবে না? মানে, আমরা কি প্রমাণ করতে পারি যে কেন্দ্র না রাখলে বুটস্ট্র্যাপ কাজ করে বা কাজ করে না?
ক্রিস্টিন

3
(বিটিডব্লিউ, এই প্রমাণ যে বুটস্ট্র্যাপ আমাদের যে কেন্দ্রিক কেন্দ্রের ক্ষেত্রে কাজ করেছিল সেগুলি বিকেল, পিজে এবং ডিএ ফ্রিডম্যান (1981), বুটস্ট্র্যাপের জন্য কিছু অ্যাসিম্পটোটিক তত্ত্ব পাওয়া যাবে ))
ক্রিস্টিন

আমি কৌতূহলী: কেন এই প্রশ্নটি নিম্নচ্যুত?
কার্ডিনাল

হতে পারে আমরা কেন্দ্রীয় সীমাবদ্ধ উপপাদ ব্যবহার করতে সক্ষম হতে প্রবেশকারীটি করি যা আমাদের সেই এন 1 দেয়n1হিসাবে একই বিতরণে রূপান্তর করেn12(X¯nμ),এন থেকে(0,σ2)। হয়তো কেন্দ্রের ব্যতীত কেসটির জন্য কোনও অ্যাসিম্পটিক্স উপলব্ধ নেই যা আমাদের কাজ করে কিনা তা জানান। n12(X¯nX¯n)N(0,σ2)
কেলু

উত্তর:


4

হ্যাঁ, আপনি পারেন আনুমানিক দ্বারা পি ( ˉ এক্স * এনএক্স ) কিন্তু এটা অনুকূল নয়। এটি পারসেন্টাইল বুটস্ট্র্যাপের একটি রূপ। যাইহোক, আপনি যদি জনসংখ্যার বিষয়ে ধারণা তৈরি করতে চাইছেন তবে পার্সেন্টাইল বুটস্ট্র্যাপটি ভাল পারফর্ম করে না যদি আপনার আকারের বড় আকার না থাকে। (নমুনার আকারের আকার যখন ছোট হয় সহ এটি অন্যান্য অনেকগুলি ইনফরমেশন সমস্যার সাথে ভাল সম্পাদন করে)) আমি উইলকক্সের সামাজিক ও আচরণগত বিজ্ঞান , সিআরসি প্রেস, ২০১২ এর আধুনিক পরিসংখ্যান থেকে এই উপসংহারটি নিয়েছি A একটি তাত্ত্বিক প্রমাণ আমার বাইরেও আমি ভীত afraid ।P(X¯nx)P(X¯nx)

কেন্দ্রিক পদ্ধতির একটি বৈকল্পিক পরবর্তী পদক্ষেপে চলে যায় এবং পুনরায় নমুনা মানক বিচ্যুতি এবং নমুনা আকারের সাথে আপনার কেন্দ্রিক বুটস্ট্র্যাপ পরিসংখ্যানকে স্কেল করে, পরিসংখ্যান হিসাবে একইভাবে গণনা করে। এই টি এর পরিসংখ্যান বিতরণ থেকে কোয়ান্টাইলগুলি একটি আত্মবিশ্বাসের ব্যবধান তৈরি করতে বা হাইপোথিসিস পরীক্ষা সম্পাদন করতে ব্যবহার করা যেতে পারে। এটি বুটস্ট্র্যাপ-টি পদ্ধতি এবং গড় সম্পর্কে ধারণা তৈরি করার সময় এটি উচ্চতর ফলাফল দেয়।

s

T=X¯nX¯s/n

Tμ

X¯T0.975sn,X¯T0.025sn

নীচের সিমুলেশন ফলাফলগুলি বিবেচনা করুন, এটি দেখিয়েছেন যে একটি খারাপভাবে স্কিউড মিশ্র বিতরণের মাধ্যমে এই পদ্ধতিটির আস্থাভাজনের ব্যবধানগুলি পার্সেন্টাইল বুটস্ট্র্যাপ পদ্ধতি বা কোনও বুটস্ট্র্যাপিং ছাড়াই পরিসংখ্যানের একটি aতিহ্যগত বিপরীতার চেয়ে বেশি ঘন ঘন প্রকৃত মান ধারণ করে।

compare.boots <- function(samp, reps = 599){
    # "samp" is the actual original observed sample
    # "s" is a re-sample for bootstrap purposes

    n <- length(samp)

    boot.t <- numeric(reps)
    boot.p <- numeric(reps)

    for(i in 1:reps){
        s <- sample(samp, replace=TRUE)
        boot.t[i] <- (mean(s)-mean(samp)) / (sd(s)/sqrt(n))
        boot.p[i] <- mean(s)
    }

    conf.t <- mean(samp)-quantile(boot.t, probs=c(0.975,0.025))*sd(samp)/sqrt(n)
    conf.p <- quantile(boot.p, probs=c(0.025, 0.975))

    return(rbind(conf.t, conf.p, "Trad T test"=t.test(samp)$conf.int))
}

# Tests below will be for case where sample size is 15
n <- 15

# Create a population that is normally distributed
set.seed(123)
pop <- rnorm(1000,10,1)
my.sample <- sample(pop,n)
# All three methods have similar results when normally distributed
compare.boots(my.sample)

এটি নিম্নলিখিতটি দেয় (কনফিটটি বুটস্ট্র্যাপ টি পদ্ধতি; কনফ। পি পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতি)।

          97.5%     2.5%
conf.t      9.648824 10.98006
conf.p      9.808311 10.95964
Trad T test 9.681865 11.01644

স্কিউড বিতরণ থেকে একক উদাহরণ সহ:

# create a population that is a mixture of two normal and one gamma distribution
set.seed(123)
pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
my.sample <- sample(pop,n)
mean(pop)
compare.boots(my.sample)

এটি নিম্নলিখিত দেয়। মনে রাখবেন যে "কনফিট.টি" - বুটস্ট্র্যাপ টি সংস্করণ - অন্যান্য দুটির চেয়ে বৃহত্তর আত্মবিশ্বাসের ব্যবধান দেয়। মূলত, জনসংখ্যার অস্বাভাবিক বিতরণে সাড়া দেওয়া ভাল।

> mean(pop)
[1] 13.02341
> compare.boots(my.sample)
                97.5%     2.5%
conf.t      10.432285 29.54331
conf.p       9.813542 19.67761
Trad T test  8.312949 20.24093

পরিশেষে এখানে এক হাজার সিমুলেশন রয়েছে যা কোন সংস্করণটি বেশিরভাগ ক্ষেত্রে সঠিক এমন আত্মবিশ্বাসের অন্তর দেয়:

# simulation study
set.seed(123)
sims <- 1000
results <- matrix(FALSE, sims,3)
colnames(results) <- c("Bootstrap T", "Bootstrap percentile", "Trad T test")

for(i in 1:sims){
    pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
    my.sample <- sample(pop,n)
    mu <- mean(pop)
    x <- compare.boots(my.sample)
    for(j in 1:3){
        results[i,j] <- x[j,1] < mu & x[j,2] > mu
    }
}

apply(results,2,sum)

এটি নীচের ফলাফলগুলি দেয় - সংখ্যাগুলি 1000 এর মধ্যে এমন সময় হয় যে আত্মবিশ্বাসের ব্যবধানে একটি সিমুলেটেড জনসংখ্যার প্রকৃত মান থাকে। লক্ষ্য করুন যে প্রতিটি সংস্করণের সত্যিকারের সাফল্যের হার 95% এর চেয়ে কম।

     Bootstrap T Bootstrap percentile          Trad T test 
             901                  854                  890 

আপনাকে ধন্যবাদ, এটি খুব তথ্যপূর্ণ ছিল। এই .pdf (একটি পাঠ থেকে) আপনার উপসংহারে একটি সতর্কবাণী বর্ণনা করেছে: মনোবিজ্ঞান.ম্যাকমাস্টার.সিএ / বেনেট / বুট09 / স্পেনসেন্টাইল টি.পিডিএফ এটি বেনেটের যা বলে তার সংক্ষিপ্তসার: অনেকগুলি ডাটা্যাসেট সংখ্যার সমন্বয়ে থাকে> = 0 (অর্থাত্ ডেটা) এটি গণনা করা যেতে পারে), সেক্ষেত্রে সিআই-তে নেতিবাচক মান থাকতে হবে না। বুটস্ট্র্যাপ-টি পদ্ধতি ব্যবহার করে এটি ঘটতে পারে, আত্মবিশ্বাসের ব্যবধানকে অবর্ণনীয় করে তোলে। ডেটা> = 0 হওয়া আবশ্যকতা সাধারণ বিতরণ অনুমানের লঙ্ঘন। পারসেন্টাইল বুটস্ট্র্যাপড সিআই নির্মাণ করার সময় এটি কোনও সমস্যা নয়
হ্যানস জিগলার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.