95% আত্মবিশ্বাসের ব্যবধানের পুনরাবৃত্তি পরীক্ষার ব্যাখ্যাগুলির সিমুলেশন অধ্যয়নের সাথে সমস্যাগুলি - আমি কোথায় ভুল করছি?


9

আমি একটি 95% আত্মবিশ্বাসের ব্যবধানের পুনরাবৃত্ত পরীক্ষা-নিরীক্ষার অনুকরণের জন্য একটি আর স্ক্রিপ্ট লেখার চেষ্টা করছি। আমি খুঁজে পেয়েছি যে এটি সময়ের যে অনুপাতের সত্য জনসংখ্যার মান নমুনার 95% সিআই-র মধ্যে থাকে তার চেয়ে বেশি অনুপাতকে গুরুত্ব দেয়। একটি বড় পার্থক্য নয় - প্রায় 96% বনাম 95% তবে তবুও এটি আমাকে আগ্রহী।

আমার ফাংশনটি samp_nসম্ভাব্যতার সাথে বার্নোল্লি বিতরণ থেকে একটি নমুনা নেয় pop_pএবং তারপরে prop.test()ধারাবাহিকতা সংশোধন ব্যবহার করে 95% আত্মবিশ্বাসের ব্যবধান গণনা করে বা আরও সঠিকভাবে binom.test()। প্রকৃত জনসংখ্যার অনুপাত pop_p95% সিআই এর মধ্যে থাকলে এটি 1 প্রদান করে । আমি দুটি ফাংশন লিখেছি, একটি যা ব্যবহার করে prop.test()এবং একটি যা ব্যবহার করে binom.test()এবং উভয়ের সাথে একই রকম ফলাফল পেয়েছে:

in_conf_int_normal <- function(pop_p = 0.3, samp_n = 1000, correct = T){
    ## uses normal approximation to calculate confidence interval
    ## returns 1 if the CI contain the pop proportion
    ## returns 0 otherwise
    samp <- rbinom(samp_n, 1, pop_p)
    pt_result <- prop.test(length(which(samp == 1)), samp_n)
    lb <- pt_result$conf.int[1]
        ub <- pt_result$conf.int[2]
    if(pop_p < ub & pop_p > lb){
        return(1)
    } else {
    return(0)
    }
}
in_conf_int_binom <- function(pop_p = 0.3, samp_n = 1000, correct = T){
    ## uses Clopper and Pearson method
    ## returns 1 if the CI contain the pop proportion
    ## returns 0 otherwise
    samp <- rbinom(samp_n, 1, pop_p)
    pt_result <- binom.test(length(which(samp == 1)), samp_n)
    lb <- pt_result$conf.int[1]
        ub <- pt_result$conf.int[2] 
    if(pop_p < ub & pop_p > lb){
        return(1)
    } else {
    return(0)
    }
 }

আমি খুঁজে পেয়েছি যে আপনি যখন পরীক্ষাটি কয়েক হাজার বার পুনরাবৃত্তি করবেন তখন pop_pনমুনার 95% সিআই এর মধ্যে থাকা সময়ের অনুপাতটি 0.95 এর পরিবর্তে 0.96 এর কাছাকাছি থাকে।

set.seed(1234)
times = 10000
results <- replicate(times, in_conf_int_binom())
sum(results) / times
[1] 0.9562

কেন এই ঘটনা হতে পারে সে সম্পর্কে এখনও পর্যন্ত আমার চিন্তাভাবনা

  • আমার কোডটি ভুল (তবে আমি এটি অনেক বেশি পরীক্ষা করেছি)
  • আমি প্রাথমিকভাবে ভেবেছিলাম এটি স্বাভাবিক আনুমানিক ইস্যুর কারণে হয়েছিল তবে তা পাওয়া গেছে binom.test()

কোন পরামর্শ?


(+1) যাইহোক, আমি times=100000কয়েকবার বিভিন্ন সময় নিয়ে আপনার কোডটি আবার চালিয়েছি এবং একই ফলাফলটি দেখেছি। কারও কাছে এর ব্যাখ্যা আছে কিনা তা জানতে আগ্রহী। কোডটি যথেষ্ট সহজ যে আমি খুব নিশ্চিত যে এখানে কোনও কোডিং ত্রুটি নেই। এছাড়াও, একটি রান ফলাফল হিসাবে হিসাবে times=1000000দিয়েছেন .954931
ম্যাক্রো

3
(+1) তবে কেন আপনি ঠিক 95% পাওয়ার আশা করছেন? ক্লোপার পিয়ারসন উদাহরণস্বরূপ রক্ষণশীল হওয়ার গ্যারান্টিযুক্ত। আপনার এবং , আমি পেয়েছি যে সিআই সময়ের 95.3648% আসল মানটি আবরণ করে। এনপি
কার্ডিনাল

2
কার্ডিনালগুলিকে সমর্থন করার জন্য সঠিক দ্বিপাক্ষিক সম্ভাবনাগুলি সঠিক কারণ কারণগুলি সঠিক সম্ভাবনার গণনার উপর ভিত্তি করে রয়েছে তবে তারা অগত্যা সঠিক আত্মবিশ্বাসের স্তর দেয় না। কারণ দ্বিপদী একটি বিস্তৃত বিতরণ। সুতরাং ক্লোপার-পিয়ারসন বিরতিটির শেষ পয়েন্টটি বেছে নিয়েছেন যাতে আপনার আত্মবিশ্বাসের স্তরের বা তার উপরে এটির নিকটতম সম্ভাবনা থাকে। এটি একটি সঠিক দ্বিপদী পরীক্ষার পাওয়ার ফাংশনে একটি করাতযুক্ত আচরণ তৈরি করে। আমেরিকান পরিসংখ্যানবিদ (২০০২) -এ ক্রিস্টিন লিউর সাথে আমার গবেষণাপত্রটিতে এই অদ্ভুত তবে মৌলিক ফলাফলটি নিয়ে আলোচনা করা হয়েছে।
মাইকেল আর চেরনিক

1
এই লিঙ্কে আমার কাগজে বিশদ: citeulike.org/user/austin987/article/7571878
মাইকেল আর চেরনিক

3
নির্ভুল দ্বিপদী সিআইগুলি "নির্ভুল" কারণ তাদের আসল কর্মক্ষমতা তাদের নামমাত্র পারফরম্যান্সের সমান, কারণ সম্ভাবনার গণনা "নির্ভুল" নয়! এটা তোলে বুঝতে হবে যে কোনো সি আই থাকতে হবে অন্তত একটি সত্য প্যারামিটার হয়, আচ্ছাদন সম্ভাবনা কোন ব্যাপার কি অন্তর্নিহিত বন্টন হয় (অধিকৃত পরিবার মধ্যে)। "সঠিক" অর্থ যে এই সব coverages এর infimum, ডিস্ট্রিবিউশন এর পুরো পরিবার অধিগৃহীত, সমান । এটি অর্জন করতে, অনেকগুলি সম্ভাব্য বিতরণের জন্য প্রকৃত কভারেজ প্রায়শই চেয়ে বেশি হওয়া উচিত । 1-α1-α 1-α1-α
whuber

উত্তর:


9

আপনি ভুল করছেন না। এটা শুধু একটি গঠন করা সম্ভব নয় একটি দ্বিপদ অনুপাত জন্য আস্থা ব্যবধান যা সবসময় কভারেজ রয়েছে ঠিক ফলাফল বিযুক্ত প্রকৃতির কারণে 95%। ক্লপার-পিয়ারসন ('সঠিক') অন্তর অন্তত 95% এর কভারেজ থাকার গ্যারান্টিযুক্ত । অন্যান্য অন্তর 95% কাছাকাছি কভারেজ আছে গড়ে যখন প্রকৃত অনুপাত তার গড় হিসাব।

আমি নিজেই জেফরির ব্যবধানের পক্ষে থাকি, কারণ এটির কভারেজটি গড়ে 95% এর কাছাকাছি এবং (উইলসনের স্কোর ব্যবধানের বিপরীতে) উভয় লেজের প্রায় সমান কভারেজ রয়েছে।

প্রশ্নের কোডটিতে কেবলমাত্র একটি ছোট পরিবর্তন হয়ে আমরা সিমুলেশন ছাড়াই সঠিক কভারেজটি গণনা করতে পারি।

p <- 0.3
n <- 1000

# Normal test
CI <- sapply(0:n, function(m) prop.test(m,n)$conf.int[1:2])
caught.you <- which(CI[1,] <= p & p <= CI[2,])
coverage.pr <- sum(dbinom(caught.you - 1, n, p))

# Clopper-Pearson
CI <- sapply(0:n, function(m) binom.test(m,n)$conf.int[1:2])
caught.you.again <- which(CI[1,] <= p & p <= CI[2,])
coverage.cp <- sum(dbinom(caught.you.again - 1, n, p))

এটি নিম্নলিখিত আউটপুট দেয়।

> coverage.pr
[1] 0.9508569

> coverage.cp
[1] 0.9546087

1
" দ্বি-দ্বি অনুপাতের জন্য আস্থার ব্যবধান তৈরি করা সম্ভব নয় যা ফলাফলের স্বতন্ত্র প্রকৃতির কারণে সর্বদা যথাযথভাবে 95% এর আওতাভুক্ত থাকে " --- একদিকে, সম্ভবত এলোমেলো ব্যবধানের (কিছুটা বিজোড়) সম্ভাবনার জন্য । (যে ভাবে অন্তত, এটা করতে কাজ করতে হবে, এটা ভাল হতে পারে যদিও এটি সাধারণত উচিত না ।)
Glen_b -Reinstate মনিকা

2
@ Glen_b এলোমেলো সিদ্ধান্তের বিষয়ে আমার আপত্তি সম্পর্কে আমি দীর্ঘকাল আগ্রহী ছিলাম। আমি বিশ্বাস করি জ্যাক কেফার মন্তব্য করেছিলেন যে আপনি যদি নমুনা সংগ্রহ করতে র্যান্ডমাইজেশন ব্যবহার করে ঠিক থাকেন তবে সিদ্ধান্ত প্রক্রিয়াতে এটি ব্যবহার করতে আপনার কোনও সমস্যা হবে না। আপনার যদি এমন সিদ্ধান্ত প্রক্রিয়া দরকার যা পুনরুত্পাদনযোগ্য, ডকুমেন্টেড এবং সাথে প্রতারণা করা কঠিন, কেবল তথ্য সংগ্রহের আগে এলোমেলো ব্যবধানের জন্য প্রয়োজনীয় কোনও এলোমেলো মান উত্পন্ন করুন - এটি নকশার অংশ করুন।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.