সাধারণ-স্বাভাবিক বিতরণের জন্য আমি কীভাবে আত্মবিশ্বাসের ব্যবধানগুলি গণনা করব?


21

আমার কাছে 383 টি নমুনা রয়েছে যা কিছু সাধারণ মানের জন্য ভারী পক্ষপাত, আমি কীভাবে 95% সিআই গণনা করব? আমি যে সিআই গণনা করেছি সেগুলি মনে হয়, যা আমি ধরে নিয়েছি কারণ আমি কোনও হিস্টোগ্রাম তৈরি করার সময় আমার ডেটা বক্রের মতো দেখায় না। সুতরাং আমি মনে করি আমাকে বুটস্ট্র্যাপিংয়ের মতো কিছু ব্যবহার করতে হবে যা আমি খুব ভাল বুঝতে পারি না।


2
একটি সমাধান হ'ল অ্যাসিপটোটিক সিআই ব্যবহার করা যা আরভি এর সীমিত মান বন্টন রয়েছে fact আপনার নমুনাটি যুক্তিসঙ্গতভাবে বড় তাই এটি একটি ভাল অনুমানের জন্য তৈরি করতে পারে। এক্স¯-μএস/এন
JohnK

1
না, আপনি এই পদ্ধতির ব্যবহার করে আত্মবিশ্বাসের ব্যবধানের উভয় লেজের মধ্যে খুব খারাপ লেজ কভারেজ পাবেন। ভাগ্যক্রমে গড় কভারেজটি ঠিক আছে তবে উভয় লেজের ত্রুটির হারই ভুল হবে।
ফ্র্যাঙ্ক হ্যারেল

2
"কিছু সাধারণ মানের জন্য ভারী পক্ষপাত" এর অর্থ কী? লক্ষ করুন যে পক্ষপাতের পরিসংখ্যানগুলির একটি বিশেষ অর্থ রয়েছে; আপনার যদি এর অর্থ না হয় তবে আপনার এড়াতে চেষ্টা করা উচিত। আপনার কি কেবল "কিছু নির্দিষ্ট মান খুব ঘন ঘন ঘটে" বোঝায়? আপনি কি আপনার গণনা এবং কিছু প্রদর্শন বা আপনার ডেটা প্রদর্শন করতে পারেন?
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


21

হ্যাঁ, বুটস্ট্র্যাপ মাঝপথে আত্মবিশ্বাসের ব্যবধানগুলি পাওয়ার জন্য একটি বিকল্প (এবং আপনি যদি পদ্ধতিটি বুঝতে চান তবে আপনাকে কিছুটা চেষ্টা করতে হবে)।

নিম্নরূপ ধারণা:

  1. প্রতিস্থাপন বি বারের সাথে পুনরায় নমুনা।
  2. এই প্রতিটি নমুনার জন্য নমুনা গড় গণনা।
  3. উপযুক্ত বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধান গণনা করুন ।

শেষ পদক্ষেপের বিষয়ে, বেশ কয়েকটি ধরণের বুটস্ট্র্যাপ আত্মবিশ্বাস ইন্টারভাল (বিসিআই) রয়েছে। নিম্নলিখিত রেফারেন্সগুলি বিভিন্ন ধরণের বিসিআইয়ের বৈশিষ্ট্যগুলি নিয়ে আলোচনা উপস্থাপন করে:

http://staff.ustc.edu.cn/~zwp/teach/Stat-Comp/Efron_Bootstrap_CIs.pdf

http://www.tau.ac.il/~saharon/Boot/10.1.1.133.8405.pdf

বেশ কয়েকটি বিসিআই গণনা করা এবং তাদের মধ্যে সম্ভাব্য তাত্পর্যগুলি বোঝার চেষ্টা করা ভাল অভ্যাস।

আর এ, আপনি সহজেই আর প্যাকেজ 'বুট' ব্যবহার করে এই ধারণাটি সহজেই প্রয়োগ করতে পারেন:

rm(list=ls())
# Simulated data
set.seed(123)
data0 = rgamma(383,5,3)
mean(data0) # Sample mean

hist(data0) # Histogram of the data

library(boot) 

# function to obtain the mean
Bmean <- function(data, indices) {
  d <- data[indices] # allows boot to select sample 
    return(mean(d))
} 

# bootstrapping with 1000 replications 
results <- boot(data=data0, statistic=Bmean, R=1000)

# view results
results 
plot(results)

# get 95% confidence interval 
boot.ci(results, type=c("norm", "basic", "perc", "bca"))

3
শেষ ধাপ, কয়েকটি গণনা করুন, ফলাফল থেকে আপনার পছন্দসই সিআইয়ের জন্য মাছ ধরা বোঝায়। তারা আগে থেকে কীসের ভিত্তিতে আপনার পছন্দসই সিআইয়ের সিদ্ধান্ত নেওয়া উচিত।
জন

@ জন ডিফারেন্স সিআই এর বিভিন্ন বৈশিষ্ট্য রয়েছে। সম্ভাব্য তাত্পর্যগুলি পরীক্ষা করার জন্য এটি ভাল অনুশীলন (এবং এর উত্সটি অনুসন্ধানের চেষ্টা করুন)। এটি কোনও সুবিধাজনক ফলাফলের জন্য মাছ ধরা সম্পর্কে নয়।
মুনচাউসেন

অবশ্যই, তবে আপনার উত্তরের কারণটির কোনও বিবরণ ছাড়াই এটি মাছ ধরা "বোঝায়"। এবং আপনি এখনও উল্লেখ করছেন না যে আপনি প্রথমে চান সিআই বাছাই করা সত্যই গুরুত্বপূর্ণ। আমি একজন নিষ্পাপ প্রশ্নকর্তার জন্য কিছু সমালোচনামূলক তথ্য সহ উত্তরটির আপডেটের পরামর্শ দিচ্ছি। আপনি সাধারণত কোন সিআইকে পছন্দ করেন এবং কেন, বা কোনটিকে আপনি পছন্দ করেন এবং কেন এই জাতীয় ক্ষেত্রে পছন্দ করেন তা যদি বলা হয় তবে এটি আরও ভাল।
জন

2
@ আইভাক্যান্ডি: না No. এটি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রদর্শন করে, অর্থাত্ কীভাবে গড়ের নমুনা বন্টন স্বাভাবিকের দিকে ঝোঁক, এমনকি খুব "অস্বাভাবিক" বিতরণের পরে মানগুলির জন্যও। এ কারণেই সাধারণ জেড আত্মবিশ্বাসের ব্যবধানটি অন্য কোনও অভিনব সমাধানের সাথে আলাদা হবে না, যেমন বুটস্ট্র্যাপ boot
মাইকেল এম

1
@ আইভাক্যান্ডি দয়া করে উপরে আমার মন্তব্যটি দেখুন, মাইকেল মায়ার একই বক্তব্য দিচ্ছেন।
জনক

8

আর একটি স্ট্যান্ডার্ড বিকল্প উইলকক্সন পরীক্ষা দিয়ে সিআই গণনা করা। আর

wilcox.test(your-data, conf.int = TRUE, conf.level = 0.95)

দুর্ভাগ্যক্রমে, এটি আপনাকে (সিউডো) মধ্যবর্তী চারদিকে সিআই দেয় না, তবে তারপরে যদি ডেটা ভারী স্বাভাবিক হয় তবে মাঝারিটি আরও তথ্যমূলক পরিমাপ।


2

লগ-সাধারণ ডেটার জন্য, ওলসন (2005) একটি 'পরিবর্তিত কক্স পদ্ধতি' প্রস্তাব দেয়

এক্স(এক্স)=θলগ(θ)

ওয়াই¯=এস22±টিএস2এন+ +এস42(এন-1)

ওয়াই=লগ(এক্স)ওয়াইওয়াই¯ওয়াইএস2

একটি আর ফাংশন নীচে রয়েছে:

ModifiedCox <- function(x){
  n <- length(x)
  y <- log(x)
  y.m <- mean(y)
  y.var <- var(y)

  my.t <- qt(0.975, df = n-1)

  my.mean <- mean(x)
  upper <- y.m + y.var/2 + my.t*sqrt(y.var/n + y.var^2/(2*(n - 1)))
  lower <- y.m + y.var/2 - my.t*sqrt(y.var/n + y.var^2/(2*(n - 1)))

 return(list(upper = exp(upper), mean = my.mean, lower = exp(lower)))

}

অলসনের কাগজ থেকে উদাহরণটি পুনরাবৃত্তি করা

CO.level <- c(12.5, 20, 4, 20, 25, 170, 15, 20, 15)

ModifiedCox(CO.level)
$upper
[1] 78.72254

$mean
[1] 33.5

$lower
[1] 12.30929

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.