আত্মবিশ্বাসের ব্যবধান সম্পর্কে বিভ্রান্ত

আত্মবিশ্বাসের ব্যবধানের ধারণা সম্পর্কে আমি বিভ্রান্ত। বিশেষত, ধরে নিন যে গাউসিয়ান ভেরিয়েবল রয়েছে known পরিচিত, এবং আমি আত্মবিশ্বাসের স্তরের সাথে নীচের দিকে আবদ্ধ এর প্রতি আগ্রহী। $X \sim N(\mu, \sigma)$ $\sigma$ $\mu_L$ $95\%$

আমি পরীক্ষা কি করতে হবে সময়, এবং মান্য করা , , , , । $5$ $X_1$ $X_2$ $X_3$ $X_4$ $X_5$

বিকল্প 1: আমি প্রতিটি নমুনা আলাদাভাবে চিকিত্সা, এবং আমি গনা করতে প্রতিটি । এবং তখন আমি অনুমান করি যে এই 5 এর থেকে প্রকৃত নিম্নতর গণনা করার কোনও উপায় আছে (আমি জানি না কীভাবে) । $\mu_L = X_i - \sigma z$ $X_i$ $\mu_L$

বিকল্প 2: অন্যদিকে, আমি যদি নিই তবে আমি গণনা করতে পারি । (ধরে নিলাম স্বাভাবিক, আমরা টি-স্ট্যাট ব্যবহার করতে পারি)) $T = (X_1+X_2+X_3+X_4+X_5)/5$ $\mu_L = T - \sigma/\sqrt{5}z$ $T$

নমুনার উপর ভিত্তি করে নিম্ন-গন্ডীর গণনা করার জন্য বিকল্প 2 ব্যতীত অন্য কোনও পদ্ধতি আছে কি ? এবং বিকল্প 1 এর জন্য, 5 টি নিম্ন-সীমাটি গণনার উপর ভিত্তি করে নিম্ন-সীমাটি গণনা করার কোনও উপায় আছে? $5$

confidence-interval

— calbear
সূত্র

এটি একটি দুর্দান্ত প্রশ্ন কারণ এটি বিকল্প পদ্ধতির সম্ভাবনাটি অন্বেষণ করে এবং কেন এবং কীভাবে একটি পদ্ধতি অন্য পদ্ধতির চেয়ে উচ্চতর হতে পারে তা সম্পর্কে আমাদের জিজ্ঞাসা করতে বলে।

সংক্ষিপ্ত উত্তরটি হ'ল অসীম অনেক উপায় রয়েছে যা আমরা গড়ের জন্য স্বল্প আত্মবিশ্বাসের সীমা অর্জনের জন্য একটি পদ্ধতি তৈরি করতে পারি তবে এর কয়েকটি ভাল এবং কিছুটা খারাপ (এক অর্থে যা অর্থবোধক এবং সংজ্ঞায়িত)। অপশন 2 একটি দুর্দান্ত পদ্ধতি, কারণ তুলনামূলক মানের ফলাফল অর্জনের জন্য এটির ব্যবহারকারী ব্যক্তির বিকল্প 1 ব্যবহার করার চেয়ে অর্ধেকেরও বেশি ডেটা সংগ্রহ করতে হবে। অর্ধেকের বেশি ডেটা বলতে অর্ধেক বাজেট এবং অর্ধবারের অর্থ হয়, তাই আমরা উল্লেখযোগ্য এবং অর্থনৈতিকভাবে গুরুত্বপূর্ণ পার্থক্যের কথা বলছি। এটি পরিসংখ্যানগত তত্ত্বের মানের একটি দৃ demonst় প্রদর্শন সরবরাহ করে।

বরং এখন প্রথমে rehash তত্ত্ব, যার অনেকগুলোই চমৎকার পাঠ্যপুস্তক অ্যাকাউন্ট অস্তিত্ব চেয়ে, এর দ্রুত তিন নিম্ন আস্থা সীমা (LCL) পদ্ধতি অন্বেষণ করা যাক পরিচিত স্ট্যানডার্ড ডেভিয়েশন স্বাধীন স্বাভাবিক variates। আমি প্রশ্নের দ্বারা প্রস্তাবিত তিনটি প্রাকৃতিক এবং প্রতিশ্রুতিবদ্ধকে বেছে নিয়েছি। তাদের প্রত্যেকটি একটি পছন্দসই আত্মবিশ্বাসের স্তর দ্বারা নির্ধারিত হয় : $n$ $1-\alpha$

বিকল্প 1a, "মিনিট" পদ্ধতি । নিম্ন আত্মবিশ্বাসের সীমাটি সমান সেট করা হয়েছে । number সংখ্যার মান নির্ধারণ করা হয়েছে যাতে সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; তা হ'ল, । $t_{\min} = \min(X_1, X_2, \ldots, X_n) - k^{\min}_{\alpha, n, \sigma} \sigma$ $k^{\min}_{\alpha, n, \sigma}$ $t_{\min}$ $\mu$ $\alpha$ $\Pr(t_{\min} \gt \mu) = \alpha$
বিকল্প 1 বি, "সর্বোচ্চ" পদ্ধতি । নিম্ন আত্মবিশ্বাসের সীমাটি সমান সেট করা হয়েছে । number সংখ্যার মান নির্ধারিত হয় যাতে সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; তা হ'ল, । $t_{\max} = \max(X_1, X_2, \ldots, X_n) - k^{\max}_{\alpha, n, \sigma} \sigma$ $k^{\max}_{\alpha, n, \sigma}$ $t_{\max}$ $\mu$ $\alpha$ $\Pr(t_{\max} \gt \mu) = \alpha$
বিকল্প 2, "গড়" পদ্ধতি । নিম্ন আত্মবিশ্বাস সীমা । number number সংখ্যার মান নির্ধারিত হয় যাতে true সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; এটি হ'ল, । $t_\text{mean} = \text{mean}(X_1, X_2, \ldots, X_n) - k^\text{mean}_{\alpha, n, \sigma} \sigma$ $k^\text{mean}_{\alpha, n, \sigma}$ $t_\text{mean}$ $\mu$ $\alpha$ $\Pr(t_\text{mean} \gt \mu) = \alpha$

যেমনটি সুপরিচিত, যেখানে ; হ'ল স্ট্যান্ডার্ড সাধারণ বিতরণের ক্রমবর্ধমান সম্ভাবনা ফাংশন। এই প্রশ্নের সূত্র হল। একটি গাণিতিক শর্টহ্যান্ড হয় $k^\text{mean}_{\alpha, n, \sigma} = z_\alpha/\sqrt{n}$ $\Phi(z_\alpha) = 1-\alpha$ $\Phi$

$k^\text{mean}_{\alpha, n, \sigma} = \Phi^{-1}(1-\alpha)/\sqrt{n}.$

সর্বনিম্ন এবং সর্বোচ্চ পদ্ধতির সূত্রগুলি কম সুপরিচিত তবে নির্ধারণ করা সহজ:

$k^\text{min}_{\alpha,n,\sigma} = \Phi^{-1}(1-\alpha^{1/n})$ ।
$k^\text{max}_{\alpha, n, \sigma} = \Phi^{-1}((1-\alpha)^{1/n})$ ।

একটি সিমুলেশন মাধ্যমে, আমরা দেখতে পাচ্ছি যে তিনটি সূত্র কাজ করে। নিম্নলিখিত Rকোডটি n.trialsপৃথকবার পরীক্ষা চালায় এবং প্রতিটি পরীক্ষার জন্য তিনটি এলসিএল রিপোর্ট করে:

simulate <- function(n.trials=100, alpha=.05, n=5) {
  z.min <- qnorm(1-alpha^(1/n))
  z.mean <- qnorm(1-alpha) / sqrt(n)
  z.max <- qnorm((1-alpha)^(1/n))
  f <- function() {
    x <- rnorm(n); 
    c(max=max(x) - z.max, min=min(x) - z.min, mean=mean(x) - z.mean)
  }    
  replicate(n.trials, f())
}

(কোডটি সাধারণ সাধারণ বিতরণগুলির সাথে কাজ করার জন্য বিরক্ত করে না: কারণ আমরা পরিমাপের একক এবং পরিমাপের স্কেলের শূন্য চয়ন করতে পারছি, তাই , কেস অধ্যয়ন করা যথেষ্ট । তাই সে কারণেই বিভিন্ন এর কোনও সূত্র আসলে উপর নির্ভর করে না ) $\mu=0$ $\sigma=1$ $k^*_{\alpha,n,\sigma}$ $\sigma$

10,000 ট্রায়াল যথেষ্ট যথার্থতা প্রদান করবে। আসুন সিমুলেশনটি চালনা করি এবং ফ্রিকোয়েন্সি গণনা করি যার সাথে প্রতিটি পদ্ধতি সত্যের গড়ের চেয়ে কম আত্মবিশ্বাস সীমা তৈরি করতে ব্যর্থ হয়:

set.seed(17)
sim <- simulate(10000, alpha=.05, n=5)
apply(sim > 0, 1, mean)

আউটপুট হয়

   max    min   mean 
0.0515 0.0527 0.0520

এই ফ্রিকোয়েন্সিগুলি নির্ধারিত মানের সাথে যথেষ্ট পরিমাণে যে আমরা তিনটি পদ্ধতিতে বিজ্ঞাপন হিসাবে কাজ করে সন্তুষ্ট হতে পারি: এগুলির প্রতিটিরই গড়ের জন্য 95% আত্মবিশ্বাসের স্বল্প আস্থা সীমা তৈরি করে। $\alpha=.05$

(যদি আপনি উদ্বিগ্ন থাকেন যে এই ফ্রিকোয়েন্সিগুলি থেকে কিছুটা পৃথক হয় , আপনি আরও ট্রায়াল চালাতে পারেন a মিলিয়ন ট্রায়ালগুলির সাথে তারা আরও কাছাকাছি চলে আসে : ) $.05$ $.05$ $(0.050547, 0.049877, 0.050274)$

যাইহোক, যে কোনও এলসিএল পদ্ধতি সম্পর্কে আমরা একটি জিনিস চাই তা হ'ল এটি কেবল সময়ের অনুপাতে সংশোধন করা উচিত নয়, তবে এটি সংশোধনের কাছাকাছি থাকতে হবে । উদাহরণস্বরূপ, এমন একজন (অনুমানিক) পরিসংখ্যানবিদ কল্পনা করুন যিনি গভীর ধর্মীয় সংবেদনশীলতার কারণে ডেলফিক ওরাকল (অ্যাপোলো এর) সাথে ডেটা সংগ্রহ করার পরিবর্তে এবং এলসিএল গণনা করার পরামর্শ নিতে পারেন। তিনি যখন 95শ্বরকে ৯০% এলসিএল চেয়েছিলেন, তখন godশ্বর তার প্রকৃত অর্থটি divineশ্বরিকভাবে প্রকাশ করবেন এবং তার কাছে এটি বলবেন - সর্বোপরি তিনি নিখুঁত। তবে, কারণ godশ্বর তাঁর ক্ষমতাগুলি মানবজাতির সাথে পুরোপুরি ভাগ করে নিতে চান না (যা অবশ্যই পড়ে থাকতে হবে), তিনি 5% সময় এলসিএল দেবেন যা $X_1, X_2, \ldots, X_n$ $100\sigma$ খুব উচ্চ. এই ডেলফিক পদ্ধতিটিও একটি 95% এলসিএল - তবে বাস্তবে এটি ব্যবহার করা ভয়ঙ্কর হতে পারে কারণ এটি সত্যিকারের ভয়াবহ বাউন্ড তৈরির ঝুঁকির কারণে বাস্তবে ব্যবহার করতে পারে।

আমাদের তিনটি এলসিএল পদ্ধতি কতটা সঠিক হতে থাকে তা আমরা মূল্যায়ন করতে পারি। একটি ভাল উপায় তাদের নমুনা বিতরণগুলি তাকান: সমানভাবে, অনেক সিমুলেটেড মানগুলির হিস্টোগ্রামগুলিও এটি করবে। এখানে তারা. প্রথমে যদিও তাদের উত্পাদন করার কোড:

dx <- -min(sim)/12
breaks <- seq(from=min(sim), to=max(sim)+dx, by=dx)
par(mfcol=c(1,3))
tmp <- sapply(c("min", "max", "mean"), function(s) {
  hist(sim[s,], breaks=breaks, col="#70C0E0", 
       main=paste("Histogram of", s, "procedure"), 
       yaxt="n", ylab="", xlab="LCL");
  hist(sim[s, sim[s,] > 0], breaks=breaks, col="Red", add=TRUE)
})

Histograms

এগুলি অভিন্ন x অক্ষগুলিতে দেখানো হয়েছে (তবে কিছুটা ভিন্ন উল্লম্ব অক্ষ)। আমরা যা আগ্রহী তা হ'ল

এর ডান দিকে লাল অংশগুলি - যে অঞ্চলগুলি ফ্রিকোয়েন্সি উপস্থাপন করে যার সাথে প্রক্রিয়াগুলি গড় অবমূল্যায়ন করতে ব্যর্থ হয় - সবগুলি পছন্দসই পরিমাণের সমান, । (আমরা ইতিমধ্যে এটি সংখ্যাগতভাবে নিশ্চিত করেছিলাম)) $0$ $\alpha=.05$
ছড়িয়ে সিমুলেশন ফলাফল। স্পষ্টতই, ডানদিকের হিস্টোগ্রামটি অন্য দুটি তুলনায় সংক্ষিপ্ত: এটি এমন একটি প্রক্রিয়া বর্ণনা করে যা সত্যিকার অর্থে ( সমান ) পুরোপুরি % সময়কে কম করে দেখায়, এমনকি যখন এটি করে, তখনও এই কম মূল্যায়ন প্রায় সর্বদা মধ্যে থাকে সত্য মানে। অন্য দুটি হিস্টোগ্রামে সত্যিকারের গড়কে আরও কিছুটা অবমূল্যায়ন করার প্রবণতা রয়েছে, প্রায় খুব কম। এছাড়াও, যখন তারা সত্যিকারের গড়কে অতিরিক্ত মূল্যায়ন করে, তখন তারা সঠিক পদ্ধতির চেয়ে বেশি পরিমাণে এটিকে আরও বেশি বিবেচনা করে থাকে। এই গুণাবলী এগুলিকে সঠিকতম হিস্টোগ্রামের চেয়ে নিকৃষ্ট করে তোলে। $0$ $95$ $2 \sigma$ $3\sigma$

ডান দিকের হিস্টোগ্রাম অপশন 2, প্রচলিত এলসিএল পদ্ধতি বর্ণনা করে।

এই স্প্রেডগুলির একটি পরিমাপ হ'ল সিমুলেশন ফলাফলগুলির স্ট্যান্ডার্ড বিচ্যুতি:

> apply(sim, 1, sd)
     max      min     mean 
0.673834 0.677219 0.453829

এই সংখ্যাগুলি আমাদের জানায় যে সর্বাধিক এবং ন্যূনতম প্রক্রিয়াগুলির সমান স্প্রেড (প্রায় ) এবং সাধারণ, গড় , প্রক্রিয়াটির মাত্র দুই-তৃতীয়াংশ তাদের স্প্রেড (প্রায় ) রয়েছে। এটি আমাদের চোখের প্রমাণ নিশ্চিত করে। $0.68$ $0.45$

স্ট্যান্ডার্ড বিচ্যুতির স্কোয়ারগুলি যথাক্রমে , এবং সমান বৈকল্পিকবৈকল্পিকগুলি ডেটার পরিমাণের সাথে সম্পর্কিত হতে পারে : যদি কোনও বিশ্লেষক সর্বাধিক (বা ন্যূনতম ) পদ্ধতির প্রস্তাব রাখেন , তবে সাধারণ পদ্ধতি দ্বারা প্রদর্শিত সংকীর্ণ স্প্রেড অর্জনের জন্য, তাদের ক্লায়েন্টকে গুণ হিসাবে বেশি তথ্য অর্জন করতে হবে - দ্বিগুণ অন্য কথায়, বিকল্প 1 ব্যবহার করে, আপনি বিকল্প 2 ব্যবহার না করে আপনার তথ্যের জন্য দ্বিগুণ বেশি অর্থ প্রদান করবেন। $0.45$ $0.45$ $0.20$ $0.45/0.21$

— whuber
সূত্র

আপনি আমাকে অবাক করতে কখনও ব্যর্থ হন না।

— মোমো

+1 @ শুভ এটি একটি দুর্দান্ত চিত্রণ। বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবস্থাগুলি বর্ণনা করতে গিয়ে ইফ্রন যথার্থতা এবং সঠিকতা সম্পর্কে কথা বলেন। যথার্থতা হ'ল ব্যবধানের আসল আত্মবিশ্বাসের স্তরটি বিজ্ঞাপনিত মানের কাছাকাছি। আপনার 3 টি উদাহরণ সমস্ত সঠিক। সঠিকতা সেরা বোঝায়। দ্বিমুখী আত্মবিশ্বাসের ব্যবধানের জন্য যার অর্থ হ'ল সংক্ষিপ্ত প্রস্থের সাথে একটি সঠিক (আপনার ক্ষেত্রে গড়ের উপর ভিত্তি করে বিরতি বা আবদ্ধ)। আপনার উদাহরণটি আকর্ষণীয় কারণ তিনটি পদ্ধতি অন্তত কিছুটা প্রতিযোগিতামূলক।

— মাইকেল আর চেরনিক

আমার উত্তরটিতে আমি যে কারণগুলি দিয়েছি তার জন্য ওপিএস বিকল্প 1 প্রতিযোগিতামূলক হওয়ার কাছাকাছি নয়।

— মাইকেল আর চেরনিক

@ মিশেল আমি একমত যে আপনার বিকল্প 1 এর ব্যাখ্যাটি প্রতিযোগিতামূলক নয়। আমি যা আকর্ষণীয় পেয়েছি - এবং এখানে অন্বেষণ করেছি - তা হ'ল এখানে আরও পাঁচটি পৃথক পৃথক থেকে কীভাবে "প্রকৃত নীচের গণ্ডার" গণনা করা যেতে পারে তার আরও কিছু কার্যকর ব্যাখ্যা রয়েছে, যার মধ্যে দুটি আমি এখানে পরীক্ষা করেছি। আমার সম্ভবত "মিডিয়ান" বিকল্পটিও খুব ভালভাবে লক্ষ্য করা উচিত: এটি সাধারণ গণনা (প্রায় 40% কম দক্ষ) থেকে ভয়ঙ্করভাবে নিকৃষ্ট হবে না।

— whuber

প্রথম বিকল্পটি আপনি নমুনা থেকে প্রাপ্ত হ্রাস বৈকল্পিকতার বিষয়টি বিবেচনা করে না প্রথম বিকল্পটি আপনাকে প্রতিটি ক্ষেত্রে ১ মাপের নমুনার ভিত্তিতে গড়ের জন্য পাঁচটি কম 95% আত্মবিশ্বাস সীমাবদ্ধ করে। গড় হিসাবে তাদের সংমিশ্রণ একটি সীমা তৈরি করে না যা আপনি নীচের 95% বাউন্ড হিসাবে ব্যাখ্যা করতে পারেন। কেউ তা করবে না। দ্বিতীয় বিকল্পটি হল যা করা হয়। পাঁচটি স্বতন্ত্র পর্যবেক্ষণের গড় একক নমুনার পরিবর্তনের চেয়ে 6 টির গুণক দ্বারা পৃথক পৃথক রয়েছে। অতএব এটি আপনাকে প্রথম উপায়ে গণনা করা পাঁচটির তুলনায় অনেক কম নীচে বাউন্ড দেয়।

এছাড়াও যদি এক্স আইটিকে আইআইডি হিসাবে ধরে নেওয়া যায় তবে টি স্বাভাবিক হবে। $_i$

— মাইকেল আর চেরনিক
সূত্র