আত্মবিশ্বাসের ব্যবধান সম্পর্কে বিভ্রান্ত


10

আত্মবিশ্বাসের ব্যবধানের ধারণা সম্পর্কে আমি বিভ্রান্ত। বিশেষত, ধরে নিন যে গাউসিয়ান ভেরিয়েবল রয়েছে known পরিচিত, এবং আমি আত্মবিশ্বাসের স্তরের সাথে নীচের দিকে আবদ্ধ এর প্রতি আগ্রহী।σ μ এল 95 %XN(μ,σ)σμL95%

আমি পরীক্ষা কি করতে হবে সময়, এবং মান্য করা , , , , ।এক্স 1 এক্স 2 এক্স 3 এক্স 4 এক্স 55X1X2X3X4X5

বিকল্প 1: আমি প্রতিটি নমুনা আলাদাভাবে চিকিত্সা, এবং আমি গনা করতে প্রতিটি । এবং তখন আমি অনুমান করি যে এই 5 এর থেকে প্রকৃত নিম্নতর গণনা করার কোনও উপায় আছে (আমি জানি না কীভাবে) ।এক্স আই μ এলμL=XiσzXiμL

বিকল্প 2: অন্যদিকে, আমি যদি নিই তবে আমি গণনা করতে পারি । (ধরে নিলাম স্বাভাবিক, আমরা টি-স্ট্যাট ব্যবহার করতে পারি))μ এল = টি - σ / T=(X1+X2+X3+X4+X5)/5টিμL=Tσ/5zT

নমুনার উপর ভিত্তি করে নিম্ন-গন্ডীর গণনা করার জন্য বিকল্প 2 ব্যতীত অন্য কোনও পদ্ধতি আছে কি ? এবং বিকল্প 1 এর জন্য, 5 টি নিম্ন-সীমাটি গণনার উপর ভিত্তি করে নিম্ন-সীমাটি গণনা করার কোনও উপায় আছে?5

উত্তর:


12

এটি একটি দুর্দান্ত প্রশ্ন কারণ এটি বিকল্প পদ্ধতির সম্ভাবনাটি অন্বেষণ করে এবং কেন এবং কীভাবে একটি পদ্ধতি অন্য পদ্ধতির চেয়ে উচ্চতর হতে পারে তা সম্পর্কে আমাদের জিজ্ঞাসা করতে বলে।

সংক্ষিপ্ত উত্তরটি হ'ল অসীম অনেক উপায় রয়েছে যা আমরা গড়ের জন্য স্বল্প আত্মবিশ্বাসের সীমা অর্জনের জন্য একটি পদ্ধতি তৈরি করতে পারি তবে এর কয়েকটি ভাল এবং কিছুটা খারাপ (এক অর্থে যা অর্থবোধক এবং সংজ্ঞায়িত)। অপশন 2 একটি দুর্দান্ত পদ্ধতি, কারণ তুলনামূলক মানের ফলাফল অর্জনের জন্য এটির ব্যবহারকারী ব্যক্তির বিকল্প 1 ব্যবহার করার চেয়ে অর্ধেকেরও বেশি ডেটা সংগ্রহ করতে হবে। অর্ধেকের বেশি ডেটা বলতে অর্ধেক বাজেট এবং অর্ধবারের অর্থ হয়, তাই আমরা উল্লেখযোগ্য এবং অর্থনৈতিকভাবে গুরুত্বপূর্ণ পার্থক্যের কথা বলছি। এটি পরিসংখ্যানগত তত্ত্বের মানের একটি দৃ demonst় প্রদর্শন সরবরাহ করে।


বরং এখন প্রথমে rehash তত্ত্ব, যার অনেকগুলোই চমৎকার পাঠ্যপুস্তক অ্যাকাউন্ট অস্তিত্ব চেয়ে, এর দ্রুত তিন নিম্ন আস্থা সীমা (LCL) পদ্ধতি অন্বেষণ করা যাক পরিচিত স্ট্যানডার্ড ডেভিয়েশন স্বাধীন স্বাভাবিক variates। আমি প্রশ্নের দ্বারা প্রস্তাবিত তিনটি প্রাকৃতিক এবং প্রতিশ্রুতিবদ্ধকে বেছে নিয়েছি। তাদের প্রত্যেকটি একটি পছন্দসই আত্মবিশ্বাসের স্তর দ্বারা নির্ধারিত হয় :1 - αn1α

  • বিকল্প 1a, "মিনিট" পদ্ধতি । নিম্ন আত্মবিশ্বাসের সীমাটি সমান সেট করা হয়েছে । number সংখ্যার মান নির্ধারণ করা হয়েছে যাতে সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; তা হ'ল, ।tmin=min(X1,X2,,Xn)kα,n,σminσkα,n,σmintminμαPr(tmin>μ)=α

  • বিকল্প 1 বি, "সর্বোচ্চ" পদ্ধতি । নিম্ন আত্মবিশ্বাসের সীমাটি সমান সেট করা হয়েছে । number সংখ্যার মান নির্ধারিত হয় যাতে সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; তা হ'ল, ।tmax=max(X1,X2,,Xn)kα,n,σmaxσkα,n,σmaxtmaxμαPr(tmax>μ)=α

  • বিকল্প 2, "গড়" পদ্ধতি । নিম্ন আত্মবিশ্বাস সীমা । number number সংখ্যার মান নির্ধারিত হয় যাতে true সত্যিকারের অর্থের চেয়ে বেশি হবে কেবল ; এটি হ'ল, ।tmean=mean(X1,X2,,Xn)kα,n,σmeanσkα,n,σmeantmeanμαPr(tmean>μ)=α

যেমনটি সুপরিচিত, যেখানে ; হ'ল স্ট্যান্ডার্ড সাধারণ বিতরণের ক্রমবর্ধমান সম্ভাবনা ফাংশন। এই প্রশ্নের সূত্র হল। একটি গাণিতিক শর্টহ্যান্ড হয়kα,n,σmean=zα/nΦ(zα)=1αΦ

  • kα,n,σmean=Φ1(1α)/n.

সর্বনিম্ন এবং সর্বোচ্চ পদ্ধতির সূত্রগুলি কম সুপরিচিত তবে নির্ধারণ করা সহজ:

  • kα,n,σmin=Φ1(1α1/n)

  • kα,n,σmax=Φ1((1α)1/n)

একটি সিমুলেশন মাধ্যমে, আমরা দেখতে পাচ্ছি যে তিনটি সূত্র কাজ করে। নিম্নলিখিত Rকোডটি n.trialsপৃথকবার পরীক্ষা চালায় এবং প্রতিটি পরীক্ষার জন্য তিনটি এলসিএল রিপোর্ট করে:

simulate <- function(n.trials=100, alpha=.05, n=5) {
  z.min <- qnorm(1-alpha^(1/n))
  z.mean <- qnorm(1-alpha) / sqrt(n)
  z.max <- qnorm((1-alpha)^(1/n))
  f <- function() {
    x <- rnorm(n); 
    c(max=max(x) - z.max, min=min(x) - z.min, mean=mean(x) - z.mean)
  }    
  replicate(n.trials, f())
}

(কোডটি সাধারণ সাধারণ বিতরণগুলির সাথে কাজ করার জন্য বিরক্ত করে না: কারণ আমরা পরিমাপের একক এবং পরিমাপের স্কেলের শূন্য চয়ন করতে পারছি, তাই , কেস অধ্যয়ন করা যথেষ্ট । তাই সে কারণেই বিভিন্ন এর কোনও সূত্র আসলে উপর নির্ভর করে না )μ=0σ=1kα,n,σσ

10,000 ট্রায়াল যথেষ্ট যথার্থতা প্রদান করবে। আসুন সিমুলেশনটি চালনা করি এবং ফ্রিকোয়েন্সি গণনা করি যার সাথে প্রতিটি পদ্ধতি সত্যের গড়ের চেয়ে কম আত্মবিশ্বাস সীমা তৈরি করতে ব্যর্থ হয়:

set.seed(17)
sim <- simulate(10000, alpha=.05, n=5)
apply(sim > 0, 1, mean)

আউটপুট হয়

   max    min   mean 
0.0515 0.0527 0.0520

এই ফ্রিকোয়েন্সিগুলি নির্ধারিত মানের সাথে যথেষ্ট পরিমাণে যে আমরা তিনটি পদ্ধতিতে বিজ্ঞাপন হিসাবে কাজ করে সন্তুষ্ট হতে পারি: এগুলির প্রতিটিরই গড়ের জন্য 95% আত্মবিশ্বাসের স্বল্প আস্থা সীমা তৈরি করে।α=.05

(যদি আপনি উদ্বিগ্ন থাকেন যে এই ফ্রিকোয়েন্সিগুলি থেকে কিছুটা পৃথক হয় , আপনি আরও ট্রায়াল চালাতে পারেন a মিলিয়ন ট্রায়ালগুলির সাথে তারা আরও কাছাকাছি চলে আসে : ).05.05(0.050547,0.049877,0.050274)

যাইহোক, যে কোনও এলসিএল পদ্ধতি সম্পর্কে আমরা একটি জিনিস চাই তা হ'ল এটি কেবল সময়ের অনুপাতে সংশোধন করা উচিত নয়, তবে এটি সংশোধনের কাছাকাছি থাকতে হবে । উদাহরণস্বরূপ, এমন একজন (অনুমানিক) পরিসংখ্যানবিদ কল্পনা করুন যিনি গভীর ধর্মীয় সংবেদনশীলতার কারণে ডেলফিক ওরাকল (অ্যাপোলো এর) সাথে ডেটা সংগ্রহ করার পরিবর্তে এবং এলসিএল গণনা করার পরামর্শ নিতে পারেন। তিনি যখন 95শ্বরকে ৯০% এলসিএল চেয়েছিলেন, তখন godশ্বর তার প্রকৃত অর্থটি divineশ্বরিকভাবে প্রকাশ করবেন এবং তার কাছে এটি বলবেন - সর্বোপরি তিনি নিখুঁত। তবে, কারণ godশ্বর তাঁর ক্ষমতাগুলি মানবজাতির সাথে পুরোপুরি ভাগ করে নিতে চান না (যা অবশ্যই পড়ে থাকতে হবে), তিনি 5% সময় এলসিএল দেবেন যাX1,X2,,Xn100σখুব উচ্চ. এই ডেলফিক পদ্ধতিটিও একটি 95% এলসিএল - তবে বাস্তবে এটি ব্যবহার করা ভয়ঙ্কর হতে পারে কারণ এটি সত্যিকারের ভয়াবহ বাউন্ড তৈরির ঝুঁকির কারণে বাস্তবে ব্যবহার করতে পারে।

আমাদের তিনটি এলসিএল পদ্ধতি কতটা সঠিক হতে থাকে তা আমরা মূল্যায়ন করতে পারি। একটি ভাল উপায় তাদের নমুনা বিতরণগুলি তাকান: সমানভাবে, অনেক সিমুলেটেড মানগুলির হিস্টোগ্রামগুলিও এটি করবে। এখানে তারা. প্রথমে যদিও তাদের উত্পাদন করার কোড:

dx <- -min(sim)/12
breaks <- seq(from=min(sim), to=max(sim)+dx, by=dx)
par(mfcol=c(1,3))
tmp <- sapply(c("min", "max", "mean"), function(s) {
  hist(sim[s,], breaks=breaks, col="#70C0E0", 
       main=paste("Histogram of", s, "procedure"), 
       yaxt="n", ylab="", xlab="LCL");
  hist(sim[s, sim[s,] > 0], breaks=breaks, col="Red", add=TRUE)
})

Histograms

এগুলি অভিন্ন x অক্ষগুলিতে দেখানো হয়েছে (তবে কিছুটা ভিন্ন উল্লম্ব অক্ষ)। আমরা যা আগ্রহী তা হ'ল

  1. এর ডান দিকে লাল অংশগুলি - যে অঞ্চলগুলি ফ্রিকোয়েন্সি উপস্থাপন করে যার সাথে প্রক্রিয়াগুলি গড় অবমূল্যায়ন করতে ব্যর্থ হয় - সবগুলি পছন্দসই পরিমাণের সমান, । (আমরা ইতিমধ্যে এটি সংখ্যাগতভাবে নিশ্চিত করেছিলাম))0α=.05

  2. ছড়িয়ে সিমুলেশন ফলাফল। স্পষ্টতই, ডানদিকের হিস্টোগ্রামটি অন্য দুটি তুলনায় সংক্ষিপ্ত: এটি এমন একটি প্রক্রিয়া বর্ণনা করে যা সত্যিকার অর্থে ( সমান ) পুরোপুরি % সময়কে কম করে দেখায়, এমনকি যখন এটি করে, তখনও এই কম মূল্যায়ন প্রায় সর্বদা মধ্যে থাকে সত্য মানে। অন্য দুটি হিস্টোগ্রামে সত্যিকারের গড়কে আরও কিছুটা অবমূল্যায়ন করার প্রবণতা রয়েছে, প্রায় খুব কম। এছাড়াও, যখন তারা সত্যিকারের গড়কে অতিরিক্ত মূল্যায়ন করে, তখন তারা সঠিক পদ্ধতির চেয়ে বেশি পরিমাণে এটিকে আরও বেশি বিবেচনা করে থাকে। এই গুণাবলী এগুলিকে সঠিকতম হিস্টোগ্রামের চেয়ে নিকৃষ্ট করে তোলে।0952σ3σ

ডান দিকের হিস্টোগ্রাম অপশন 2, প্রচলিত এলসিএল পদ্ধতি বর্ণনা করে।

এই স্প্রেডগুলির একটি পরিমাপ হ'ল সিমুলেশন ফলাফলগুলির স্ট্যান্ডার্ড বিচ্যুতি:

> apply(sim, 1, sd)
     max      min     mean 
0.673834 0.677219 0.453829

এই সংখ্যাগুলি আমাদের জানায় যে সর্বাধিক এবং ন্যূনতম প্রক্রিয়াগুলির সমান স্প্রেড (প্রায় ) এবং সাধারণ, গড় , প্রক্রিয়াটির মাত্র দুই-তৃতীয়াংশ তাদের স্প্রেড (প্রায় ) রয়েছে। এটি আমাদের চোখের প্রমাণ নিশ্চিত করে।0.450.680.45

স্ট্যান্ডার্ড বিচ্যুতির স্কোয়ারগুলি যথাক্রমে , এবং সমান বৈকল্পিকবৈকল্পিকগুলি ডেটার পরিমাণের সাথে সম্পর্কিত হতে পারে : যদি কোনও বিশ্লেষক সর্বাধিক (বা ন্যূনতম ) পদ্ধতির প্রস্তাব রাখেন , তবে সাধারণ পদ্ধতি দ্বারা প্রদর্শিত সংকীর্ণ স্প্রেড অর্জনের জন্য, তাদের ক্লায়েন্টকে গুণ হিসাবে বেশি তথ্য অর্জন করতে হবে - দ্বিগুণ অন্য কথায়, বিকল্প 1 ব্যবহার করে, আপনি বিকল্প 2 ব্যবহার না করে আপনার তথ্যের জন্য দ্বিগুণ বেশি অর্থ প্রদান করবেন।0.45 0.20 0.45 / 0.210.450.450.200.45/0.21


2
আপনি আমাকে অবাক করতে কখনও ব্যর্থ হন না।
মোমো

+1 @ শুভ এটি একটি দুর্দান্ত চিত্রণ। বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবস্থাগুলি বর্ণনা করতে গিয়ে ইফ্রন যথার্থতা এবং সঠিকতা সম্পর্কে কথা বলেন। যথার্থতা হ'ল ব্যবধানের আসল আত্মবিশ্বাসের স্তরটি বিজ্ঞাপনিত মানের কাছাকাছি। আপনার 3 টি উদাহরণ সমস্ত সঠিক। সঠিকতা সেরা বোঝায়। দ্বিমুখী আত্মবিশ্বাসের ব্যবধানের জন্য যার অর্থ হ'ল সংক্ষিপ্ত প্রস্থের সাথে একটি সঠিক (আপনার ক্ষেত্রে গড়ের উপর ভিত্তি করে বিরতি বা আবদ্ধ)। আপনার উদাহরণটি আকর্ষণীয় কারণ তিনটি পদ্ধতি অন্তত কিছুটা প্রতিযোগিতামূলক।
মাইকেল আর চেরনিক

আমার উত্তরটিতে আমি যে কারণগুলি দিয়েছি তার জন্য ওপিএস বিকল্প 1 প্রতিযোগিতামূলক হওয়ার কাছাকাছি নয়।
মাইকেল আর চেরনিক

@ মিশেল আমি একমত যে আপনার বিকল্প 1 এর ব্যাখ্যাটি প্রতিযোগিতামূলক নয়। আমি যা আকর্ষণীয় পেয়েছি - এবং এখানে অন্বেষণ করেছি - তা হ'ল এখানে আরও পাঁচটি পৃথক পৃথক থেকে কীভাবে "প্রকৃত নীচের গণ্ডার" গণনা করা যেতে পারে তার আরও কিছু কার্যকর ব্যাখ্যা রয়েছে, যার মধ্যে দুটি আমি এখানে পরীক্ষা করেছি। আমার সম্ভবত "মিডিয়ান" বিকল্পটিও খুব ভালভাবে লক্ষ্য করা উচিত: এটি সাধারণ গণনা (প্রায় 40% কম দক্ষ) থেকে ভয়ঙ্করভাবে নিকৃষ্ট হবে না।
whuber

1

প্রথম বিকল্পটি আপনি নমুনা থেকে প্রাপ্ত হ্রাস বৈকল্পিকতার বিষয়টি বিবেচনা করে না প্রথম বিকল্পটি আপনাকে প্রতিটি ক্ষেত্রে ১ মাপের নমুনার ভিত্তিতে গড়ের জন্য পাঁচটি কম 95% আত্মবিশ্বাস সীমাবদ্ধ করে। গড় হিসাবে তাদের সংমিশ্রণ একটি সীমা তৈরি করে না যা আপনি নীচের 95% বাউন্ড হিসাবে ব্যাখ্যা করতে পারেন। কেউ তা করবে না। দ্বিতীয় বিকল্পটি হল যা করা হয়। পাঁচটি স্বতন্ত্র পর্যবেক্ষণের গড় একক নমুনার পরিবর্তনের চেয়ে 6 টির গুণক দ্বারা পৃথক পৃথক রয়েছে। অতএব এটি আপনাকে প্রথম উপায়ে গণনা করা পাঁচটির তুলনায় অনেক কম নীচে বাউন্ড দেয়।

এছাড়াও যদি এক্স আইটিকে আইআইডি হিসাবে ধরে নেওয়া যায় তবে টি স্বাভাবিক হবে।i

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.