প্রথম পরীক্ষার 95% আত্মবিশ্বাসের ব্যবধানের মধ্যে পুনরাবৃত্ত পরীক্ষার কোন ভগ্নাংশের প্রভাবের আকার থাকবে?


12

আসুন এলোমেলো নমুনা, গাউসিয়ান জনসংখ্যা, সমান বৈকল্পিক, কোনও পি-হ্যাকিং ইত্যাদির সাথে একটি আদর্শ পরিস্থিতির সাথে লেগে থাকি

পদক্ষেপ 1. আপনি দুটি নমুনা মানে তুলনা করে একটি পরীক্ষা চালান, এবং দুটি জনসংখ্যার মধ্যে পার্থক্যের জন্য একটি 95% আত্মবিশ্বাসের ব্যবধান গণনা করুন।

পদক্ষেপ ২. আপনি আরও অনেক পরীক্ষা-নিরীক্ষা করেন (হাজার হাজার)। মাধ্যমের মধ্যে পার্থক্যটি এলোমেলো স্যাম্পলিংয়ের কারণে পরীক্ষা-নিরীক্ষার থেকে পৃথক হতে পারে।

প্রশ্ন: দ্বিতীয় ধাপে পরীক্ষা-নিরীক্ষা সংগ্রহের মধ্য দিয়ে পার্থক্যের কোন ভগ্নাংশটি পদক্ষেপ 1-এর আস্থা অন্তরের মধ্যে থাকবে?

এর উত্তর দেওয়া যায় না। এটি সমস্ত কি 1 পদক্ষেপে ঘটেছিল তার উপর নির্ভর করে যদি সেই পদক্ষেপ 1 পরীক্ষাটি খুব সাধারণ ছিল, তবে প্রশ্নের উত্তর খুব কম হতে পারে।

সুতরাং কল্পনা করুন যে উভয় পদক্ষেপটি বহুবার পুনরাবৃত্তি হয় (দ্বিতীয় ধাপে আরও অনেকবার পুনরাবৃত্তি হয়)। এখন এটি সম্ভব হওয়া উচিত, আমি মনে করি, প্রথম পরীক্ষার 95% আত্মবিশ্বাসের ব্যবধানের মধ্যে গড়পড়তা পুনরাবৃত্তি পরীক্ষাগুলির কী পরিমাণের একটি প্রভাব আকার রয়েছে তার প্রত্যাশা নিয়ে আসা উচিত।

দেখে মনে হচ্ছে যে এই প্রশ্নের উত্তরটি পড়াশোনার প্রজননযোগ্যতার মূল্যায়ন করার জন্য বোঝা দরকার, এটি এখন খুব উত্তপ্ত একটি অঞ্চল।


প্রতিটি মূল (ধাপ 1) পরীক্ষা জন্য , নির্ধারণ পরবর্তী (ধাপ 2) ভগ্নাংশ হিসাবে মূল ফলাফলের আস্থা ব্যবধান মধ্যে ফলাফল যে উত্পাদন তথ্যও। আপনি অভিজ্ঞতা অভিজ্ঞতা বিতরণ করতে চান ? x i xixix
ম্যাথু গুন

হ্যাঁ, আপনি কী বুঝতে চাইছেন তা বুঝতে পেরেছেন
হার্ভি মোটুলস্কি

@ ম্যাথেজগান জিজ্ঞাসা করেছেন যে আপনি যদি ভবিষ্যতের পর্যবেক্ষণের জন্য "ক্যাপচার ভগ্নাংশ" এর অভিজ্ঞতাগত বিতরণ চান। আপনার পোস্টটি জিজ্ঞাসা করেছিল "... এটি সম্ভব হওয়া উচিত, আমি মনে করি, প্রথম পরীক্ষার 95% আত্মবিশ্বাসের ব্যবধানের মধ্যে গড়পড়তা পুনরাবৃত্তি পরীক্ষাগুলির কী পরিমাণের একটি প্রভাব আকার হবে" তার প্রত্যাশা নিয়ে এসেছি । এটি কোনও বিতরণ নয় তবে একটি প্রত্যাশিত মান (গড়)।

হুইবারের বিশ্লেষণ দুর্দান্ত, তবে যদি আপনার উদ্ধৃতি প্রয়োজন হয় তবে এখানে একটি নিবন্ধ রয়েছে যা এই প্রশ্নটি সম্পর্কে দুর্দান্তভাবে বিশদ আলোচনা করে: কামিং অ্যান্ড মাইলার্ডেট, 2006, আত্মবিশ্বাসের বিরতি এবং প্রতিলিপি: নেক্সট মানে কোথায় পড়বে? । তারা এটিকে আত্মবিশ্বাসের ব্যবধানের শতাংশের ক্যাপচার বলে ।
অ্যামিবা বলছেন মনিকাকে

উত্তর:


12

বিশ্লেষণ

কারণ এটি একটি ধারণাগত প্রশ্ন, সরলতার জন্য আসুন আত্মবিশ্বাসের বিরতি যে পরিস্থিতিটি একটি ব্যবহার করে গড় ব্যবহার করা হয়েছে জন্য আকারের এলোমেলো নমুনা এবং একটি দ্বিতীয় এলোমেলোভাবে নমুনা size আকার থেকে নেওয়া হয় , সমস্ত একই সাধারণ বিতরণ থেকে। (আপনি আপনার মত প্রতিস্থাপন করতে পারি তাহলে শিক্ষার্থীর থেকে মানগুলি দ্বারা গুলি বিতরণের স্বাধীন ডিগ্রীগুলির নিম্নোক্ত বিশ্লেষণ পরিবর্তন করব না।)[ ˉ x ( 1 ) + জেড α / 2 এস ( 1 ) / 1αμx(1)nx(2)মি(μ,σ2)জেডটিএন-1

[x¯(1)+Zα/2s(1)/n,x¯(1)+Z1α/2s(1)/n]
μx(1)nএক্স(2)মি(μ,σ2)জেডটিএন-1

দ্বিতীয় নমুনাটির গড়টি প্রথম দ্বারা নির্ধারিত সিআই-র মধ্যে রয়েছে

pr(এক্স¯(1)+ +জেডα/2এনগুলি(1)এক্স¯(2)এক্স¯(1)+ +জেড1-α/2এনগুলি(1))=pr(জেডα/2এনগুলি(1)এক্স¯(2)-এক্স¯(1)জেড1-α/2এনগুলি(1))

কারণ প্রথম নমুনাটির অর্থ প্রথম নমুনার স্ট্যান্ডার্ড বিচ্যুতি of (এটির স্বাভাবিকতা প্রয়োজন) এর চেয়ে পৃথক এবং দ্বিতীয় নমুনা প্রথমটির চেয়ে পৃথক, নমুনার পার্থক্যের অর্থ স্বাধীন । তাছাড়া, এই প্রতিসম ব্যবধান জন্য । অতএব, এলোমেলো পরিবর্তনশীল for এর জন্য লিখতে এবং উভয় অসমতার স্কোয়ারিং, প্রশ্নের সম্ভাব্যতা একই হিসাবেs(1)ইউ= ˉ x (2)- ˉ x (1)এস(1)জেডα/2=-জেড1-α/2এসএস(1)এক্স¯(1)গুলি(1)ইউ=এক্স¯(2)-এক্স¯(1)গুলি(1)জেডα/2=-জেড1-α/2এসগুলি(1)

pr(ইউ2(জেড1-α/2এন)2এস2)=pr(ইউ2এস2(জেড1-α/2এন)2)

প্রত্যাশার আইনগুলি বোঝায় যে এর গড় এবং এর ভিন্নতা0ইউ0

var(ইউ)=var(এক্স¯(2)-এক্স¯(1))=σ2(1মি+ +1এন)

যেহেতু সাধারণ ভেরিয়েবলগুলির রৈখিক সংমিশ্রণ, তাই এটিরও সাধারণ বিতরণ রয়েছে। সুতরাং হল বার একটি পরিবর্তনশীলআমরা ইতিমধ্যে জানতে পেরেছিলাম যে হ'ল বার একটি পরিবর্তনশীল। ফলে, হয় বার একটি সঙ্গে একটি পরিবর্তনশীল বন্টন। প্রয়োজনীয় সম্ভাবনা হিসাবে এফ বিতরণ হিসাবে দেওয়া হয়ইউ 2 σ 2 ( 1ইউইউ2χ2(1)এস2σ2/এনχ2(এন-1)ইউ2/এস21/এন+1/এমএফ(1,এন-1)σ2(1এন+ +1মি)χ2(1)এস2σ2/এনχ2(এন-1)ইউ2/এস21/এন+ +1/মিএফ(1,এন-1)

(1)এফ1,এন-1(জেড1-α/221+ +এন/মি)

আলোচনা

একটি আকর্ষণীয় কেসটি যখন দ্বিতীয় নমুনা প্রথমটির মতো একই আকারের হয়, যাতে এবং কেবলমাত্র এবং সম্ভাবনা নির্ধারণ করে। জন্য বিরুদ্ধে চক্রান্ত করা এর মানগুলি এখানে ।এন α ( 1 ) α n = 2 , 5 , 20 , 50এন/মি=1এনα(1)αএন=2,5,20,50

ব্যক্তিত্ব

গ্রাফ প্রতিটি একটি সীমিত মান ওঠা যেমন বাড়ে। পরীক্ষার আকার একটি উল্লম্ব ধূসর লাইন দ্বারা চিহ্নিত করা হয়। এর largish মানের জন্য , জন্য সীমিত সুযোগ প্রায়।n α = 0.05 এন = মি α = 0.05 85 %αএনα=0.05এন=মিα=0.0585%

এই সীমাটি বোঝার মাধ্যমে আমরা ছোট নমুনা মাপের বিশদটি পর্যবেক্ষণ করব এবং বিষয়টির ক্রুসটি আরও ভালভাবে বুঝতে পারি। যেহেতু বড় হয়, ডিস্ট্রিবিউশন একটি বিতরণে পৌঁছে যায় । স্ট্যান্ডার্ড সাধারণ বিতরণ- , সম্ভাবনা তারপরে প্রায়F χ 2 ( 1 ) Φ ( 1 )এন=মিএফχ2(1)Φ(1)

Φ(Z1α/22)Φ(Zα/22)=12Φ(Zα/22).

উদাহরণস্বরূপ, , এবং । এর ফলে এ রেখাচিত্র দ্বারা সাধিত সীমিত মান যেমন বৃদ্ধি হবে । আপনি দেখতে পাচ্ছেন এটি প্রায় পৌঁছেছে (যেখানে সুযোগটি )জেড α / 2 / √ √α=0.05Φ(-1.386)0.083α=0.05এন1-2(0.083)=1-0.166=0.834এন=500.8383Zα/2/21.96/1.411.386Φ(1.386)0.083α=0.05n12(0.083)=10.166=0.834এন=500,8383...

ছোট , এবং পরিপূরক সম্ভাবনার মধ্যে সম্পর্ক - সিআই দ্বিতীয় অর্থটি কভার করে না এমন ঝুঁকি - প্রায় পুরোপুরি একটি পাওয়ার আইন। ααα লগ α এটি প্রকাশ করার আর একটি উপায় হ'ল লগের পরিপূরক সম্ভাবনা হ'ল প্রায় লিনিয়ার ফাংশন । সীমাবদ্ধ সম্পর্ক প্রায়লগα

লগ(2Φ(জেডα/22))-1,79712+ +0.557203লগ(20α)+ +0.00657704(লগ(20α))2+ +

অন্য কথায়, বড় এবং যে কোনও জায়গায় , এর traditional মানটির কাছাকাছি হবেα 0.05 ( 1 )এন=মিα0.05(1)

1-0,166(20α)0,557

(এটি /stats//a/18259/919 এ পোস্ট করা ওভারল্যাপিং আত্মবিশ্বাসের অন্তরগুলির বিশ্লেষণের খুব স্মরণ করিয়ে দেয় Indeed প্রকৃতপক্ষে, সেখানে যাদু শক্তি, , যাদু শক্তির একে অপরের অংশ) এখানে, . এই মুহুর্তে আপনি পরীক্ষার পুনরুত্পাদনযোগ্যতার ক্ষেত্রে সেই বিশ্লেষণটির পুনরায় ব্যাখ্যা করতে সক্ষম হওয়া উচিত))0.5571.910,557


পরীক্ষামূলক ফলাফল

এই ফলাফলগুলি একটি সোজাসাপ্টা সিমুলেশন দিয়ে নিশ্চিত করা হয়। নিম্নলিখিত Rকোডটি কভারেজের ফ্রিকোয়েন্সি, হিসাবে গণনা করার সুযোগ এবং কতটা পৃথক তার মূল্যায়ন করার জন্য একটি জেড-স্কোর প্রদান করে। জেড-স্কোরগুলি সাধারণত আকারের কম থাকে , (বা বা সিআই গণিত হয় কিনা ) নির্ধারণ করে, সূত্রের সঠিকতা ।2 এন , মি , μ , σ , α জেড টি ( 1 )(1)2এন,মি,μ,σ,αজেডটি(1)

n <- 3      # First sample size
m <- 2      # Second sample size
sigma <- 2 
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))

আপনি বলছেন যে z এর পরিবর্তে টি ব্যবহার করলে খুব বেশি পার্থক্য হবে না। আমি আপনাকে বিশ্বাস করি কিন্তু এখনও পরীক্ষা করে দেখিনি। ছোট নমুনার আকারের সাথে, দুটি সমালোচনামূলক মানগুলি অনেকগুলি পৃথক হতে পারে এবং টি বন্টন হ'ল সিআই গণনা করার সঠিক উপায়। আপনি z ব্যবহার করতে পছন্দ করেন কেন ??
হার্ভি মোটুলস্কি

এটি নিখুঁতভাবে চিত্রণযোগ্য এবং সহজ। আপনি যখন ব্যবহার করেন এটি আকর্ষণীয় যে চিত্রের বক্ররেখাগুলি উচ্চতর শুরু হয় এবং তাদের সীমাতে নেমে আসে। বিশেষত, উল্লেখযোগ্য ফলাফলের পুনরুত্পাদন করার সুযোগটি তখন বড় আকারের তুলনায় ছোট নমুনাগুলির চেয়ে অনেক বেশি! মনে রাখবেন যে যাচাই করার মতো কিছুই নেই, কারণ আপনি interpret যথাযথ শিক্ষার্থী বিতরণের শতাংশের পয়েন্ট হিসাবে (বা আপনি যে নামটির যত্ন নিতে পারেন এমন কোনও বিতরণ) হিসাবে ব্যাখ্যা করতে স্বাধীন । বিশ্লেষণে কিছুই পরিবর্তন হয় না। আপনি যদি বিশেষ প্রভাবগুলি দেখতে চান তবে কোডের লাইনটি সংঘাত করুন । টি জেড αজেডটিজেডαqt
হোবার

1
+1 টি। এটি একটি দুর্দান্ত বিশ্লেষণ (এবং আপনার উত্তরের এটির জন্য খুব অল্প কিছু উপায়ে রয়েছে)। আমি কেবল একটি কাগজ জুড়ে এসেছি যা খুব খুব বিস্তারিতভাবে এই প্রশ্নটি নিয়ে আলোচনা করেছে এবং আমি ভেবেছিলাম আপনার আগ্রহী হতে পারে: কামিং এবং মাইলার্ডেট, 2006, আত্মবিশ্বাসের বিরতি এবং প্রতিলিপি: নেক্সট মানে কোথায় পড়বে ? । তারা এটিকে আত্মবিশ্বাসের ব্যবধানের শতাংশের ক্যাপচার বলে ।
অ্যামিবা বলছেন মনিকাকে

@ আমোবা রেফারেন্সের জন্য আপনাকে ধন্যবাদ। আমি এতে একটি সাধারণ সিদ্ধান্তের বিশেষত প্রশংসা করি: "প্রতিলিপিটি বৈজ্ঞানিক পদ্ধতির কেন্দ্রবিন্দু এবং গবেষকরা কেবল এটির জন্য অন্ধ দৃষ্টি ঘুরিবেন না কারণ এটি একটি একক গবেষণার অন্তর্নিহিত অনিশ্চয়তাকে গুরুত্বপূর্ণ করে তোলে।"
whuber

1
আপডেট: বোন থ্রেডে চলমান আলোচনার জন্য ধন্যবাদ, আমি এখন বিশ্বাস করি উপরের মন্তব্যে আমার যুক্তিটি সঠিক ছিল না । 95% সিআই-এর 83% "রেপ্লিকেশন-ক্যাপচার" রয়েছে, তবে এটি বারবার নমুনা দেওয়ার বিষয়ে একটি বিবৃতি এবং এটি একটি নির্দিষ্ট আত্মবিশ্বাসের বিরতিতে শর্তযুক্ত সম্ভাব্যতা হিসাবে ব্যাখ্যা করা যায় না, কমপক্ষে আরও অনুমান না করেই নয়। (সম্ভবত আরও এই পাঠকদের বিভ্রান্ত না করার জন্য এই এবং পূর্ববর্তী উভয় মন্তব্যই ভালভাবে মুছে ফেলা উচিত))
অ্যামিবা বলেছেন মনিকাকে

4

[বাগ হুবার নির্দেশিত বাগ ঠিক করতে সম্পাদিত]]

টি বিতরণ এবং নমুনা আকারের ক্রিয়া হিসাবে প্লট কভারেজটি ব্যবহার করতে আমি @ হুইবারের আর কোড পরিবর্তন করেছি al ফলাফলগুলি নীচে রয়েছে। উচ্চ নমুনার আকারে, ফলাফলগুলি হুবুবারের সাথে অবশ্যই মেলে।

এখানে চিত্র বর্ণনা লিখুন

এবং এখানে অভিযোজিত আর কোড রয়েছে, দুবার আলফা সেট দিয়ে 0.01 বা 0.05 এ সেট করুন run

sigma <- 2 
mu <- -4
alpha <- 0.01
n.sim <- 1e5
#
# Compute the multiplier.

for (n in c(3,5,7,10,15,20,30,50,100,250,500,1000))
{
   T <- qt(alpha/2, df=n-1)     
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + T * s.1 / sqrt(n)
u.1 <- x.1.bar - T * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(n*n.sim, mu, sigma), nrow=n))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
Coverage=mean(covers)

print (Coverage)

}

এবং এখানে গ্রাফপ্যাড প্রিজম ফাইল যা গ্রাফ তৈরি করেছিল।


আমি বিশ্বাস করি আপনার প্লটগুলি কোনও বাগের কারণে টি বিতরণ ব্যবহার করে না : আপনি লুপের বাইরের মান সেট করেছেন ! আপনি যদি সঠিক বক্ররেখা দেখতে চান তবে আমার কোডের শেষে (সিমুলেটেড ফলাফলের উপর নির্ভর না করে) দেওয়া হিসাবে আমার TRcurve(pf(qt(.975, x-1)^2 / ((x * (1/x + 1/x))), 1, x-1), 2, 1000, log="x", ylim=c(.8,1), col="Blue"); curve(pf(qt(.995, x-1)^2 / ((x * (1/x + 1/x))), 1, x-1), add=TRUE, col="Red")
উত্তরটিতে

1
@whuber। বাবা! অবশ্যই আপনি ঠিক। বিব্রতকর। আমি এটা ঠিক করেছি। আপনি যেমন উল্লেখ করেছেন যে ক্ষুদ্র নমুনার আকারগুলির সাথে কভারেজটি বেশি। (আমি সিমুলেশনগুলি সংশোধন করেছি এবং আপনার তাত্ত্বিক ফাংশনটি ব্যবহার করে দেখিনি।)
হার্ভি মোটুলস্কি

জেডα/2পি=0.951-α

@ যাহাকে আমি ভাবি যে পরবর্তী পদক্ষেপটি কভারেজের বিতরণকে লক্ষ্য করা উচিত। এখনও অবধি, আমাদের গড় কভারেজ রয়েছে (প্রতিটি প্রথম দ্বিতীয় পরীক্ষার গড় সহ অনেকগুলি প্রথম পরীক্ষার গড়)। তবে প্রথম পরীক্ষাটি কী তার উপর নির্ভর করে কিছু ক্ষেত্রে গড় কভারেজটি দুর্বল হবে। বিতরণটি দেখতে আকর্ষণীয় হবে। আমি আর যথেষ্ট ভালভাবে জানার চেষ্টা করছি।
হার্ভে মোটুলস্কি

বিতরণ সম্পর্কিত, উপরের মন্তব্যে আমি লিঙ্কিত কাগজটি দেখুন।
অ্যামিবা বলেছেন মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.