উল্লেখযোগ্য ফলাফল না পাওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা টাইপ আই ত্রুটির হার বাড়ায়?


60

আমি ঠিক ভাবছিলাম যে কোনও গুরুত্বপূর্ণ ফলাফল (যেমন, ) প্রাপ্ত না হওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা (যেমন, পি-হ্যাকিং) টাইপ আই ত্রুটির হার বৃদ্ধি করে?p<.05

আমি Rএই ঘটনার একটি প্রদর্শনের জন্য অত্যন্ত প্রশংসা করব ।


6
আপনার সম্ভবত সম্ভবত "পি-হ্যাকিং" বোঝানো হয়েছে কারণ "হার্কিং" বলতে "ফলাফলগুলি জানা হওয়ার পরে হাইপোথাইজাইজিং" বোঝায় এবং যদিও এটি কোনও সম্পর্কিত পাপ হিসাবে বিবেচিত হতে পারে তবে এটি আপনি যা জিজ্ঞাসা করছেন বলে মনে হয় তা নয়।
হোবার

2
আবার, xkcd ছবি সহ একটি ভাল প্রশ্নের উত্তর দেয়। xkcd.com/882
জেসন

7
@ জেসন আমাকে আপনার লিঙ্কটির সাথে একমত হতে হবে না; এটি ডেটা সংগ্রহের বিষয়ে আলোচনা করে না। এমনকি একই জিনিস সম্পর্কে উপাত্ত সংগ্রহ এবং আপনার ভ্যালুটি গণনা করতে হবে এমন সমস্ত ডেটা ব্যবহার করার বিষয়টি যে এক্স কেসিডি-র ক্ষেত্রে তার চেয়ে অনেক বেশি অনানুষ্ঠানিক। p
জিক ২৮

1
@ জাইক, ফর্সা কল। আমি "আমাদের পছন্দ মতো ফলাফল না পাওয়া পর্যন্ত চেষ্টা চালিয়ে যাচ্ছি" দিকটি সম্পর্কে আমি দৃষ্টি নিবদ্ধ রেখেছিলাম, তবে আপনি একেবারে সঠিক, হাতে থাকা প্রশ্নের মধ্যে আরও অনেক কিছুই রয়েছে।
জেসন

এই থ্রেডে "এ / বি (অনুক্রমিক) পরীক্ষার" ব্যবহারিকভাবে অভিন্ন মামলার জন্য আলোচিত হিসাবে @ শুভ্র এবং ব্যবহারকারী ১17778 very খুব অনুরূপ জবাব দিয়েছেন: stats.stackexchange.com/questions/244646/… সেখানে, আমরা পরিবার অনুসারে ত্রুটির বিচারে তর্ক করেছি বারবার পরীক্ষায় পি-মান সমন্বয়ের জন্য হার এবং প্রয়োজনীয়তা। এই প্রশ্নটি আসলে পুনরাবৃত্তি পরীক্ষার সমস্যা হিসাবে দেখা যেতে পারে!
tomka

উত্তর:


87

সমস্যাটি হ'ল আপনি নিজেকে পরীক্ষায় পাস করার জন্য অনেক বেশি সুযোগ দিচ্ছেন। এটি এই কথোপকথনের একটি অভিনব সংস্করণ:

রাতের খাবারের জন্য কে বেতন দেয় তা দেখতে আমি আপনাকে ফ্লিপ করব।

ঠিক আছে, আমি মাথা কল।

ইঁদুর, আপনি জিতেছে। সেরা তিনজনের মধ্যে দু'জন?


এটি আরও ভালভাবে বুঝতে , এই অনুক্রমিক পদ্ধতির একটি সরল - তবে বাস্তব - মডেল বিবেচনা করুন । মনে করুন আপনি একটি নির্দিষ্ট সংখ্যক পর্যবেক্ষণের "ট্রায়াল রান" দিয়ে শুরু করবেন, তবে চেয়ে কম পি-ভ্যালু পাওয়ার জন্য দীর্ঘ সময় ধরে পরীক্ষা চালিয়ে যেতে রাজি আছেন । নাল হাইপোথিসিসটি হ'ল প্রতিটি পর্যবেক্ষণ একটি স্ট্যান্ডার্ড সাধারণ বিতরণ থেকে আসে (স্বতন্ত্রভাবে)। বিকল্পটি হল যে একটি ননজারো গড় দিয়ে ইউনিট-ভেরিয়েন্সের স্বাভাবিক বিতরণ থেকে স্বতন্ত্রভাবে আসে। পরীক্ষার পরিসংখ্যান সব গড় হতে হবে পর্যবেক্ষণ, , তাদের মান ত্রুটি দ্বারা বিভক্ত, । দ্বিমুখী পরীক্ষার জন্য, সমালোচনামূলক মানগুলিএক্স আই এক্স আই এন ˉ এক্স 1 / 0.05XiXinX¯ 0.0250.975জেডα=±1.961/n0.025 এবং শতাংশ আদর্শ সাধারণ বন্টনের শতাংশ পয়েন্ট, প্রায় ।0.975Zα=±1.96

এটি একটি ভাল পরীক্ষা - একটি নির্দিষ্ট নমুনা আকার সাথে একক পরীক্ষার জন্য । এটি নাল হাইপোথিসিসকে প্রত্যাখ্যান করার ঠিক সম্ভাবনা রয়েছে, যাই হউক না কেন ।5 % এনn5%n

সমস্ত মান, এর যোগফলের ভিত্তিতে বীজগণিতভাবে এটিকে একটি সমতুল্য পরীক্ষায় রূপান্তর করি Let'sএস এন = এক্স 1 + এক্স 2 + + এক্স এন = এন ˉ এক্সn

Sn=X1+X2++Xn=nX¯.

সুতরাং, তথ্য যখন "তাৎপর্যপূর্ণ" হয়

|Zα||X¯1/n|=|Snn/n|=|Sn|/n;

এটাই,

(1)|Zα|n|Sn|.

আমরা যদি স্মার্ট হয়ে থাকি তবে আমরা আমাদের লোকসানগুলি কেটে দেব এবং খুব বড় হয়ে যাওয়ার পরে ছেড়ে চলে যাব এবং ডেটা এখনও সমালোচনামূলক অঞ্চলে প্রবেশ করেনি।n

এটি একটি এলোমেলো হাঁটার বর্ণনা করে । সূত্র এলোমেলো হাঁটার প্লট এর চারপাশে একটি বাঁকা পরক "বেড়া," বা বাধা : এলোমেলো কোনও বিন্দু করলে ফলাফলটি "তাৎপর্যপূর্ণ" হয় । ( 1 ) ( এন , এস এন )Sn(1)(n,Sn)

এটি এলোমেলো হাঁটার একটি সম্পত্তি যা আমরা যদি দীর্ঘক্ষণ অপেক্ষা করি তবে খুব সম্ভবত যে কোনও সময় ফলাফলটি তাৎপর্যপূর্ণ দেখাবে।

নমুনার সীমাতে এখানে 20 টি স্বতন্ত্র সিমুলেশন রয়েছে । এগুলি সবগুলি নমুনায় পরীক্ষা করা শুরু করে, যে বিন্দুতে আমরা প্রতিটি পয়েন্ট সূত্র অনুসারে আঁকা বাধাগুলির বাইরে রয়েছে কিনা তা পরীক্ষা করি । যে পরিসংখ্যানের পরীক্ষাটি প্রথম "তাৎপর্যপূর্ণ" হয় সেই বিন্দু থেকে সিমুলেটেড ডেটা রঙিন হয়।এন = 30 ( 1 )n=5000n=30(1)

ব্যক্তিত্ব

কী চলছে তা আপনি দেখতে পাচ্ছেন: এলোমেলো হাঁটা চাবুকগুলি আরও বাড়িয়ে নিচে আরও বাড়ছেবাধাগুলি প্রায় একই হারে ছড়িয়ে পড়ছে - তবে এলোমেলো হাঁটা এড়াতে সবসময় পর্যাপ্ত দ্রুত নয়।n

এর মধ্যে 20% সিমুলেশনে একটি "উল্লেখযোগ্য" পার্থক্য পাওয়া যায় - সাধারণত বেশ তাড়াতাড়ি - যদিও তাদের প্রত্যেকটিতে নাল অনুমানটি একেবারে সঠিক! এই ধরণের আরও সিমুলেশন চালানো ইঙ্গিত দেয় যে প্রকৃত পরীক্ষার আকারটি মানের চেয়ে কাছাকাছি : এটিই আপনার সিম্পল আকারের অবধি "তাত্পর্য" সন্ধান করতে আপনার আগ্রহী নাল সত্য হওয়া সত্ত্বেও আপনাকে নাল প্রত্যাখ্যান করার সুযোগ দেয় ।α = 5 % 5000 25 %25%α=5%500025%

লক্ষ্য করুন যে চারটি "উল্লেখযোগ্য" ক্ষেত্রে যেমন পরীক্ষা চলতে থাকে তেমনি কিছু পয়েন্টে ডেটা উল্লেখযোগ্যভাবে দেখা বন্ধ করে দেয় । বাস্তব জীবনে, একজন পরীক্ষক যিনি তাড়াতাড়ি থামেন তিনি এই জাতীয় "বিপর্যয়" পর্যবেক্ষণ করার সুযোগ হারাচ্ছেন। Seচ্ছিক থামিয়ে পক্ষপাতদুষ্টের মাধ্যমে এই নির্বাচনের ফলস্বরূপ।

সৎ-থেকে-সদোধার ক্রমক্রমিক পরীক্ষায়, বাধাগুলি লাইন। এগুলি এখানে প্রদর্শিত বাঁকা বাধার চেয়ে দ্রুত ছড়িয়ে পড়ে।

library(data.table)
library(ggplot2)

alpha <- 0.05   # Test size
n.sim <- 20     # Number of simulated experiments
n.buffer <- 5e3 # Maximum experiment length
i.min <- 30     # Initial number of observations
#
# Generate data.
#
set.seed(17)
X <- data.table(
  n = rep(0:n.buffer, n.sim),
  Iteration = rep(1:n.sim, each=n.buffer+1),
  X = rnorm((1+n.buffer)*n.sim)
)
#
# Perform the testing.
#
Z.alpha <- -qnorm(alpha/2)
X[, Z := Z.alpha * sqrt(n)]
X[, S := c(0, cumsum(X))[-(n.buffer+1)], by=Iteration]
X[, Trigger := abs(S) >= Z & n >= i.min]
X[, Significant := cumsum(Trigger) > 0, by=Iteration]
#
# Plot the results.
#
ggplot(X, aes(n, S, group=Iteration)) +
  geom_path(aes(n,Z)) + geom_path(aes(n,-Z)) +
  geom_point(aes(color=!Significant), size=1/2) +
  facet_wrap(~ Iteration)

12
+1 টি। প্রদত্ত যে কোনও এলোমেলো পদক্ষেপ কি শেষ পর্যন্ত সম্ভাব্যতা 1 দিয়ে বাধা অতিক্রম করে? আমি জানি যে পদক্ষেপের পরে প্রত্যাশিত দূরত্বটি এবং আমি এখন সন্ধান করেছি যে আনুপাতিকতা ধ্রুবকটি , যা 1.96 এর চেয়ে কম। তবে আমি কী করব তা নিশ্চিত নই। nO(n)2/π
অ্যামিবা বলেছেন মোনিকা

10
@ অ্যামিবা এটি একটি দুর্দান্ত প্রশ্ন, যা আমি সর্বদা চেষ্টা করেছি :-)। আমি যদি উত্তরটি দ্রুত গণনা করতে পারতাম (বা এটি অফহ্যান্ড জানতাম) তবে আমি এটি পোস্ট করতাম। দুর্ভাগ্যক্রমে আমি এখনই এটি বিশ্লেষণাত্মকভাবে মোকাবেলায় ব্যস্ত। আমি যে দীর্ঘতম সিমুলেশনটি করেছি তা হল 1,000 টি পুনরাবৃত্তি সহ পর্যন্ত সন্ধান করা । "উল্লেখযোগ্য" ফলাফলের অনুপাতটি কাছাকাছি স্থিতিশীল বলে মনে হচ্ছে । n=5,000,000α=0.051/4
whuber

4
বাউন্ডারি মারার সম্ভাবনা সম্পর্কে প্রশ্নটি আকর্ষণীয়। আমি কল্পনা করি যে আইনস্টাইন ব্রাউনিয়ান গতির তত্ত্ব, এটি একটি বিচ্ছুরিত সমীকরণের সাথে সম্পর্কিত, একটি আকর্ষণীয় কোণ হতে পারে। আমাদের সীমানায় বিতরণ ফাংশনের অর্ধেক মানের সমান এবং "কণার ক্ষতি" সমেত একটি বিতরণ ফাংশন ছড়িয়ে পড়েছে (অর্ধেক শূন্য থেকে সরে যায়, অন্য অর্ধেক ফিরে যায়)। এই বিতরণ কার্যটি যেমন ছড়িয়ে পড়ে এবং পাতলা হয়, তেমনি "ক্ষতি" কম হয়। আমি ধারণা করি এটি কার্যকরভাবে একটি সীমা তৈরি করবে, অর্থাৎ এই 1/4। α=0.05n
সেক্সটাস এম্পেরিকাস

6
স্বজ্ঞাত কারণ কেন আপনি একটি পাবেন প্রায় নিশ্চয় কিছু সময়ে: যাক এবং । প্রথম পর -value বিচারের প্রায় কাছাকাছি স্বাধীন প্রথম পর -value বিচারের। তাই আপনি যদি "প্রায়" স্বাধীন অসীম সংখ্যা আছে -values, তাই তাদের মধ্যে একজন হতে নিশ্চিত করা হয় । অবশ্যই, এই আর্গুমেন্টের চেয়ে আসল কনভার্জেন্সটি অনেক দ্রুত। (যদি আপনি পছন্দ করেন না , আপনি চেষ্টা করতে পারেন বা ...)p<0.05n1=10nk+1=10nkpnk+1pnkp<0.0510nkA(nk)BB(nk)
JiK

10
@CL। আমি বেশ কয়েক বছর আগে আপনার আপত্তিটি অনুমান করেছিলাম : 17 হ'ল আমার সর্বজনীন বীজ। আসলে, প্রথম দিকে (অনেক লম্বা) পরীক্ষায় আমি ধারাবাহিকভাবে পেয়ে ছিল বৃহত্তর 20% তুলনায় যথেষ্ট বড় তাত্পর্য হার। চূড়ান্ত চিত্র তৈরি করতে আমি বীজকে 17 এ সেট করেছিলাম এবং হতাশ হয়েছি যে প্রভাবটি এতটা নাটকীয় নয়। সি'স্ট লা ভি। সম্পর্কিত পোস্ট (আপনার পয়েন্টটি চিত্রিত করে) stats.stackexchange.com/a/38067/919রয়েছে
হোবার

18

হাইপোথিসিস টেস্টিংয়ে নতুন যারা মনে করেন যে একবার এপি মান নীচে চলে যায় ।05, আরও অংশগ্রহণকারী যুক্ত করলে কেবল পি মান আরও হ্রাস পাবে। তবে এটি সত্য নয়। নাল অনুমানের অধীনে, এপি মান 0 এবং 1 এর মধ্যে সমানভাবে বিতরণ করা হয় এবং সেই পরিসরে বেশ কিছুটা কাছাকাছি আসতে পারে।

আমি আর-তে কিছু তথ্য সিমুলেটেড করেছি (আমার আর দক্ষতাগুলি বেশ বেসিক)। এই সিমুলেশনটিতে, আমি 5 টি ডাটা পয়েন্ট সংগ্রহ করি - প্রত্যেকে একটি এলোমেলোভাবে নির্বাচিত গ্রুপ সদস্যপদ (0 বা 1) এবং এলোমেলোভাবে নির্বাচিত ফলাফলের পরিমাপের জন্য প্রতিটি ~ N (0,1)। অংশগ্রহণকারী 6 থেকে শুরু করে, আমি প্রতিটি পুনরাবৃত্তিতে একটি টি-পরীক্ষা করি।

for (i in 6:150) {
  df[i,1] = round(runif(1))
  df[i,2] = rnorm(1)
  p = t.test(df[ , 2] ~ df[ , 1], data = df)$p.value
  df[i,3] = p
}

P মানগুলি এই চিত্রটিতে রয়েছে। লক্ষ্য করুন যে নমুনার আকার 70-75 এর কাছাকাছি হলে আমি উল্লেখযোগ্য ফলাফলগুলি পাই find আমি যদি সেখানে থামি, আমি আমার পরিণতিগুলি তাৎপর্য সহকারে শেষ করতে পারব কারণ আমার পি মানগুলি একটি বৃহত্তর নমুনা নিয়ে পিছনে ঝাঁপিয়ে পড়েছে (এই সত্যিকারের ডেটা দিয়ে আসলে আমার সাথে একবার হয়েছিল) এই বিষয়টিটি আমি মিস করেছি। যেহেতু আমি জানি উভয় জনসংখ্যারই গড় 0 আছে, এটি অবশ্যই একটি মিথ্যা ইতিবাচক হবে। পি <.05 অবধি ডেটা যুক্ত করার ক্ষেত্রে এটিই সমস্যা। যদি আপনি পর্যাপ্ত পরীক্ষা পরিচালনা করেন তবে পি শেষ পর্যন্ত .05 প্রান্তিকাকে অতিক্রম করবে এবং আপনি কোনও ডেটা সেট উল্লেখযোগ্য প্রভাব খুঁজে পেতে পারেন।

এখানে চিত্র বর্ণনা লিখুন


1
ধন্যবাদ তবে আপনার Rকোডটি মোটেই চলবে না।
রেজা

3
@ রেজা আপনার dfপ্রথমে তৈরি করতে হবে ( পছন্দমত এটির চূড়ান্ত আকারে)। যেহেতু কোডটি সারি at-এ লিখতে শুরু করে তা বোঝানো (যা উত্তরের পাঠ্যের সাথে খাপ খায়) হ'ল ডিএফ ইতিমধ্যে ভরাট 5 টি সারি নিয়ে উপস্থিত রয়েছে something সম্ভবত এরকম কিছু উদ্দেশ্য ছিল: n150<-vector("numeric",150); df<-data.frame(gp=n150,val=n150,pval=n150); init<-1:5; df[init,1]<-c(0,1,0,1,0); df[init,2]<-rnorm(5)(তারপরে উপরের কোডটি চালান) তবে সম্ভবত: plot(df$pv[6:150])
Glen_b

@ ইউজার ২77 very very78 অত্যন্ত মনোযোগী দরকারী এবং প্রাসঙ্গিক উত্তর। তবে পি-ভ্যালু তথাকথিত - নাচের সৌন্দর্যের ব্যাখ্যা সম্পর্কে খুব বেশি বিভ্রান্তি রয়েছে।
সুভাষ সি। দাবার

@ user163778 - আপনি কোড খুব সবকিছু আরম্ভ করতে অন্তর্ভুক্ত করা উচিত
Dason

17

এই উত্তরটি কেবলমাত্র শেষ পর্যন্ত "তাত্পর্যপূর্ণ" ফলাফল পাওয়ার সম্ভাবনা এবং @ হুইবারের মডেলের অধীনে এই ইভেন্টে সময় বিতরণ করার সম্ভাবনা নিয়েই উদ্বেগ প্রকাশ করে।

@ ভুবারের মডেল হিসাবে, পর্যবেক্ষণ সংগ্রহের পরে পরীক্ষার পরিসংখ্যানের মান বোঝায় এবং ধরে যে যদি আইআইডি স্ট্যান্ডার্ড হয় । তারপরে যেমন একটি ক্রমাগত সময়ের মান ব্রাউনিয়ান গতির মতো আচরণ করে, যদি আমরা এই মুহুর্তের জন্য উপেক্ষা করি তবে আমাদের একটি পৃথক-সময় প্রক্রিয়া (নীচে বাম প্লট) রয়েছে factS(t)=X1+X2++XttX1,X2,

(1)S(t+h)|S(t)=s0N(s0,h),
S(t)

যাক বোঝাতে প্রথম উত্তরণ সময় সময় নির্ভর বাধা জুড়ে (প্রয়োজন আগে পরীক্ষা উল্লেখযোগ্য সক্রিয় পর্যবেক্ষণ নম্বর)।TS(t)±zα/2t

রুপান্তরিত প্রক্রিয়া বিবেচনা করুন স্কেলিং দ্বারা প্রাপ্ত সময়ে তার স্ট্যানডার্ড ডেভিয়েশন দ্বারা এবং নতুন সময় স্কেল লেট করে যেমন যে এটি (1) এবং (2) এর পরে অনুসরণ করে যে সাধারণত এবং Y(τ)S(t)tτ=lnt

(2)Y(τ)=S(t(τ))t(τ)=eτ/2S(eτ).
Y(τ+δ)
E(Y(τ+δ)|Y(τ)=y0)=E(e(τ+δ)/2S(eτ+δ)|S(eτ)=y0eτ/2)(3)=y0eδ/2
Var(Y(τ+δ)|Y(τ)=y0)=Var(e(τ+δ)/2S(eτ+δ)|S(eτ)=y0eτ/2)(4)=1eδ,
অর্থাৎ, হল শূন্য-গড় অর্ন্তস্টাইন-উহলেনবেক (OU) প্রক্রিয়া যার স্থির বৈকল্পিক 1 এবং রিটার্ন সময় 2 (নীচে ডান প্লট) রয়েছে withY(τ)

এখানে চিত্র বর্ণনা লিখুন

রুপান্তরিত মডেল জন্য, বাধা সময় স্বাধীন ধ্রুবক থেকে সমান হয়ে । এরপরে এটি জানা যায় ( নোবাইল ইত্যাদি। 1985 ; রিকার্দি এবং সাতো, 1988 ) যে এই বাধাগুলি পেরিয়ে OU প্রক্রিয়া এর প্রথম প্যাসেজ-টাইম- approximately প্রায় তাত্ক্ষণিকভাবে কিছু প্যারামিটার দিয়ে বিতরণ করা হয় (এ বাধা উপর নির্ভর করে ) (আনুমানিক জন্য নীচে)। এছাড়া আকারের একটা অতিরিক্ত বিন্দু ভর মধ্যে । "প্রত্যাখ্যান"±zα/2TY(τ)λ±zα/2λ^=0.125α=0.05ατ=0H0অবশেষে সম্ভাব্যতার সাথে ঘটে যায় ১। সুতরাং, ("উল্লেখযোগ্য" ফলাফল পাওয়ার আগে যে পর্যবেক্ষণগুলি সংগ্রহ করতে হবে) আনুমানিক প্রত্যাশিত মান সহ একটি লগ প্রকাশকারী বিতরণ অনুসরণ করে সুতরাং, সীমাবদ্ধতা থাকে কেবলমাত্র যদি (পর্যাপ্ততার জন্য) তাত্পর্যপূর্ণ স্তরের )।T=eT

(5)ET1+(1α)0eτλeλτdτ.
Tλ>1α

উপরেরগুলি সত্যিকারের মডেলের জন্য স্বতন্ত্র এবং আসল প্রক্রিয়াটি নিরবচ্ছিন্ন-সময়ের চেয়ে আলাদা - এই বিষয়টি উপেক্ষা করে । অতএব, উপরের মডেলটি বাধাটি অতিক্রম করেছে (এবং অবমূল্যায়ন করে ) সম্ভাবনাটিকে তাত্পর্যপূর্ণ করে তোলে কারণ অবিচ্ছিন্ন সময় নমুনা পথটি কেবল দুটি সংলগ্ন বিচ্ছিন্ন সময় পয়েন্ট এবং মধ্যে সাময়িকভাবে বাধা অতিক্রম করতে পারে । কিন্তু এই ধরনের ঘটনা বৃহৎ জন্য তুচ্ছ সম্ভাব্যতা থাকা উচিত । E T t t + 1 tTETtt+1t

নিম্নলিখিত চিত্রটি এক্সপোনেনশিয়াল ক্রমাগত-সময় আনুমানিককরণ (লাল রেখা) এর জন্য বেঁচে থাকা বক্ররেখার সাথে লগ-লগ স্কেলে এর কাপলান-মেয়ের অনুমান দেখায় ।P(T>t)

এখানে চিত্র বর্ণনা লিখুন

আর কোড:

# Fig 1
par(mfrow=c(1,2),mar=c(4,4,.5,.5))
set.seed(16)
n <- 20
npoints <- n*100 + 1
t <- seq(1,n,len=npoints)
subset <- 1:n*100-99
deltat <- c(1,diff(t))
z <- qnorm(.975)
s <- cumsum(rnorm(npoints,sd=sqrt(deltat)))
plot(t,s,type="l",ylim=c(-1,1)*z*sqrt(n),ylab="S(t)",col="grey")
points(t[subset],s[subset],pch="+")
curve(sqrt(t)*z,xname="t",add=TRUE)
curve(-sqrt(t)*z,xname="t",add=TRUE)
tau <- log(t)
y <- s/sqrt(t)
plot(tau,y,type="l",ylim=c(-2.5,2.5),col="grey",xlab=expression(tau),ylab=expression(Y(tau)))
points(tau[subset],y[subset],pch="+")
abline(h=c(-z,z))

# Fig 2
nmax <- 1e+3
nsim <- 1e+5
alpha <- .05
t <- numeric(nsim)
n <- 1:nmax
for (i in 1:nsim) {
  s <- cumsum(rnorm(nmax))
  t[i] <- which(abs(s) > qnorm(1-alpha/2)*sqrt(n))[1]
}
delta <- ifelse(is.na(t),0,1)
t[delta==0] <- nmax + 1
library(survival)
par(mfrow=c(1,1),mar=c(4,4,.5,.5))
plot(survfit(Surv(t,delta)~1),log="xy",xlab="t",ylab="P(T>t)",conf.int=FALSE)
curve((1-alpha)*exp(-.125*(log(x))),add=TRUE,col="red",from=1,to=nmax)

ধন্যবাদ! এই ফলাফলগুলির জন্য আপনার কোনও (মানক) রেফারেন্স রয়েছে? উদাহরণস্বরূপ, কেন ওয়াই প্রক্রিয়াটি একটি অর্ঁস্টেইন-উহলেনবেক এবং কোথায় প্যাসেজ সময় ফলাফল বর্ণিত হবে?
গ্রাসি

1
আমি এই রূপান্তরটি অন্য কোথাও দেখিনি তবে আমি বিশ্বাস করি (3) এবং (4) যা সহজেই (1) এবং (2) অনুসরণ করে এবং স্বাভাবিকতা OU প্রক্রিয়াটিকে পুরোপুরি বৈশিষ্ট্যযুক্ত করে। গুগল পণ্ডিত OU প্রক্রিয়াটির জন্য প্রথম-উত্তীর্ণের সময় বিতরণের আনুমানিক তাত্পর্যপূর্ণতার উপরে প্রচুর ফলাফল প্রদান করে। তবে আমি বিশ্বাস করি যে case this এক্ষেত্রে (একটানা-সময় আনুমানিকের মধ্যে) ঠিক তাত্ক্ষণিকভাবে বিতরণ করা হয় (point অতিরিক্ত পয়েন্ট ভর ব্যতীত ) কারণ প্রক্রিয়াটির স্থিতিশীল বিতরণ থেকে আসে । τ = 0 ওয়াই ( 0 )Tτ=0Y(0)
জারলে টুফটো


@ গ্র্যাসি আসলে স্মরণহীনতার ভিত্তিতে আমার যুক্তি ত্রুটিযুক্ত ছিল। সীমানা থেকে দূরে ভ্রমণের সময়সীমা তাত্পর্যপূর্ণভাবে বিতরণ করা হয় না। অতএব, stats.stackexchange.com/questions/298828/… হিসাবে একই যুক্তির উপর ভিত্তি করে , স্থির বন্টন থেকে আসা হলেও, প্রথম উত্তরণের সময়টি ঠিক তাত্ক্ষণিকভাবে বিতরণ করা হয় না। Y(0)
জারলে টুফ্টো

5

এটি বলা দরকার যে উপরোক্ত আলোচনাটি ঘন ঘন এক বিশ্বদর্শনের জন্য যার জন্য আপনি বহুগুণ হবেন এমন তথ্য যা আপনার ডেটাটিকে আরও চরম হওয়ার সম্ভাবনা থেকে আসে, আপনি যে প্রভাব কার্যকর করার সম্ভাবনা দেন তা থেকে নয়। সমস্যার মূল কারণ হ'ল পি-মান এবং টাইপ আই ত্রুটিগুলি পিছনের সময়-পিছনের তথ্য-প্রবাহের কন্ডিশনিং ব্যবহার করে, যা এটি "আপনি এখানে কিভাবে এসেছেন" এবং এর পরিবর্তে কী ঘটতে পারে তা গুরুত্বপূর্ণ করে তোলে । অন্যদিকে, বায়সিয়ান দৃষ্টান্ত ডেটা নয়, প্যারামিটারের নিজের উপর প্রভাব সম্পর্কে সংশয়কে এনকোড করে। আপনি 5 মিনিট আগে কোনও প্রভাবের পরবর্তী উত্তর সম্ভাবনাটি গণনা করেছেন কিনা তা প্রতিটি উত্তরোত্তর সম্ভাবনাটিকেই একইভাবে ব্যাখ্যা করা যায়। আরও বিশদ এবং একটি সাধারণ সিমুলেশন পাওয়া যেতে পারে http://www.fharrell.com/2017/10/continuous-firening-from-data-no এ।


1
আসুন ডা বি এর নেতৃত্বে একটি ল্যাব কল্পনা করুন যিনি একজন ধর্মপ্রাণ বায়েশিয়ান ian ল্যাব সামাজিক প্রাইমিং অধ্যয়ন করছে এবং প্রাইমিংয়ের বিভিন্ন প্রভাবগুলি দেখায় এমন এক ধ্রুবক কাগজ তৈরি করেছে, যা প্রতিবার বেয়েস ফ্যাক্টর বিএফ> 10 দ্বারা সমর্থিত। যদি তারা ক্রমানুসারে টেস্টিং না করে তবে এটি বেশ দৃinc়প্রত্যয়ী বলে মনে হচ্ছে। তবে আসুন আমি বলি যে আমি শিখি যে তারা সর্বদা ক্রমানুসারে টেস্টিং করে এবং প্রাইমিং এফেক্টের পক্ষে BF> 10 প্রাপ্ত না হওয়া পর্যন্ত নতুন বিষয় পেতে থাকে । তাহলে পরিষ্কারভাবে এই পুরো শরীরের কাজ নিরর্থক। তারা ক্রমানুসারে টেস্টিং + নির্বাচন করে এমন বিষয়টি বিএফ-এর পি-মানের উপর ভিত্তি করে কোনও তাত্পর্যপূর্ণ।
অ্যামিবা বলেছেন মোনিকা

1
আমি বেয়েসের উপাদান ব্যবহার করি না। কিন্তু তারা অবর সম্ভাব্যতা ব্যবহার করা হয় এবং একটি ইতিবাচক প্রভাব অবর সম্ভাব্যতা পর্যন্ত প্রতিটি পরীক্ষা চালানোর ছিল , সেখানে একেবারে এই সম্ভাব্যতা দোষের কিছু হবে। আমার ব্লগ নিবন্ধটির শুরুতে উদ্ধৃতিটি দেখুন - আমার উত্তরটিতে লিঙ্কটি দেখুন। প্রাথমিক প্রভাব সম্পর্কে বিশ্বাসের ডিগ্রিটি ডেটা এবং পূর্বের বিশ্বাস থেকে আসে। আপনি যদি (আমার মতো) এই জাতীয় প্রাথমিক প্রভাবগুলির জন্য খুব সন্দেহজনক হন তবে উত্তরোত্তর সম্ভাবনাগুলি গণনা করার সময় আপনি আগে যথেষ্ট সন্দেহজনক ব্যবহার করতে চাইবেন। এটাই. 0.95
ফ্র্যাঙ্ক হ্যারেল

1
আমি আপনার ব্লগ পোস্টটি পড়েছি, উদ্ধৃতিটি লক্ষ্য করেছি এবং অনুরূপ একটি কাগজের দিকে তাকিয়েছি ( ptionচ্ছিক থামানো: বায়েশিয়ানদের কোনও সমস্যা নেই ) যা অন্য কোনও উত্তরের মন্তব্যে অন্য কেউ লিঙ্ক করেছেন। আমি এখনও এটি পাই না। যদি "নাল" (অনুপস্থিত প্রাইমিং এফেক্টস) সত্য হয়, তবে ডাঃ বি যদি যথেষ্ট পরিমাণে নমুনা নিতে রাজি হন তবে তিনি পরীক্ষার সময় প্রতিবারের মতো 0.95% উত্তরোত্তর সম্ভাবনা অর্জন করতে সক্ষম হবেন (ঠিক যেমন ডঃ এফ সক্ষম হবেন) পি <0.05 প্রতি একক সময় পান)। এটি যদি "একেবারেই কিছু ভুল না হয়" তবে আমি কী তা জানি না।
অ্যামিবা বলছেন মনিকাকে

2
ঠিক আছে, আমি এই "বড় বিষয়" বিরোধ। আমি এটা সত্য মনে করি না। আমি পুনরায় শূন্য প্রভাব নাল অধীনে এবং সঙ্গে রাখা হিসাবে সাথে আপনার পূর্বের দেওয়া পুনরাবৃত্তি স্যাম্পলিং পাবেন (ধরুন কিছু বিস্তৃত একটানা পূর্বে শূন্য কেন্দ্রীভূত দিন) সবসময় কখনো কখনো ফলন> 0.98 অবর সম্ভাব্যতা শূন্য উপরে মনোনিবেশ। যে ব্যক্তি এটি না হওয়া পর্যন্ত নমুনা তৈরি করে (যেমন এই থামানোর নিয়মটি প্রয়োগ করা), তিনি প্রতিবারই ভুল হয়ে যাবেন । আপনি কীভাবে বলতে পারেন যে এই ব্যক্তিটি কেবল 0.02 বার ভুল হবে? আমি বুঝতে পারছি না। এই বিশেষ পরিস্থিতিতে, না তিনি করবেন না, তিনি সর্বদা ভুল থাকবেন।
অ্যামিবা বলেছেন মোনিকা

2
আমি মনে করি না আমি। আমার বড় কথাটি হ'ল এটি অনুচিত এবং অসঙ্গত যে একই সাথে ক্রমবর্ধমান পরীক্ষার দ্বারা ভুগতে ঘন ঘন ঘনবাদী প্রক্রিয়াগুলিকে দোষ দেওয়া এবং সিক্যুয়াল টেস্টিং দ্বারা প্রভাবিত না হয়ে বায়েশিয়ান পদ্ধতিগুলি রক্ষা করা। আমার বক্তব্য (যা একটি গাণিতিক সত্য) তা হ'ল তারা উভয়ই ঠিক একইভাবে প্রভাবিত হয়েছে, অর্থাত ক্রমিক পরীক্ষার ফলে বায়েশিয়ান ধরণের প্রথম ত্রুটি 100% পর্যন্ত বৃদ্ধি পেতে পারে। অবশ্যই যদি আপনি বলেন যে আপনি নীতিগত বিষয় হিসাবে, টাইপ আই ত্রুটির হারগুলিতে আগ্রহী নন তবে এটি অপ্রাসঙ্গিক। তবে তারপরেও ঘন ঘন পদ্ধতিবাদীদের দোষ দেওয়া উচিত নয়।
অ্যামিবা বলেছেন

3

আমরা একটি গবেষককে কিছু অনুমান test পরীক্ষা করতে , , আকারের একটি নমুনা সংগ্রহ করা বিবেচনা । তিনি যদি প্রত্যাখ্যান করেন যে কোনও উপযুক্ত পরীক্ষার পরিসংখ্যান এর মাত্রা- সমালোচনামূলক মান ছাড়িয়ে যায় । যদি এটি না হয়, তবে তিনি , আকারের অন্য একটি নমুনা সংগ্রহ করেন এবং সম্মিলিত নমুনার পরীক্ষাটি প্রত্যাখ্যান করলে প্রত্যাখ্যান করে । যদি তিনি এখনও কোনও প্রত্যাখ্যান না পান তবে তিনি এই ফ্যাশনে এগিয়ে চলেছেন, মোট ।x 1 θ = θ 0 t α c n x 2 ( x 1 , x 2 ) কেnx1θ=θ0tαcnx2(x1,x2)K

এই সমস্যাটিকে ইতিমধ্যে পি। আর্মিটেজ, সি কে ম্যাকফারসন এবং বিসি রোউ (1969), রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল দ্বারা সম্বোধন করা হয়েছে বলে মনে হয় সিরিজ এ (১৩২), ২, ২৩৫-২৪৪: "পুনরুদ্ধারযোগ্য উপাত্তগুলিতে গুরুত্বপূর্ণ টেস্টগুলি"

এই বিষয়টি নিয়ে বায়েশিয়ার দৃষ্টিভঙ্গি, এখানেও আলোচনা করা হয়েছে, বার্গার এবং ওলপার্ট (1988), "সম্ভাবনার নীতি" , বিভাগ 4.2-তে আলোচনা করা হয়েছে।

এখানে আর্মিটেজ এট আল-এর ফলাফলগুলির একটি আংশিক প্রতিলিপি দেওয়া হয়েছে (নীচের কোড), যা দেখায় যে যখন তাত্পর্য স্তরগুলি বাড়িয়ে দেয় তেমনি স্তর- সমালোচনামূলক মানগুলি পুনরুদ্ধার করতে সম্ভাব্য সংশোধন কারণগুলিও দেখায় । নোট করুন গ্রিড অনুসন্ধান চালাতে কিছুটা সময় নেয় --- বাস্তবায়ন বরং অকার্যকর হতে পারে।αK>1α

প্রচেষ্টার সংখ্যার ফাংশন হিসাবে স্ট্যান্ডার্ড প্রত্যাখ্যান নিয়মের আকারK

এখানে চিত্র বর্ণনা লিখুন

বিভিন্ন জন্য ক্রমবর্ধমান সমালোচনামূলক মান হিসাবে একটি ফাংশন হিসাবে আকারK

এখানে চিত্র বর্ণনা লিখুন

ফাংশন হিসাবে 5% পরীক্ষা পুনরুদ্ধার করতে সমন্বিত সমালোচনামূলক মানগুলিK

এখানে চিত্র বর্ণনা লিখুন

reps <- 50000

K <- c(1:5, seq(10,50,5), seq(60,100,10)) # the number of attempts a researcher gives herself
alpha <- 0.05
cv <- qnorm(1-alpha/2)

grid.scale.cv <- cv*seq(1,1.5,by=.01) # scaled critical values over which we check rejection rates
max.g <- length(grid.scale.cv)
results <- matrix(NA, nrow = length(K), ncol=max.g)

for (kk in 1:length(K)){
  g <- 1
  dev <- 0
  K.act <- K[kk]
  while (dev > -0.01 & g <= max.g){
    rej <- rep(NA,reps)
    for (i in 1:reps){
      k <- 1
      accept <- 1
      x <- rnorm(K.act)
      while(k <= K.act & accept==1){
        # each of our test statistics for "samples" of size n are N(0,1) under H0, so just scaling their sum by sqrt(k) gives another N(0,1) test statistic
        rej[i] <- abs(1/sqrt(k)*sum(x[1:k])) > grid.scale.cv[g] 
        accept <- accept - rej[i]
        k <- k+1
      }
    }
    rej.rate <- mean(rej)
    dev <- rej.rate-alpha
    results[kk,g] <- rej.rate
    g <- g+1
  }
}
plot(K,results[,1], type="l")
matplot(grid.scale.cv,t(results), type="l")
abline(h=0.05)

cv.a <- data.frame(K,adjusted.cv=grid.scale.cv[apply(abs(results-alpha),1,which.min)])
plot(K,cv.a$adjusted.cv, type="l")
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.