আপনার পরীক্ষার পরিসংখ্যানগুলির ক্রম বিতরণ প্রতিসম হওয়ার গ্যারান্টিযুক্ত নয়, সুতরাং আপনি সেভাবে এটি করতে পারবেন না। পরিবর্তে, আপনি উভয় লেজ যোগ করুন। আপনার দুটি স্বতন্ত্র নমুনার ক্ষেত্রে নাল অনুমানটি হ'ল দুটি অবস্থানের প্যারামিটার সমান। উভয় গ্রুপে অবিচ্ছিন্ন বিতরণ এবং সমান ছড়িয়ে থাকা ধরে নিলে আমাদের নাল অনুমানের অধীনে বিনিময়যোগ্যতা রয়েছে। পরীক্ষার পরিসংখ্যান হল নীচে দিয়ে পার্থক্য ।TE(T)=0
জন্য মান মূল নমুনা রয়েছে , এবং একাধিক বিন্যাসন তার মান । কোনও কিছুর "সংখ্যার" জন্য সংক্ষিপ্ত, উদাহরণস্বরূপ, হ'ল ক্রমান্বয়ে পরীক্ষার পরিসংখ্যানের সংখ্যা। তারপর দ্বি-পার্শ্বযুক্ত হাইপোথিসিস জন্য -value হয় , যেখানেTTempT⋆♯(⋅)♯(T⋆)ppts=pleft+pright
pleft=♯(T⋆<=min(Temp,−Temp))♯(T⋆)
pright=♯(T⋆>=max(Temp,−Temp))♯(T⋆)
(ধরে নিলাম আমাদের সম্পূর্ণ অনুদান বিতরণ আছে) have আসুন দুটি স্বতন্ত্র নমুনার ক্ষেত্রে উভয় পদ্ধতির তুলনা করা যাক যখন আমরা সঠিক (সম্পূর্ণ) ক্রমবর্ধমান বিতরণ গণনা করতে পারি।
set.seed(1234)
Nj <- c(9, 8) # group sizes
DVa <- rnorm(Nj[1], 5, 20)^2 # data group 1
DVb <- rnorm(Nj[2], 10, 20)^2 # data group 2
DVab <- c(DVa, DVb) # data from both groups
IV <- factor(rep(c("A", "B"), Nj)) # grouping factor
idx <- seq(along=DVab) # all indices
idxA <- combn(idx, Nj[1]) # all possible first groups
# function to calculate test statistic for a given permutation x
getDM <- function(x) { mean(DVab[x]) - mean(DVab[!(idx %in% x)]) }
resDM <- apply(idxA, 2, getDM) # test statistic for all permutations
diffM <- mean(DVa) - mean(DVb) # empirical stest statistic
এখন মূল্যগুলি গণনা করুন এবং আর এর প্যাকেজ বাস্তবায়নের সাথে প্রস্তাবিত সমাধানটি বৈধ করুন । যে পালন , তাই এটা গুরুত্বপূর্ণ কোন পথে আপনি ক্যালকুলেট ।pcoin
pleft≠prightpts
> (pL <- sum(resDM <= min(diffM, -diffM)) / length(resDM)) # left p-value
[1] 0.1755245
> (pR <- sum(resDM >= max(diffM, -diffM)) / length(resDM)) # right p-value
[1] 0.1585356
> 2*pL # doubling left p-value
[1] 0.351049
> 2*pR # doubling right p-value
[1] 0.3170712
> pL+pR # two-sided p-value
[1] 0.3340601
> sum(abs(resDM) >= abs(diffM)) / length(resDM) # two-sided p-value (more concise)
[1] 0.3340601
# validate with coin implementation
> library(coin) # for oneway_test()
> oneway_test(DVab ~ IV, alternative="two.sided", distribution="exact")
Exact 2-Sample Permutation Test
data: DVab by IV (A, B)
Z = 1.0551, p-value = 0.3341
alternative hypothesis: true mu is not equal to 0
পিএস মন্টে-কার্লো ক্ষেত্রে যেখানে কেবলমাত্র অনুদান বিতরণ থেকে নমুনা করি, মূল্যগুলি এটির মতো সংজ্ঞায়িত হবে:p
pleft=♯(T⋆<=min(Temp,−Temp))+1♯(T⋆)+1
pright=♯(T⋆>=max(Temp,−Temp))+1♯(T⋆)+1
pts=♯(abs(T⋆)>=abs(Temp))+1♯(T⋆)+1
স্বতঃস্ফূর্তভাবে আরও একটি চূড়ান্ত ক্রমুয়েশন কেস যুক্ত করার কারণটি হ'ল আমাদের অনুশীলনীয় নমুনাটিও গুনতে হবে। অন্যথায়, ভ্যালু ক্রম 0 হতে পারে যা অবিচ্ছিন্ন ক্ষেত্রে ঘটতে পারে না ( এখানে দেখুন , দ্রষ্টব্য: কিছু পাঠ্য এই সংশোধনের প্রস্তাব দেয়, কিছু না করে)।p