আপনার কাছে খুব সীমিত তথ্য অবশ্যই একটি গুরুতর বাধা! তবে বিষয়গুলি সম্পূর্ণ হতাশ নয়।
একই অনুমানের অধীনে যে একই নামের ধার্মিকতা-ফিট-পরীক্ষার পরীক্ষার পরিসংখ্যানের জন্য অ্যাসিম্পটোটিক বিতরণের দিকে পরিচালিত করে, বিকল্প অনুমানের অধীনে পরীক্ষার পরিসংখ্যানগুলি অ্যাসিপটোটিক্যালি একটি কেন্দ্রহীন ral বিতরণ করেছে। যদি আমরা ধরে নিই যে দুটি উদ্দীপকটি ক) তাৎপর্যপূর্ণ, এবং খ) একই প্রভাব রয়েছে, সম্পর্কিত পরীক্ষার পরিসংখ্যানগুলিতে একই অ্যাসিপটোটিক ননসেন্ট্রাল বিতরণ থাকবে। আমরা এটি একটি পরীক্ষা তৈরির জন্য ব্যবহার করতে পারি - মূলত, কেন্দ্রহীনতা পরামিতি ল্যাম্বদা অনুমান করে এবং পরীক্ষার পরিসংখ্যানগুলি কেন্দ্রীভূত বিতরণের লেজগুলিতে বেশি কিনা তা দেখে । (এটি বলার অপেক্ষা রাখে না যে এই পরীক্ষার অনেক বেশি শক্তি থাকবে))χ 2 χ 2 λ χ 2 ( 18 , λ )χ2χ2χ2λχ2(18,λ^)
দুটি পরীক্ষার পরিসংখ্যানকে প্রদত্ত ননকেন্দ্রিকতার পরামিতিগুলির গড় গড় এবং স্বাধীনতার ডিগ্রিগুলি (মুহুর্তের অনুমানের একটি পদ্ধতি) বিয়োগ করে, 44 এর অনুমান বা সর্বোচ্চ সম্ভাবনার দ্বারা আমরা অনুমান করতে পারি:
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
আমাদের দুটি অনুমানের মধ্যে ভাল চুক্তি, দুটি ডেটা পয়েন্ট এবং স্বাধীনতার 18 ডিগ্রি দেওয়া আসলে অবাক হওয়ার মতো নয় not এখন একটি পি-মান গণনা করতে:
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
সুতরাং আমাদের পি-মানটি 0.12, নাল অনুমানটিকে বাতিল করতে যথেষ্ট নয় যে দুটি উদ্দীপনা একই are
এই পরীক্ষায় আসলে (মোটামুটিভাবে) 5% প্রত্যাখার হার থাকে যখন ননেন্দ্রিয়তার প্যারামিটারগুলি একই থাকে? এর কোন শক্তি আছে? আমরা নীচের হিসাবে একটি পাওয়ার বক্ররেখা তৈরি করে এই প্রশ্নের উত্তর দেওয়ার চেষ্টা করব। প্রথমত, আমরা 43.68 এর আনুমানিক মান হিসাবে গড় স্থির করি । দুই পরীক্ষা পরিসংখ্যান বিকল্প ডিস্ট্রিবিউশন noncentral হতে হবে স্বাধীনতা এবং noncentrality পরামিতি 18 ডিগ্রী সঙ্গে জন্য । আমরা প্রতি- জন্য এই দুটি বিতরণ থেকে 10000 অঙ্কের অনুকরণ করব এবং দেখব যে 90% এবং 95% আস্থার স্তরে আমাদের পরীক্ষা কতবার প্রত্যাখ্যান করে।χ 2 ( λ - δ , λ + + δ ) δ = 1 , 2 , ... , 15 δλχ2(λ−δ,λ+δ)δ=1,2,…,15δ
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
যা নিম্নলিখিত দেয়:
সত্য নাল হাইপোথিসিস পয়েন্টগুলি (এক্স-অক্ষের মান = 0) এর দিকে তাকালে আমরা দেখতে পাই যে পরীক্ষাটি রক্ষণশীল, যাতে এটি স্তর হিসাবে যতবার প্রত্যাখাত হয় তেমন প্রত্যাখাত হয় না, তবে অত্যধিকভাবে তাই হয় না। যেমনটি আমরা প্রত্যাশা করেছি, এর তেমন শক্তি নেই, তবে এটি কোনও কিছুর চেয়ে ভাল। আপনার কাছে খুব সীমিত পরিমাণে তথ্য উপলব্ধ থাকলে সেখানে আরও ভাল পরীক্ষা-নিরীক্ষা করা হচ্ছে কিনা তা আমি অবাক করি।