পরিসংখ্যান: আলফা এবং বিটার মধ্যে সম্পর্ক


13

আমার প্রশ্নটির সাথে আলফা এবং বিটার সম্পর্ক এবং পরিসংখ্যানগুলিতে তাদের সংজ্ঞা রয়েছে।

আলফা = টাইপ আই ত্রুটির হার = তাত্পর্যপূর্ণ স্তরের বিবেচনাধীন যে NULL অনুমানটি সঠিক

বিটা = টাইপ II ত্রুটির হার

যদি আলফা হ্রাস করা হয় (আলফা = 1- নির্দিষ্টকরণ হিসাবে নির্দিষ্টতা বৃদ্ধি পায়), বিটা বৃদ্ধি পায় (সংবেদনশীলতা / শক্তি বিটা = 1 হিসাবে হ্রাস পায় - সংবেদনশীলতা / শক্তি)

আলফায় পরিবর্তন কীভাবে বিটাকে প্রভাবিত করে? লিনিয়ার সম্পর্ক আছে নাকি? অনুপাত আলফা / বিটা সবসময় একই হয়, অন্য কথায় অনুপাতের বৈশিষ্ট্য / সংবেদনশীলতা সবসময় একই থাকে? যদি হ্যাঁ, এর অর্থ হ'ল একটি বনফেরোনি সংশোধন ব্যবহার করে আমরা কেবলমাত্র সংবেদনশীলতা এবং উচ্চতর নির্দিষ্টকরণের দিকে বদলে যাচ্ছি তবে আমরা সংবেদনশীলতা / নির্দিষ্টতা অনুপাত পরিবর্তন করছি না। এটা কি ঠিক বলা যায়?

আপডেট (কেস-নির্দিষ্ট প্রশ্ন):

প্রদত্ত পরীক্ষামূলক ডিজাইনের জন্য, আমরা ডেটাতে 5 লিনিয়ার মডেল পরিচালনা করি। আমাদের 0.8 এ একটি সত্য পজিটিভ রেট (সংবেদনশীলতা / শক্তি) এবং 0.7 এ একটি সত্য নেতিবাচক হার (স্পষ্টতা) রয়েছে। (আসুন কল্পনা করুন আমরা কী জানি ইতিবাচক হওয়া উচিত এবং কোনটি হওয়া উচিত নয়।)। আমরা যদি এখন Bonferroni ব্যবহার করে তাৎপর্য স্তরটি 0.05 / 5 = 0.01 এ সংশোধন করি। আমরা সংখ্যার ভিত্তিতে ফলাফলের সত্য ইতিবাচক হার (সংবেদনশীলতা / শক্তি) এবং সত্য নেতিবাচক হার (নির্দিষ্টতা) অনুমান করতে পারি?

আপনার সাহায্যের জন্য অসংখ্য ধন্যবাদ.

উত্তর:


16

এবং β সম্পর্কিত হয়। আমি ডায়াগনস্টিক পরীক্ষার মাধ্যমে পয়েন্টটি চিত্রিত করার চেষ্টা করব। ধরা যাক যে আপনার একটি ডায়াগনস্টিক পরীক্ষা আছে যা রক্তের চিহ্নিতকারীটির মাত্রা পরিমাপ করে। এটি জানা যায় যে একটি নির্দিষ্ট রোগে আক্রান্ত ব্যক্তিদের স্বাস্থ্যকর মানুষের তুলনায় এই চিহ্নিতকারীটির মাত্রা কম থাকে। এটি অবিলম্বে পরিষ্কার হয়ে গেছে যে আপনাকে একটি কাট অফের মান নির্ধারণ করতে হবে, যার নীচে একজন ব্যক্তিকে "অসুস্থ" হিসাবে শ্রেণিবদ্ধ করা হয়েছে যেখানে এই কাটফের উপরের মানগুলির লোকেরা স্বাস্থ্যকর বলে মনে করা হচ্ছে। এটি খুব সম্ভাব্য যে, bloodmarker বিতরণের এমনকি যথেষ্ট তারতম্য হয়মধ্যেঅসুস্থ এবং সুস্থ মানুষ। কিছু সুস্থ ব্যক্তিদের পুরোপুরি সুস্থ থাকা সত্ত্বেও রক্তের মার্কার মাত্রা খুব কম থাকে। এবং কিছু অসুস্থ ব্যক্তিদের এই রোগ থাকলেও উচ্চ মাত্রায় রক্তের মার্কার থাকে।αβ

চারটি সম্ভাব্য সংঘটিত ঘটতে পারে:

  1. একজন অসুস্থ ব্যক্তি সঠিকভাবে অসুস্থ হিসাবে চিহ্নিত (সত্য ধনাত্মক = টিপি)
  2. অসুস্থ ব্যক্তিকে মিথ্যাভাবে স্বাস্থ্যকর হিসাবে শ্রেণিবদ্ধ করা হয় (মিথ্যা নেতিবাচক = এফএন)
  3. একটি সুস্থ ব্যক্তি সঠিকভাবে স্বাস্থ্যকর হিসাবে চিহ্নিত (সত্য নেতিবাচক = টিএন)
  4. একটি স্বাস্থ্যবান ব্যক্তি মিথ্যাভাবে অসুস্থ হিসাবে শ্রেণীবদ্ধ করা হয়েছে (মিথ্যা ধনাত্মক = এফপি)

এই সম্ভাবনাগুলি 2x2 টেবিল দিয়ে চিত্রিত করা যেতে পারে :

               Sick Healthy
Test positive   TP     FP
Test negative   FN     TN

মিথ্যা ইতিবাচক হার, যা উল্লেখ করে α = এফ পি / ( এফ পি + + টি এন )β হল মিথ্যা নেতিবাচক হার, যা β = এফ এন / ( টি পি + এফ এন ) । পরিস্থিতি চিত্রক্রমে বর্ণনা করার জন্যআমি একটি সহজস্ক্রিপ্টলিখেছিলাম।αα=এফপি/(এফপি+ +টিএন)ββ=এফএন/(টিপি+ +এফএন)R

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) {

  popsick <- rnorm(n, mean=mean.sick, sd=sd.sick)
  pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy)

  if ( side == "below" ) {

    truepos <- length(popsick[popsick <= cutoff])
    falsepos <- length(pophealthy[pophealthy <= cutoff])
    trueneg <- length(pophealthy[pophealthy > cutoff])
    falseneg <- length(popsick[popsick > cutoff])

  } else if ( side == "above" ) {

    truepos <- length(popsick[popsick >= cutoff])
    falsepos <- length(pophealthy[pophealthy >= cutoff])
    trueneg <- length(pophealthy[pophealthy < cutoff])
    falseneg <- length(popsick[popsick < cutoff])

  }

  twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T)
  rownames(twotable) <- c("Test positive", "Test negative")
  colnames(twotable) <- c("Sick", "Healthy")

  spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2])
  alpha <- 1 - spec
  sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1])
  beta <- 1 - sens

  pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2])
  neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1])


  if ( do.plot == TRUE ) {

    dsick <- density(popsick)
    dhealthy <- density(pophealthy)

    par(mar=c(5.5, 4, 0.5, 0.5))
    plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE)
    box()
    axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02)
    axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02)                                        
    axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25)
    lines(dhealthy, col = "steelblue", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65")
    } else if ( side == "above" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65")
    }

    lines(dsick, col = "red", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90")
    } else if ( side == "above" ) {
      polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90")
    }

    legend("topleft",
           legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), 
                     as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n")
    abline(v=mean(popsick), lty=3)
    abline(v=mean(pophealthy), lty=3)
    abline(v=cutoff, lty=1, lwd=1.5)
    abline(h=0)

  }

  #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred)

  c(alpha, beta)

}

একটি উদাহরণ তাকান। আমরা ধরে নিয়েছি যে অসুস্থ ব্যক্তিদের মধ্যে রক্তের চিহ্নিতকারকের গড় স্তরটি 10 ​​এর একটি মানিক বিচ্যুতি সহ 100 হয়। স্বাস্থ্যকর মানুষদের মধ্যে, গড় রক্তের মাত্রা 150 এর মানক বিচ্যুতি সহ 140 হয় clin ক্লিনিকটি কাটফটকে 120 এ সেট করে।

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below")

              Sick Healthy
Test positive 9764     901
Test negative  236    9099

120 এর একটি কাট অফ সহ বিটা এবং আলফা

α=901/(901+ +9099)0.09β=236/(236+ +9764)0,024

              Sick Healthy
Test positive 6909      90
Test negative 3091    9910

কাটফফ 105

αβ

αβ

cutoffs <- seq(0, 200, by=0.1)
cutoff.grid <- expand.grid(cutoffs)

plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below")

plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2)
lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2)
legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2)

বিভিন্ন কাটফুল মান সহ আলফা এবং বিটার প্লট

αβ

পারফেক্ট কাট অফ

এখানে আমাদের অর্থে একটি "নিখুঁত" পরীক্ষা আছে যে 150 এর কাট অফ অসুস্থকে স্বাস্থ্যকর থেকে বৈষম্য করে।


বনফেরনি অ্যাডজাস্টমেন্টস

αββ0.020.31α0.090.01


@ COOLSerdash বাহ ভাল উত্তর! ধন্যবাদ. আপনার উদাহরণে উল্লেখযোগ্য স্তরের পছন্দ পরিচিত বিতরণে করা যেতে পারে। জীববিজ্ঞানের উদাহরণস্বরূপ, যদি চিকিত্সার কোনও প্রভাব থাকে তবে আপনি আপনার নির্ভরশীল ভেরিয়েবলের বন্টন জানতে পারবেন না। অন্য কথায় একটি তাত্পর্য স্তর চয়ন করে, আপনি ফলস পজিটিভ হার নির্বাচন করেন তবে ফলস নেতিবাচক হার কীভাবে সেট করা হয় আপনার প্রায় কোনও ধারণা নেই। সত্যিকারের ইতিবাচক এবং নেতিবাচক হারগুলি কীভাবে সেট করা হয় সে সম্পর্কে আপনার আসলে ধারণা নেই। এটা কি ঠিক ?
রেমি.বি

1
αα1-βαβপিα

2

ভবিষ্যতে অন্যদের জন্য:

নমুনা আকারের অনুমানে, জোটোটালটি আলফা এবং জেডকে পাওয়ার (1-বিটা) এর সাথে সংশ্লিষ্ট জেড যোগ করে গণনা করা হয়। সুতরাং গাণিতিকভাবে, যদি নমুনার আকারটি স্থির রাখা হয়, আলফার জন্য জেড বৃদ্ধি করা মানে আপনি ক্ষমতার জন্য জেডকে একই পরিমাণে হ্রাস করেন, জালফাকে ০.০৫ থেকে ০.০ থেকে বাড়িয়ে জেপাওয়ারকে 0.05 দ্বারা হ্রাস করে।

পার্থক্যটি হ'ল আলফার জন্য জেড দুই-লেজযুক্ত এবং বিটার জন্য জেড 1-লেজযুক্ত। সুতরাং, যখন জেড মান একই পরিমাণে পরিবর্তিত হয় তবে সম্ভাব্য% যা এই জেড মানটির সাথে মিলিত হয় একই পরিমাণে পরিবর্তিত হয় না।

উদাহরণ:

80% পাওয়ার (20% বিটা) সহ 5% আলফা (95% আত্মবিশ্বাস) একই নমুনার আকার দেয়

সম্পর্কের 1: 1 হলে 95% পাওয়ারের চেয়ে 93%% পাওয়ার (6.4% বিটা) সহ 20% আলফা (80% আত্মবিশ্বাস)।


1

আলফা এবং বিটার মধ্যে কোনও সাধারণ সম্পর্ক নেই।

এটি সমস্তই আপনার পরীক্ষার উপর নির্ভর করে, সাধারণ উদাহরণটি নিন:

(উইকিপিডিয়া)

চলিত ব্যবহারের ধরণে I ত্রুটিটিকে "একজন নির্দোষ ব্যক্তিকে দোষী সাব্যস্ত করা" এবং II ত্রুটি টাইপ করে "একজন দোষী ব্যক্তিকে মুক্তি দেওয়া" হিসাবে ভাবা যেতে পারে।

একটি জুরি গুরুতর হতে পারে: দ্বিতীয় ধরণের ত্রুটি নয়, কোনও ধরণের আই এ জুরিটি "ধরণের" হতে পারে: কোন ধরণের নয় তবে কিছু টাইপ II এ জুরিটি স্বাভাবিক হতে পারে: কিছু টাইপ প্রথম এবং কিছু টাইপ II এ জুরি নিখুঁত হতে পারে: কোনও ত্রুটি নেই

অনুশীলনে দুটি বিরোধী প্রভাব রয়েছে:

পরীক্ষার মান যখন উপরে যায়, তখন টাইপ করুন I এবং টাইপ করুন II ত্রুটি কিছুটা বিন্দু না হওয়া পর্যন্ত হ্রাস। যখন কোনও জুরির উন্নতি হয়, তখন সে নির্দোষ ও দোষী উভয়ই লোকের উপরে আরও ভাল রায় দিতে থাকে।

কিছু বিন্দু পরে পরীক্ষার বিল্ডিং এ অন্তর্নিহিত সমস্যা উপস্থিত হয়। যিনি পরীক্ষা চালান তার জন্য টাইপ আই বা দ্বিতীয় আরও গুরুত্বপূর্ণ। জুরি উদাহরণস্বরূপ, টাইপ আই ত্রুটিগুলি আরও গুরুত্বপূর্ণ এবং তাই আই প্রক্রিয়াকরণটি টাইপ আই এড়ানোর জন্য তৈরি করা হয় any যদি সন্দেহ থাকে তবে ব্যক্তিটি মুক্ত। স্বজ্ঞাতভাবে এই ধরণের দ্বিতীয় ত্রুটির বৃদ্ধি ঘটে।

বনফেরোনি সম্পর্কিত:

(উইকিপিডিয়া আবার)

Bonferroni সংশোধন শুধুমাত্র মিথ্যা ধনাত্মক সম্ভাবনা নিয়ন্ত্রণ করে। সংশোধন সাধারনত মিথ্যা নেতিবাচক উত্পাদন সম্ভাবনা বাড়াতে এবং ফলস্বরূপ পরিসংখ্যানিক শক্তি হ্রাস করার ব্যয়ে আসে। বিপুল সংখ্যক হাইপোথেসিস পরীক্ষা করার সময় এর ফলে বড় সমালোচনামূলক মানগুলি দেখা দিতে পারে।


আপনার উত্তরের জন্য ধন্যবাদ, এটি দরকারী তবে এখনও কিছু আমার কাছে পরিষ্কার নয়। আমি একটি নতুন প্রশ্ন যুক্ত করে আমার পোস্ট আপডেট করেছি।
রেমি.বি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.