Stouffer এর জেড-স্কোর পদ্ধতি: যদি আমরা যোগফল কি পরিবর্তে ?


22

আমি একই নাল হাইপোথিসিসের সাথে স্বতন্ত্র পরিসংখ্যান পরীক্ষা করছি এবং ফলাফলগুলি এক ভ্যালুতে একত্রিত করতে চাই । দেখে মনে হচ্ছে দুটি "গৃহীত" পদ্ধতি রয়েছে: ফিশারের পদ্ধতি এবং স্টোফারের পদ্ধতিNp

আমার প্রশ্ন স্টোফারের পদ্ধতি সম্পর্কে। প্রতিটি পৃথক পরীক্ষার জন্য আমি একটি z- স্কোর পাই । একটি নাল অনুমানের অধীনে, তাদের প্রত্যেককে একটি সাধারণ সাধারণ বিতরণ দিয়ে বিতরণ করা হয়, সুতরাং যোগফল একটি ভিন্ন বিতরণ অনুসরণ করে সাথে ভিন্নতা । সুতরাং স্টোফারের পদ্ধতিটি গণনা করার পরামর্শ দেয় , যা সাধারণত ইউনিট বৈকল্পিকের সাথে বিতরণ করা উচিত এবং তারপরে এটি একটি যৌথ জেড-স্কোর হিসাবে ব্যবহার করুন।ziΣziNΣzi/N

এটি যুক্তিসঙ্গত, তবে আমি এখানে এসেছি এমন আরও একটি পদ্ধতির বিষয়টিও আমার কাছে যুক্তিযুক্ত বলে মনে হয়। যেহেতু প্রতিটি স্ট্যান্ডার্ড স্বাভাবিক বিতরণ থেকে আসে, স্কোয়ার সমষ্টি চি-স্কোয়ার বিতরণ থেকে স্বাধীনতার ডিগ্রি সহ হওয়া উচিত । সুতরাং যে কেউ গণনা করতে পারে এবং এটি ভ্যালুতে রূপান্তর করতে পারে স্বাধীনতার ডিগ্রি ( , যেখানে সিডিএফ) এর সাথে ক্রমবর্ধমান চি-স্কোয়ার্ড বিতরণ ফাংশন ব্যবহার করে ।ziS=Σzi2NSpNp=1XN(S)XN

যাইহোক, কোথাও আমি এই পদ্ধতির এমনকি উল্লিখিত খুঁজে পাই না। এটি কি কখনও ব্যবহৃত হয়? এটির কি একটি নাম আছে? স্টুফারের পদ্ধতির তুলনায় সুবিধা / অসুবিধাগুলি কী হবে? নাকি আমার যুক্তিতে কোনও ত্রুটি আছে?


স্টোফারের পদ্ধতিটি নিয়মিত শিফট সনাক্ত করতে পারে তার একটি প্রধান ত্রুটি , যা কোনও বিকল্পের ধারাবাহিকভাবে সত্য হলে সাধারণত এমন কি ঘটবে বলে প্রত্যাশা করা হত, অন্যদিকে চি-স্কোয়ার পদ্ধতিতে এর ক্ষমতা কম বলে মনে হয়। একটি দ্রুত সিমুলেশন ( , পুনরাবৃত্তি) এটিকে কেস হিসাবে দেখায়; একতরফা বিকল্প সনাক্ত করতে চি-স্কোয়ার পদ্ধতিটি গুরুতরভাবে কম শক্তিশালী। N = 100 10 4ziN=100104
whuber

2
ধন্যবাদ, হুঁশি! আপনি কি আরও আপনার সিমুলেশনটি আরও বিশদে বর্ণনা করতে পারবেন, আমি আগ্রহী। অন্যদিকে, যদি বিভিন্ন লক্ষণ রয়েছে তবে বৃহত্তর পরম মান রয়েছে তবে স্টুফারের পদ্ধতিটি সামগ্রিক দিয়ে শেষ হতে পারে , অন্যদিকে আমার পদ্ধতিটি খুব উল্লেখযোগ্য রিপোর্ট করবে z 0 পিziz0p । আমি অনুমান করি যে এটি কিছু ক্ষেত্রে এটি আরও বেশি অর্থবোধ করতে পারে (এবং আমি সন্দেহ করি যে এটি আমার ক্ষেত্রে ঘটে তবে আমি নিশ্চিত নই)।
অ্যামিবা বলেছেন মোনিকা

1
আপনি ঠিক বলেছেন, সে কারণেই আমি উত্তর হিসাবে আমার মন্তব্য পোস্ট করি নি। তবে এমন একধরণের পরিস্থিতি যেখানে একমাত্র সুযোগের কারণে বাদে বিকল্পগুলি উভয় দিকের নাল থেকে এতটা মূলত পরিবর্তিত হয়?
whuber

আমার মনে যে পরিস্থিতি মনে ছিল তা হ'ল পিয়ারসন চি-স্কোয়ার টেস্টের মতো, যেখানে একের মধ্যে আগ্রহী যে কোনও অভিজ্ঞতা অভিজ্ঞতা বিতরণ নাল থেকে আলাদা কিনা; তারপরে উভয় দিকের বিচ্যুতি তবে এটি দ্বিতীয় ধারণা দেওয়ার পরে, আমি অনুমান করি যে আপনার অন্তর্দৃষ্টি সঠিক এবং আমার ক্ষেত্রে সন্দেহজনক বিচ্যুতিগুলি সমস্ত এক দিকে। যদি আপনি উত্তর হিসাবে আপনার মন্তব্য পোস্ট করেন এবং আপনার দ্রুত সিমুলেশন সম্পর্কে কিছু বিশদ সরবরাহ করেন (চি-স্কোয়ার্ড পদ্ধতিটি কেন কম শক্তিশালী বলে প্রমাণিত হয় আমি খুব কৌতূহলী!), আমি এটি গ্রহণ করে খুশি হব।
অ্যামিবা বলেছেন মোনিকা

এন জেড স্কোরের যোগফলের এন এর বৈচিত্রের সাথে একটি বিতরণ আছে? কেন বৈকল্পিক গড়ের স্ট্যান্ডার্ড ত্রুটির বর্গ নয়? শিরোনামে উল্লিখিত এর যোগফলের এন এর বৈকল্পিকতা রয়েছে? সম্ভবত আমি কোনও স্পষ্ট কিছু মিস করছি? Z2
রাসেলপিয়েরস

উত্তর:


17

এক খুঁত যে জাম্প Stouffer এর পদ্ধতিতে নিয়মানুগ বদল আনতে সনাক্ত করা সম্ভব হয় , যা এক সাধারণত ঘটতে যখন এক বিকল্প ধারাবাহিকভাবে সত্য, যেহেতু চি-স্কোয়ারড পদ্ধতি তা করার কম ক্ষমতা আছে প্রদর্শিত হবে আশা কি। একটি দ্রুত সিমুলেশন এটি কেস হিসাবে দেখায়; একতরফা বিকল্প সনাক্ত করতে চি-স্কোয়ার পদ্ধতিটি কম শক্তিশালী। এখানে জন্য উভয় পদ্ধতি দ্বারা P-মূল্যবোধের histograms (লাল = Stouffer, নীল = চি-ছক) হয় 10 5 সঙ্গে স্বাধীন পুনরাবৃত্তিও এন = 10 এবং বিভিন্ন একতরফা আদর্শায়িত প্রভাব μ কেউ ছোটো থেকে ( μ = 0 ) মাধ্যমে 0.6 এসডি ( μ =)zi105N=10μμ=00.6 )।μ=0.6

ব্যক্তিত্ব

μ


আর কোড

এর মধ্যে তুলনার জন্য ফিশারের পদ্ধতি (মন্তব্য করা) অন্তর্ভুক্ত।

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

আবার ধন্যবাদ, এটা খুব সুন্দর। এবং যদি আপনি ফিশারের পদ্ধতিটি আপত্তিহীন করেন তবে কি হবে? আমার সন্দেহ হয় আপনি ইতিমধ্যে এটি চেষ্টা করে দেখেছেন। স্টুফার কি ধারাবাহিকভাবে জিততে পারে? (দুঃখিত নিজেকে এটা চেষ্টা আউট না করার জন্য, কিন্তু আমি আর কোন অভিজ্ঞতা আছে এবং হাতে এটি না।)
অ্যামিবা বলেছেন পুনর্বহাল মনিকা

μNN

1
এটি Rপরীক্ষা করার জন্য আপনি সহজেই সিমুলেশনটি পরিবর্তন করতে পারেন । এই পরিসংখ্যানগত কম্পিউটিং প্ল্যাটফর্মের সাথে নিজেকে পরিচয় করিয়ে দেওয়া ভাল উপায় হবে। :-)
শুক্র

2
zizi

দুর্দান্ত আলোচনা এবং কিউএ! এক দ্রুত প্রশ্ন কি এক হিসাবে এই সমস্যা ফরম যদি কোনো Outlier / ব্যতিক্রম মহলানবিশ দূরত্ব এবং ভালো কিছু ফলো গণনা করে সনাক্তকরণ এই ?
শূন্য

10

পরীক্ষার পরিসংখ্যান সম্পর্কে অন্তর্দৃষ্টি অর্জনের একটি সাধারণ উপায় হ'ল (সাধারণত অন্তর্নিহিত) অন্তর্নিহিত অনুমানগুলি নেওয়া যা সেই পরীক্ষার পরিসংখ্যানকে সবচেয়ে শক্তিশালী হতে পরিচালিত করে। এই বিশেষ মামলার জন্য একজন শিক্ষার্থী এবং আমি সম্প্রতি এটি করেছি: http://arxiv.org/abs/1111.1210v2 (একটি সংশোধিত সংস্করণটি ফলিত পরিসংখ্যানের অ্যানালসে প্রদর্শিত হবে)।

খুব সংক্ষেপে সংক্ষেপে জানাতে (এবং অন্য উত্তরের সিমুলেশন ফলাফলের সাথে সামঞ্জস্যপূর্ণ) স্টুফারের পদ্ধতিটি তখন সবচেয়ে শক্তিশালী হবে যখন "সত্য" অন্তর্নিহিত প্রভাবগুলি সমস্ত সমান হয়; অন্তর্নিহিত প্রভাবগুলি প্রায় 0 প্রায় বিতরণ করা হলে জেড 2 ^ এর যোগফল সবচেয়ে শক্তিশালী হবে This এটি একটি হালকা সরলীকরণ যা বিশদটি বাদ দেয়: আরও তথ্যের জন্য উপরে লিঙ্কিত আর্কসিভ প্রিপ্রিন্টের বিভাগ 2.5 দেখুন।


2
(+1) একরকম আমি ভেবেছিলাম আমি এটি অনেক আগে লিখেছিলাম, তবে মনে হয় আমি তা করি নি: বিশেষভাবে আমার প্রশ্নের উত্তর দেওয়ার জন্য এখানে নিবন্ধ করার জন্য অনেক ধন্যবাদ! আমি এটিকে সমর্থন করি. আপনার কাগজের 2.5 অধ্যায়টি খুব প্রাসঙ্গিক।
অ্যামিবা বলছেন মনিকা

3

কিছুটা o / t: এই উভয় পদ্ধতির একটি বিষয় হ'ল স্বাধীনতার ডিগ্রিগুলির কারণে পাওয়ার হ্রাস (স্টুফারের জন্য এন; ফিশারের জন্য 2 এন)। এর জন্য আরও উন্নততর মেটা-বিশ্লেষণাত্মক পদ্ধতির উন্নতি হয়েছে, যা আপনি বিবেচনা করতে চাইতে পারেন (উদাহরণস্বরূপ বিপরীতমুখী ওজনযুক্ত মেটা-বিশ্লেষণ)।

আপনি যদি কোনও গ্রুপের মধ্যে কিছু বিকল্প পরীক্ষার প্রমাণ খুঁজছেন তবে আপনি ডোনহো এবং জিনের উচ্চ সমালোচনা পরিসংখ্যানটি দেখতে চাইতে পারেন: https://projecteuclid.org/euclid.aos/1085408492


1

প্রশ্নের উত্তর এবং আরও পাঠকদের জন্য: এটি কি কখনও ব্যবহৃত হয়?, আরএক্সিভিতে কাজিন্স (২০০৮) এর একটি বিস্তৃত কাগজ রয়েছে , যা বিকল্প পদ্ধতির কয়েকটি তালিকাভুক্ত এবং পর্যালোচনা করেছে। প্রস্তাবিতটি উপস্থিত হবে বলে মনে হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.