টি অ-সাধারণের জন্য পরীক্ষা যখন এন> 50?


77

অনেক আগেই আমি জানতে পেরেছিলাম যে দুটি বিতরণের দুটি নমুনা টি-পরীক্ষা ব্যবহারের জন্য সাধারণ বন্টন প্রয়োজন। আজ একজন সহকর্মী আমাকে জানিয়েছিলেন যে তিনি শিখলেন যে এন> 50 এর জন্য সাধারণ বিতরণ জরুরি ছিল না। এটা কি সত্যি?

যদি সত্য হয় তবে কেন্দ্রীয় সীমাবদ্ধতার কারণে?


উত্তর:


82

একটি টি-পরীক্ষার সাধারণ অনুমান

একটি বিশাল জনসংখ্যার কথা বিবেচনা করুন যা থেকে আপনি কোনও নির্দিষ্ট আকারের বিভিন্ন নমুনা নিতে পারেন। (একটি নির্দিষ্ট গবেষণায়, আপনি সাধারণত এই নমুনাগুলির মধ্যে একটি সংগ্রহ করেন))

টি-পরীক্ষা ধরে নেয় যে বিভিন্ন নমুনার মাধ্যমগুলি সাধারণত বিতরণ করা হয়; এটি ধরে নেওয়া যায় না যে জনসংখ্যার সাধারণত বিতরণ করা হয়।

কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য অনুসারে, সীমাবদ্ধ বৈচিত্র সহ জনসংখ্যার নমুনার মাধ্যম জনসংখ্যার বন্টন নির্বিশেষে একটি সাধারণ বিতরণে পৌঁছায়। থাম্বের বিধিগুলি বলে যে নমুনার অর্থটি মূলত যতক্ষণ না নমুনার আকার কমপক্ষে 20 বা 30 হয় ততক্ষণ বিতরণ করা হয় smaller ছোট আকারের নমুনায় বৈধ হওয়ার জন্য টি-টেস্টের জন্য, জনসংখ্যা বিতরণ প্রায় স্বাভাবিক হতে হবে।

অ-সাধারণ বিতরণ থেকে প্রাপ্ত ছোট নমুনাগুলির জন্য টি-পরীক্ষাটি অবৈধ, তবে এটি সাধারণ-সাধারণ বিতরণ থেকে প্রাপ্ত বড় নমুনাগুলির জন্য বৈধ।

অ-স্বাভাবিক বিতরণ থেকে ছোট নমুনা

মাইকেল নীচের নোট হিসাবে নোট করেছেন, আনুমানিক স্বাভাবিকতা জন্য উপায় বিতরণের জন্য প্রয়োজনীয় নমুনা আকার জনসংখ্যার অ-স্বাভাবিকতার ডিগ্রির উপর নির্ভর করে। আনুমানিক সাধারণ বিতরণের জন্য, আপনাকে খুব সাধারণ-সাধারণ বিতরণের মতো বৃহত নমুনার প্রয়োজন হবে না।

এটির জন্য অনুভূতি পেতে আপনি কিছু চালনা করতে পারেন এমন সিমুলেশন। প্রথমত, এখানে বেশ কয়েকটি জনসংখ্যা বিতরণ রয়েছে।

curve(dnorm,xlim=c(-4,4)) #Normal
curve(dchisq(x,df=1),xlim=c(0,30)) #Chi-square with 1 degree of freedom

এর পরে জনসংখ্যা বিতরণ থেকে নমুনার কিছু সিমুলেশন রয়েছে। এই লাইনের প্রত্যেকটিতে, "10" নমুনার আকার, "100" হ'ল নমুনার সংখ্যা এবং তার পরে ক্রিয়া জনসংখ্যা বন্টন নির্দিষ্ট করে। তারা নমুনা অর্থের হিস্টোগ্রাম উত্পাদন করে।

hist(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
hist(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')

টি-পরীক্ষাটি বৈধ হওয়ার জন্য, এই হিস্টোগ্রামগুলি স্বাভাবিক হওয়া উচিত।

require(car)
qqp(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
qqp(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')

একটি টি-পরীক্ষার উপযোগিতা

আমার মনে রাখতে হবে যে আমি সবেমাত্র জ্ঞান দিয়েছি সেগুলির সমস্ত কিছু কিছুটা অপ্রচলিত; এখন আমাদের কম্পিউটার রয়েছে, আমরা টি-টেস্টের চেয়ে আরও ভাল করতে পারি। ফ্র্যাঙ্ক নোট হিসাবে, আপনি সম্ভবত উইলকক্সন পরীক্ষা যে কোনও জায়গায় টি-টেস্ট চালানোর জন্য শেখানো হয়েছিল ব্যবহার করতে চান ।


7
ভাল ব্যাখ্যা (+1)। তবে আমি যুক্ত করব যে, জনসংখ্যার স্বাভাবিকতা অস্বাভাবিকতার ডিগ্রিতে আনুমানিক স্বাভাবিকতা ডিপেন্ড করার জন্য অর্থ বিতরণের জন্য প্রয়োজনীয় নমুনা আকারটি। বড় নমুনাগুলির জন্য কোনও বিভাজন সম্পর্কে কোনও অনুমান করে না এমন ক্রমান্বয়ে পরীক্ষার চেয়ে টি-টেস্ট পছন্দ করার কোনও কারণ নেই।
মাইকেল লিউ

2
+1 যদিও, যতদূর আমি জানি, টি-পরীক্ষা স্বাভাবিকতা থেকে মাঝারি বিচ্যুতিগুলির পক্ষে মোটামুটি সহনীয়। এছাড়াও, একটি আকর্ষণীয় সম্পর্কিত আলোচনা: stats.stackexchange.com/questions/2492/…
নিকো

4
ভাল উত্তর, যদিও এর মধ্যে একটি ছোট্ট বিশদ রয়েছে যা আপনি মিস করেছেন: ডেটা বিতরণের অবশ্যই সীমাবদ্ধ বৈকল্পিক থাকতে হবে। দুটি পরীক্ষার (বা 2 ডিগ্রি সহ স্বাধীনতা প্রাপ্ত শিক্ষার্থীর) অবস্থানের পার্থক্যের তুলনা করার জন্য টি-পরীক্ষা আশাবাদী নয়, কারণ এটি "অ-দৃust়" নয়, কারণ এই বিতরণগুলির জন্য স্যাম্পলটিতে অতিরিক্ত বাহ্যিক তথ্যের বাইরেও রয়েছে এবং স্ট্যান্ডার্ড বিচ্যুতিগুলি যা টি-টেস্টটি ফেলে দেয়।
সম্ভাব্যতা ব্লগ

2
এগুলি ছাড়াও, টি-টেস্ট প্যারামিটারটি তদন্ত করার জন্য স্বাভাবিকভাবেই আত্মবিশ্বাসের অন্তর দেয়। (এখনও দুটি প্রথম অনুচ্ছেদের কারণে উত্সাহিত হয়েছে যা প্রশ্নটি সরাসরি সমাধান করে, আমি কেবল তৃতীয়টির সাথে দৃ strongly়ভাবে একমত নই)
এরিক

6
t- পরীক্ষা জনসংখ্যার স্বাভাবিকতা প্রয়োজন। টি স্ট্যাটিস্টিকদের টি-শিক্ষার্থী বিতরণ করার জন্য এটি অনুমানের প্রয়োজন। যদি আপনার একটি সাধারণ জনসংখ্যা না থাকে, আপনি টি স্ট্যাটিস্টিককে একটি স্ট্যান্ডার্ড নরমাল ভেরিয়েবল হিসাবে প্রকাশ করতে পারবেন না যা তার স্বাধীনতার ডিগ্রি দ্বারা বিভক্ত চি-স্কোয়ার ভেরিয়েবলের মূল দ্বারা বিভক্ত হয়। হতে পারে আপনি যা বলার চেষ্টা করছেন তা হ'ল যদি কিছু শর্তগুলি সত্য হয়, যেমন খুব বেশি স্কিউনেস বা বড় নমুনা না হয় তবে জনসংখ্যার স্বাভাবিক না হলেও পরীক্ষার পরেও বৈধতা পাওয়া যায়।
টোনলয়

44

কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য এই প্রসঙ্গে যেমন ভাবেন তার চেয়ে কম দরকারী। প্রথমত, কেউ ইতিমধ্যে চিহ্নিত হিসাবে, কেউ জানেন না যে বর্তমান নমুনার আকার "যথেষ্ট বড়" কিনা। দ্বিতীয়ত, সিএলটি হ'ল দ্বিতীয় ধরণের ত্রুটির চেয়ে পছন্দসই ধরণের আই ত্রুটিটি অর্জন করা আরও বেশি। অন্য কথায়, টি-টেস্টটি অপ্রতিরোধ্য শক্তি ভিত্তিক হতে পারে। উইলকক্সন পরীক্ষাটি এত জনপ্রিয় popular যদি স্বাভাবিকতা ধরে থাকে তবে এটি টি-টেস্টের মতো 95% দক্ষ। যদি স্বাভাবিকতা না ধরে থাকে তবে এটি টি-টেস্টের চেয়ে নির্বিচারে আরও দক্ষ হতে পারে।


7
(+1) সাইটে আপনাকে স্বাগতম, যা খুশি হয়ে আপনি পেয়েছেন। আমি এখানে আপনার অংশগ্রহণের জন্য উন্মুখ।
কার্ডিনাল

4
(+1) উইলকক্সন সম্পর্কে ভাল বিষয়।
হোয়বার

18

টি-পরীক্ষার দৃust়তা সম্পর্কে একটি প্রশ্নের আমার আগের উত্তরটি দেখুন ।

বিশেষত, আমি অনলিনেস্ট্যাটসবুক অ্যাপলেট দিয়ে ঘুরে দেখার পরামর্শ দিচ্ছি

নীচের চিত্রটি নিম্নলিখিত দৃশ্যের উপর ভিত্তি করে:

  • নাল অনুমান সত্য
  • মোটামুটি গুরুতর সঙ্কোচ
  • উভয় গ্রুপে একই বিতরণ
  • উভয় গ্রুপে একই বৈকল্পিকতা
  • গ্রুপ 5 প্রতি নমুনার আকার (যেমন, আপনার প্রশ্ন অনুসারে 50 এরও কম)
  • দশ মিলিয়নের বেশি সিমুলেশন পেতে আমি ১০০ বার সিমুলেশন বোতাম টিপলাম।

প্রাপ্ত সিমুলেশনটি পরামর্শ দেয় যে 5% টাইপ আই ত্রুটিগুলি না পেয়ে আমি কেবল 4.5% টাইপ আই ত্রুটি পেয়েছি।

আপনি এই শক্তিশালী বিবেচনা করুন কিনা তা আপনার দৃষ্টিভঙ্গির উপর নির্ভর করে।

এখানে চিত্র বর্ণনা লিখুন


4
+1 ভাল পয়েন্ট। ক্ষমতা স্কিউ বিকল্পসহ t-test এর, যদিও, গুরুতরভাবে (পয়েন্ট এটা যেখানে প্রয়োজনীয়ভাবে বিশাল প্রভাব মাপ জন্য এমনকি শূন্য) জমিতে পারবেন না।
হোবার

6

মাত্র এক-নমুনা t-test এর সঙ্গে আমার অভিজ্ঞতা, আমি দেখা গিয়েছে যে স্কিউ ডিস্ট্রিবিউশন ক্রুটোসিস চেয়ে আরো গুরুত্বপূর্ণ বলে। নন-স্কিউড তবে ফ্যাট-লেজযুক্ত বিতরণের জন্য (5 ডিগ্রি স্বাধীনতার সাথে, ইত্যাদির সাথে একটি টুকি এইচ-ডিস্ট্রিবিউশন সহ ) আমি খুঁজে পেয়েছি যে 40 টি নমুনা বরাবরই নামমাত্রের নিকটবর্তী এক অভিজ্ঞতা অভিজ্ঞতা অর্জনের জন্য যথেষ্ট ছিল । বিতরণটি যখন খুব স্কিউড হয় তবে আপনার আরও অনেকগুলি নমুনার প্রয়োজন হতে পারে।h=0.24999

উদাহরণস্বরূপ, ধরুন আপনি লটারি খেলছিলেন। সম্ভাব্যতা With সহ আপনি 100,000 ডলার জিতবেন, এবং সম্ভাব্যতার সাথে আপনি এক ডলার হারাবেন। আপনি যদি এই প্রক্রিয়াটির এক হাজার অঙ্কের নমুনার ভিত্তিতে গড় রিটার্নটি শূন্যের জন্য নালার জন্য একটি টি-টেস্ট করেন তবে আমি মনে করি না যে আপনি নামমাত্র টাইপ আই রেট অর্জন করতে চলেছেন।p=1041p

সম্পাদনা : দুহ, মন্তব্যে @ whuber এর ক্যাচ, আমি যে উদাহরণটি দিয়েছি তার অর্থ শূন্য নয়, সুতরাং গড় শূন্যের জন্য পরীক্ষার সাথে আই রেট টাইপের কোনও সম্পর্ক নেই।

কারণ লটারির উদাহরণটিতে প্রায়শই শূন্যের একটি নমুনা স্ট্যান্ডার্ড বিচ্যুতি থাকে, টি-টেস্ট চোক করে। সুতরাং পরিবর্তে, আমি গের্গের ল্যামবার্ট ডাব্লু এক্স গাউসিয়ান বিতরণ ব্যবহার করে একটি কোড উদাহরণ দিই । আমি এখানে বিতরণটি ব্যবহার করি প্রায় 1355 এর স্কিউ থাকে।

#hey look! I'm learning R!
library(LambertW)

Gauss_input = create_LambertW_input("normal", beta=c(0,1))
params = list(delta = c(0), gamma = c(2), alpha = 1)
LW.Gauss = create_LambertW_output(input = Gauss_input, theta = params)
#get the moments of this distribution
moms <- mLambertW(beta=c(0,1),distname=c("normal"),delta = 0,gamma = 2, alpha = 1)

test_ttest <- function(sampsize) {
    samp <- LW.Gauss$rY(params)(n=sampsize)
    tval <- t.test(samp, mu = moms$mean)
    return(tval$p.value)
}

#to replicate randomness
set.seed(1)

pvals <- replicate(1024,test_ttest(50))
#how many rejects at the 0.05 level?
print(sum(pvals < 0.05) / length(pvals))

pvals <- replicate(1024,test_ttest(250))
#how many rejects at the 0.05 level?
print(sum(pvals < 0.05) / length(pvals))

p    vals <- replicate(1024,test_ttest(1000))
#how many rejects at the 0.05 level?
print(sum(pvals < 0.05) / length(pvals))

pvals <- replicate(1024,test_ttest(2000))
#how many rejects at the 0.05 level?
print(sum(pvals < 0.05) / length(pvals))

এই কোডটি বিভিন্ন নমুনা আকারের জন্য নামমাত্র 0.05 স্তরে অভিজ্ঞতাजनিত প্রত্যাখ্যান হার দেয়। 50 মাপের নমুনার জন্য, পরীক্ষামূলক হার 0.40 (!); নমুনা আকার 250, 0.29 জন্য; নমুনা আকার 1000, 0.21 জন্য; নমুনা আকার 2000, 0.18 এর জন্য। স্পষ্টতই এক-নমুনা টি-পরীক্ষা স্কুতে ভুগছে।


উদাহরণে আপনি পরীক্ষার শক্তি নিয়ে আলোচনা করছেন, এর আকার নয় not নাল, যাইহোক, হিসাবে উপস্থিত হয় , যার জন্য বিতরণটি হ্রাস করা হয় (একক বিন্দুতে একটি পরমাণু): এটি স্বাভাবিকতা থেকে প্রায় যতটা দূরে হতে পারে! p=0
whuber

1

কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রতিষ্ঠিত করে (প্রয়োজনীয় অবস্থার অধীনে) যে টি-স্ট্যাটিস্টিকের সংখ্যক অ্যাসিপোটোটিকভাবে স্বাভাবিক is টি-স্ট্যাটিস্টিকের একটি ডিনোমিনেটরও রয়েছে। একটি টি-বিতরণ করার জন্য আপনার ডিনোমিনেটরটি তার ডিএফ-এর-এ-চি-স্কোয়ার-এর-বর্গমূলের হওয়া দরকার।

এবং আমরা জানি যে এটি স্বাধীন হবে না (এটি স্বাভাবিকের বৈশিষ্ট্যযুক্ত!)

স্লুটস্কির উপপাদ্যটি সিএলটি-র সাথে মিলিত হয়ে আপনাকে দিবে যে টি-স্ট্যাটিস্টিক অ্যাসেম্পোটোটিক্যালি স্বাভাবিক (তবে অগত্যা খুব কার্যকর হারে নয়)।

কোন উপপাদ্যটি প্রতিষ্ঠিত করবে যে টি-স্ট্যাটিস্টিক অ-স্বাভাবিকতা রয়েছে তখন প্রায় টি-বিতরণ হয় এবং এটি কতটা দ্রুত আসে? (অবশ্যই, অবশেষে টি-টিও স্বাভাবিকের খুব কাছাকাছি চলে যাবে, তবে আমরা ধরে নিচ্ছি যে আরও সাধারণের সান্নিধ্য ব্যবহারের চেয়ে আরও প্রায় অনুমানের সমীকরণ আরও ভাল হবে ...)


যাইহোক, এর অতিরঞ্জিত লেভেল বলিষ্ঠতার চেয়ে আরো গুরুত্বপূর্ণ (বৃহত্তর নমুনা মাপ এ) তার উপর প্রভাব শক্তি । নোট করুন যে উইলকক্সন-মান-হুইটনি সম্পর্কিত উদাহরণস্বরূপ টি-টেস্টের অ্যাসিম্পটোটিক আপেক্ষিক দক্ষতা (উদাহরণস্বরূপ) 0 হতে পারে (উদাহরণস্বরূপ স্যাম্পেল আকারগুলি বড় আকারের হয়ে যায় যখন আপনি আকার আকারগুলি সঙ্কুচিত করতে চান, আপনার জন্য আরও বৃহত্তর নমুনার প্রয়োজন হতে পারে টি একটি সুস্পষ্ট বিকল্প হিসাবে একই ক্ষমতা আছে)।t

তাই, যদিও টি-টেস্টটি অনেক ক্ষেত্রে একটি দুর্দান্ত স্বাভাবিক দেখায় নাল বিতরণ শেষ হতে পারে, যদি যথেষ্ট পরিমাণে বড় হয় তবে নলের অধীনে এর কার্য সম্পাদন আসলে লোকেরা সবচেয়ে বেশি যত্ন নেয় না - এটি বিকল্পের অধীনে পারফরম্যান্স - এবং সেখানে এটি এত দুর্দান্ত নাও হতে পারে, যদি আপনি সেই ক্ষেত্রে প্রভাবটি বাছাই করা এত সহজ নয় যে ক্ষেত্রে নালটিকে প্রত্যাখ্যান করার বিষয়ে চিন্তা করেন।n


3
যদিও আমরা জানি না যে নমুনাটির অর্থ এবং তারতম্যটি স্বাধীন কিনা, আমরা সর্বদা জানি যে সেগুলি নিবিযুক্ত । এর কারণ, নমুনা of এর ফাংশন, এবং নমুনা বৈকল্পিক পার্থক্যের একটি ক্রিয়া (এগুলিকে "ইউ পরিসংখ্যান" বলা হয়) এবং আমাদের কাছে যতক্ষণ না বিতরণ "সমজাতীয়" , যা সমস্যা বিবরণের অংশ । xi+xjxixjv a r ( x i ) = v a r ( x j )cov(xi+xj,xixj)=var(xi)var(xj)+cov(xi,xj)cov(xj,xi)=0var(xi)=var(xj)
সম্ভাব্যতাব্লোগিক

1
দুর্ভাগ্যক্রমে, অসংরক্ষিত এবং স্বতন্ত্রের মধ্যে পার্থক্যটি প্রাসঙ্গিক যদি আমরা কোনও টি-বিতরণ শেষ করি।
গ্লেন_বি

0

হ্যাঁ, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য আমাদের এটি সত্য। এতক্ষণ আপনি অত্যন্ত ভারী-লেজযুক্ত বৈশিষ্ট্যগুলি এড়িয়ে চলুন, অ-সাধারণতা মাঝারি থেকে বড় নমুনায় কোনও সমস্যা উপস্থাপন করে না।

এখানে একটি সহায়ক পর্যালোচনা কাগজ;

http://www.annualreviews.org/doi/pdf/10.1146/annurev.publhealth.23.100901.140546

উইলকক্সন পরীক্ষায় (অন্যদের দ্বারা উল্লিখিত) ভয়াবহ শক্তি থাকতে পারে যখন বিকল্পটি মূল বিতরণের স্থান পরিবর্তন নয়। তদ্ব্যতীত, এটি বিতরণের মধ্যে পার্থক্যকে যেভাবে পরিমাপ করে তা ক্ষণস্থায়ী নয়।


উইলকক্সন সম্পর্কে আকর্ষণীয় বিষয়গুলি। যাইহোক, টি-টেস্টের অনুরূপ অসুবিধাগুলি রয়েছে: বিশেষত শিফ্টগুলি সনাক্তকরণে এটি খারাপ var ট্রানজিটিভিটি সম্পর্কে বিটটি বর্তমান প্রসঙ্গে মূলত কৌতূহল বলে মনে হয়; এটি মূল অনুমানের পরীক্ষা বা এর ব্যাখ্যার সাথে কীভাবে প্রাসঙ্গিক তা দেখতে অসুবিধা। (কিন্তু হয়তো intransitivity একটি ANOVA বা একাধিক তুলনা সেটিং গুরুত্বপূর্ণ হয়ে পারে।)
whuber

অসম বৈকল্পিক টি-টেস্ট (যা কিছু সফ্টওয়্যারেই ডিফল্ট) হেটেরোস্কেস্টাস্টিটির সমস্যা নেই।
গেস্ট

সংক্রমণ সম্পর্কে; নমুনার প্রতিবেদন করার অর্থ, বা অর্থের মধ্যে পার্থক্য (যা টি-টেস্ট পদ্ধতির ব্যবহারে প্রাকৃতিক) অন্য জনগোষ্ঠী থেকে নমুনা দেওয়ার সময় পাঠককে তারা বিবেচনা করতে পারে। উইলকক্সন পরীক্ষার অ-ট্রান্সজিটিভিটির অর্থ এই পদ্ধতির এমন কোনও এনালগ নেই; তথ্য র‌্যাঙ্ক ব্যবহার খুব সীমিত পদ্ধতির।
গেস্ট

1
(1) স্যাটার্থওয়েট-ওয়েলচ (অসম বৈকল্পিক) পরীক্ষা আমার উল্লেখ করা পাওয়ার ক্ষয়টি কাটিয়ে উঠেনি (যদিও এটি কিছুটা সাহায্য করতে পারে)। (২) আমি মনে করি আপনি "সীমিত" হিসাবে র‌্যাঙ্কগুলি ব্যবহার করে চরিত্রায়ন করতে চরম হন। তার জবাবে, @ ফ্র্যাঙ্ক হ্যারেল অধ্যয়নগুলির উল্লেখ করছেন যা দেখায় যে উইলকক্সন পরীক্ষাটি অনেকগুলি সেটিংসে উচ্চ দক্ষতা বজায় রাখে: এটি প্রমাণ করে যে টি পরীক্ষার তুলনায় কীভাবে র‌্যাঙ্কগুলি ব্যবহার করা কার্যকর এবং আরও নমনীয়, উভয়ই সীমিত নয়।
হোয়বার

(1) না, তবে এটি মাঝারি থেকে বড় নমুনায় সঠিক টাইপ আই ত্রুটির হার দেয় (২) ধন্যবাদ, তবে আমি শ্রদ্ধার সাথে একমত নই। উইলকক্সনের উপর টি-টেস্ট ব্যবহার করা টেস্টিং এবং আত্মবিশ্বাসের ব্যবধানগুলির মধ্যে ব্যবধানটি পূরণ করা অনেক সহজ করে তোলে। যদি কেউ কেবল টেস্টিং করতে চায় এবং একটি গবেষণায় কখনই দুটি গ্রুপের বাইরে না দেখায়, অবশ্যই উইলকক্সনের এমন পরিস্থিতি রয়েছে যেখানে এটি ভালভাবে কাজ করে। তবে প্রায়শই আমরা কেবল টেস্টিং করতে চাই না, এবং অন্যান্য পরিস্থিতিতে ফলাফল সাধারণীকরণে ব্যবহারকারীদের সহায়তা করতে চাই; উইলকক্সন পরীক্ষা তখন সহায়ক নয়।
অতিথি

0

বিকল্প হিসাবে উইলকক্সন-মান-হুইটনি পরীক্ষার ব্যবহার সম্পর্কে আমি কাগজটির সুপারিশ করছি উইলকক্সন-ম্যান-হুইটনি পরীক্ষা যাচাইয়ের অধীনে

মাধ্যম বা চিকিত্সকদের পরীক্ষা হিসাবে, উইলকক্সন – মান – হুইটনি (ডাব্লুএমডাব্লু) পরীক্ষাটি খাঁটি শিফ্ট মডেল থেকে বিচ্যুত হওয়ার জন্য মারাত্মকভাবে অবিরাম হতে পারে।

এগুলি কাগজের লেখকদের সুপারিশ:

র‌্যাঙ্কের রূপান্তরকরণের অর্থ, আদর্শ বিচ্যুতি এবং দুটি নমুনার স্কিঙ্কিগুলি আলাদাভাবে পরিবর্তন করতে পারে। একমাত্র পরিস্থিতি যেখানে র‌্যাঙ্কের রূপান্তরটি কোনও উপকারী প্রভাব অর্জনের নিশ্চয়তা দেয় যখন বিতরণগুলি অভিন্ন হয় এবং নমুনা আকারগুলি সমান হয়। এগুলি বরং কঠোর অনুমানগুলি থেকে বিচ্যুত হওয়ার জন্য, নমুনা মুহুর্তগুলিতে র‌্যাঙ্ক রূপান্তরের প্রভাবগুলি অনাকাঙ্ক্ষিত। কাগজের সিমুলেশন অধ্যয়নে ডাব্লুএমডাব্লু পরীক্ষার তুলনা করা হয়েছিল ফ্লাইনার – পুলিশলো পরীক্ষা (এফপি), ব্রুনার-মুঞ্জেল পরীক্ষা (বিএম), দ্বি-নমুনা টি পরীক্ষা (টি), ওয়েলচ ইউ পরীক্ষা (ইউ), এবং ওয়েলচ ইউ টেস্ট র‌্যাঙ্কে (আরইউ)। চারটি র‌্যাঙ্ক-ভিত্তিক পরীক্ষা (ডাব্লুএমডাব্লু, এফপি, বিএম এবং আরইউ) একইভাবে সম্পাদন করেছিল, যদিও বিএম পরীক্ষা অন্যদের তুলনায় ঘন ঘন একটু ভাল ছিল। যখন নমুনার আকারগুলি সমান ছিল, প্যারামেট্রিক টেস্ট (টি এবং ইউ) সমান মাধ্যমের নাল অনুমানের অধীনে র‌্যাঙ্ক ভিত্তিক পরীক্ষাগুলির চেয়ে উন্নত ছিল, তবে সমান মধ্যমদের নাল অনুমানের অধীনে নয়। যখন নমুনার আকারগুলি অসম ছিল, তখন বিএম, আরইউ এবং ইউ পরীক্ষাগুলি সর্বোত্তমভাবে সম্পাদিত হয়েছিল। বেশ কয়েকটি সেটিংসের জন্য, জনসংখ্যার বৈশিষ্ট্যগুলিতে ছোট পরিবর্তন পরীক্ষার কার্য সম্পাদনে বড় ধরনের পরিবর্তন ঘটায়। সংক্ষেপে, বড় নমুনা আনুমানিক ডাব্লুএমডাব্লু পরীক্ষা দুটি জনসংখ্যার মাধ্যম বা মধ্যমাধ্যমের তুলনা করার জন্য একটি দুর্বল পদ্ধতি হতে পারে, যদি না দুটি বিতরণে সমান আকার এবং সমান স্কেল থাকে। এই সমস্যাটি বিভিন্ন ডিগ্রিতে সঠিক ডাব্লুএমডাব্লু পরীক্ষা, এফপি পরীক্ষা, বিএম পরীক্ষা এবং পদমর্যাদার ওয়েলক ইউ পরীক্ষার ক্ষেত্রেও প্রযোজ্য বলে মনে হয়। ডাব্লুএমডাব্লু পরীক্ষাটি ব্যবহার করার সময়, লেখকরা সুপারিশ করেন যে স্থান নির্ধারণের নমুনাগুলির বৈশিষ্ট্যগুলি স্কিউনেস এবং বৈকল্পিকতার ভিন্নতার লক্ষণগুলির জন্য পুঙ্খানুপুঙ্খভাবে তদন্ত করা উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.