টি-টেস্টের মৃত্যুর খবর কি খুব অতিরঞ্জিত হয়েছে?

সিভির সর্বকালের ক্লাসিকগুলি পড়ে আমি একটি বিবৃতি পেলাম যা আমি স্পষ্ট করতে চাই। এটি পোস্ট এবং আমার প্রশ্নটি সমাপ্ত মন্তব্যগুলিকে বোঝায়: "আমি মনে রাখতে হবে যে আমি সবে যে জ্ঞান দিয়েছি তা সমস্তই কিছুটা অপ্রচলিত; এখন আমাদের কম্পিউটার রয়েছে, আমরা টি-টেস্টের চেয়ে আরও ভাল করতে পারি Frank ফ্র্যাঙ্ক নোট হিসাবে আপনি আপনি যে কোনও জায়গায় টি-টেস্ট চালানো শিখিয়েছিলেন উইলকক্সন পরীক্ষা সম্ভবত ব্যবহার করতে চান ""

নমুনাটির অর্থ বিতরণ টি-টেস্ট চালানোর পক্ষে যথেষ্ট স্বাভাবিক তা অনুমান করার মতো এটি শোনার জন্য উদ্বেগের অভাব স্পষ্টতই একটি বিশাল সুবিধা advantage এবং আমি দেখতে পাচ্ছি যে কম্পিউটারগুলি একটি বাতাসে ডেটা ভেক্টরের দুইয়ের মধ্যে পার্থক্যের দীর্ঘ তালিকাগুলি র‌্যাঙ্ক করতে পারে ... আমি বহু বছর আগে এটি ম্যানুয়ালি করে মনে করেছি, তবে আমি ডিগ্রি ...

সুতরাং, হয় T -test সত্যিই অতীতের একটি জিনিস? অনুচ্ছেদ পরীক্ষা সম্পর্কে কি? তারা সাধারণত কোড কয়েক লাইন লেখার entailing অর্থে খুব বিজ্ঞাপন কি?

— আন্তনি পরল্লদা
সূত্র

একটি ক্রমশক্তি পরীক্ষা অ্যাডহক করে তোলে কি ? ফিশার টি-টেস্টগুলিকে যথাযথ হিসাবে বিবেচনা করেছিলেন যে তাদের আচরণটি পারমিটেশন টেস্টের কাছাকাছি ছিল (দুঃখিত, আমার কাছে হস্তক্ষেপের সঠিক উদ্ধৃতি নেই, যদি আমি এটি পাই তবে আমি এটি দেব), পরামর্শ দিয়েছিলেন যে তিনি দেখেছেন অনুক্রম পরীক্ষা আরও মৌলিক হিসাবে। দ্বি-লেজযুক্ত ক্রমশক্তি পরীক্ষা সম্পর্কে কি অসুবিধা তা আমিও দেখতে পাচ্ছি না। তবে সম্ভবত আমি বিভিন্ন প্রকারের উত্তরের দিকে ঝুঁকছি।

— গ্লেন_বি -রিনস্টেট মনিকা

সম্ভবত সমান-বৈকল্পিক টি-টেস্টের পক্ষে এমন কিছু হ'ল এটির পরিবর্তে একটি সাধারণ মডেলের প্যারামিটারগুলির অনুমানের সাথে সম্পর্কিত যা আপনি ভোগ করতে চাইতে পারেন।

— স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

আমি বলব না ক্লাসিক এক নমুনা (জোড়যুক্ত সহ) এবং দ্বি-নমুনার সমান বৈচিত্রের টি-টেস্টগুলি হ'ল অপ্রচলিত, তবে বিকল্পগুলির একটি আধিক্য রয়েছে যাতে দুর্দান্ত বৈশিষ্ট্য রয়েছে এবং অনেক ক্ষেত্রে সেগুলি ব্যবহার করা উচিত।

আমিও বলব না যে বড় আকারের নমুনাগুলিতে - এমনকি এমনকি পরিক্ষার পরীক্ষাগুলিতেও উইলকক্সন-মান-হুইটনি পরীক্ষা করার দক্ষতা সাম্প্রতিক, আমি ছাত্র হিসাবে ৩০ বছর আগেও নিয়মিতভাবে উভয়ই করছিলাম, এবং এর ক্ষমতা করার ক্ষমতাও ছিল যে পয়েন্টে একটি দীর্ঘ সময়ের জন্য উপলব্ধ ছিল।

$^\dagger$

সুতরাং এখানে কিছু বিকল্প রয়েছে এবং তারা কেন সহায়তা করতে পারে:

ওয়েলচ-স্যাটার্থওয়েট - যখন আপনি আত্মবিশ্বাসী নন তবে বৈকল্পিকগুলি সমানের কাছাকাছি চলে আসবে (যদি নমুনার আকারগুলি একই হয়, সমান বৈকল্পিক ধারণাটি সমালোচিত নয়)
উইলকক্সন-মান-হুইটনি - লেজগুলি স্বাভাবিকের চেয়ে স্বাভাবিক বা ভারী, বিশেষত প্রতিসাম্যের কাছাকাছি অবস্থার ক্ষেত্রে দুর্দান্ত। যদি লেজগুলি স্বাভাবিকের কাছাকাছি থাকে তবে কোনও ক্রমশক্তি পরীক্ষা করার মাধ্যমটি আরও সামান্য শক্তি সরবরাহ করবে।
রবুইস্টাইটিড টি-টেস্ট - এগুলির মধ্যে অনেকগুলি রয়েছে যেগুলি স্বাভাবিকভাবে ভাল ক্ষমতা রাখে তবে ভারী লেজযুক্ত বা কিছুটা স্কিউ বিকল্পের অধীনেও ভালভাবে কাজ করে (এবং ভাল শক্তি ধরে রাখে)।
জিএলএম - উদাহরণস্বরূপ গণনা বা ক্রমাগত ডান স্কিউ ক্ষেত্রে (যেমন গামা) দরকারী; পরিস্থিতি মোকাবিলার জন্য ডিজাইন করা হয়েছে যেখানে ভেরিয়েন্সের সাথে সম্পর্ক রয়েছে।
নির্ভরতা নির্দিষ্ট ফর্ম আছে যেখানে ক্ষেত্রে এলোমেলো প্রভাব বা সময়-সিরিজ মডেল দরকারী হতে পারে
বায়েসিয়ান পদ্ধতিগুলি , বুটস্ট্র্যাপিং এবং অন্যান্য গুরুত্বপূর্ণ কৌশলগুলির আধিক্য যা উপরোক্ত ধারণাগুলির সাথে একই রকম সুবিধা দিতে পারে। উদাহরণস্বরূপ, একটি Bayesian অভিগমন সঙ্গে এটি একটি মডেল যে একটি contaminating প্রক্রিয়া, গন্য বা স্কিউ ডেটার সাথে চুক্তির জন্য অ্যাকাউন্ট পারেন, এবং নির্ভরতা বিশেষ ফর্ম, হ্যান্ডেল করতে বেশ সম্ভব একই সময়ে সব ।

সুবিশাল বিকল্পগুলির আধিক্য উপস্থিত থাকলেও, পুরানো স্টক স্ট্যান্ডার্ড সমান ভেরিয়েন্স দ্বি-নমুনা টি-পরীক্ষা প্রায়শই বড়, সমান আকারের নমুনাগুলিতে ভাল পারফর্ম করতে পারে যতক্ষণ না লোকেরা স্বাভাবিকের থেকে খুব বেশি দূরে না থাকে (যেমন খুব ভারী লেজযুক্ত হওয়া) / স্কিউ) এবং আমাদের কাছাকাছি-স্বাধীনতা আছে।

বিকল্পগুলি বেশ কয়েকটি পরিস্থিতিতে কার্যকর যেখানে আমরা প্লেইন টি-টেস্টের সাথে আত্মবিশ্বাসী হতে পারি না ... এবং তবুও সাধারণত যখন টি-টেস্টের অনুমানগুলি পূরণ হয় বা পূরণ হওয়ার কাছাকাছি হয় তখন ভাল সম্পাদন করে।

যদি বিতরণ স্বাভাবিকের থেকে খুব বেশি দূরে না থাকে (বৃহত্তর নমুনাগুলি আরও ছাড়ার অনুমতি দেয়) তবে ওয়েলচ একটি বুদ্ধিমান ডিফল্ট।

যদিও পারমিটেশন পরীক্ষাটি দুর্দান্ত, টি-টেস্টের তুলনায় কোনও ক্ষতির ক্ষতির সাথে যখন তার অনুমানগুলি ধরে রাখে (এবং সরাসরি আগ্রহের পরিমাণ সম্পর্কে অনুমান দেওয়ার দরকারী সুবিধা), উইলকক্সন-মান-হুইটনি যুক্তিযুক্তভাবে আরও ভাল পছন্দ যদি লেজগুলি ভারী হতে পারে; সামান্য অতিরিক্ত অনুমানের সাথে ডাব্লুএমডাব্লু এমন সিদ্ধান্তে দিতে পারে যা অর্থ-শিফ্টের সাথে সম্পর্কিত। (অন্য যে কোনও কারণেই এটি ফলশ্রুতি পরীক্ষার চেয়ে বেশি পছন্দ করতে পারে)

[যদি আপনি জানেন যে আপনি বলুন গণনা, বা অপেক্ষার সময় বা অনুরূপ ধরণের ডেটা নিয়ে কাজ করছেন তবে জিএলএম রুটটি প্রায়শই বোধগম্য। নির্ভরতার সম্ভাব্য রূপগুলি সম্পর্কে আপনি যদি কিছুটা জানেন তবে তাও সহজেই পরিচালিত হয় এবং নির্ভরতার সম্ভাবনা বিবেচনা করা উচিত]]

সুতরাং যদিও টি-টেস্ট অবশ্যই অতীতের কোনও বিষয় হবে না, আপনি এটি প্রয়োগ করার সময় প্রায় ভাল বা প্রায় পাশাপাশি করতে পারেন এবং বিকল্পগুলির একটির তালিকাভুক্তি না করে যখন সম্ভাব্য পরিমাণে অর্জন করতে পারেন । যা বলতে চাই, আমি টি-টেস্টের সাথে সম্পর্কিত পোস্টে সংবেদনের সাথে বিস্তৃতভাবে একমত হই ... তথ্য সংগ্রহের আগে আপনাকে সম্ভবত আপনার অনুমানগুলি নিয়ে চিন্তা করা উচিত, এবং যদি সেগুলির সত্যই প্রত্যাশিত নাও হয় ধরে রাখতে, টি-টেস্টের সাহায্যে বিকল্পগুলি সাধারণত খুব ভালভাবে কাজ করে বলে সাধারণত অনুধাবন না করে প্রায় হারাতে প্রায় কিছুই হয় না ।

যদি কেউ ডেটা সংগ্রহের দুর্দান্ত সমস্যায় চলে যায় তবে অবশ্যই আপনার সূত্রগুলির কাছে যাওয়ার সর্বোত্তম উপায় বিবেচনা করে আন্তরিকভাবে কিছুটা সময় বিনিয়োগ না করার কোনও কারণ নেই।

নোট করুন যে আমি সাধারণত অনুমানের সুস্পষ্ট পরীক্ষার বিরুদ্ধে পরামর্শ দিই - এটি কেবল ভুল প্রশ্নের উত্তর দেয় না, তবে তা করে এবং তারপরে অনুমানের প্রত্যাখ্যান বা প্রত্যাখ্যানের উপর ভিত্তি করে একটি বিশ্লেষণ চয়ন করে পরীক্ষার উভয় পছন্দের বৈশিষ্ট্যকে প্রভাবিত করে; আপনি যদি যথাযথভাবে ধরে নিতে না পারেন (হয় প্রক্রিয়া সম্পর্কে আপনি যথেষ্ট পরিমাণে জানেন যে আপনি এটি ধরে নিতে পারেন বা পদ্ধতিটি আপনার পরিস্থিতিতে সংবেদনশীল নয় বলে) সাধারণত বলছেন আপনি পদ্ধতিটি ব্যবহার করা ভাল better এটা ধরে নেই।

$\dagger$

# set up some data
x <- c(53.4, 59.0, 40.4, 51.9, 43.8, 43.0, 57.6)
y <- c(49.1, 57.9, 74.8, 46.8, 48.8, 43.7)
xyv <- stack(list(x=x,y=y))$values
nx  <- length(x)

# do sample-x mean for all combinations for permutation test
permmean = combn(xyv,nx,mean)

# do the equivalent resampling for a randomization test
randmean <- replicate(100000,mean(sample(xyv,nx)))

# find p-value for permutation test
left  = mean(permmean<=mean(x))
# for the other tail, "at least as extreme" being as far above as the sample
# was below
right = mean(permmean>=(mean(xyv)*2-mean(x)))
pvalue_perm = left+right
"Permutation test p-value"; pvalue_perm

# this is easier: 
#      pvalue = mean(abs(permmean-mean(xyv))>=abs(mean(x)-mean(xyv))) 
# but I'd keep left and right above for adapting to other tests

# find p-value for randomization test
left  = mean(randmean<=mean(x))
right = mean(randmean>=(mean(xyv)*2-mean(x)))
pvalue_rand = left+right
"Randomization test p-value"; pvalue_rand

(ফলাফলের পি-মানগুলি যথাক্রমে 0.538 এবং 0.539; একই দুটি সাধারণ নমুনা টি-পরীক্ষার পি-মান 0.504 এবং ওয়েলচ-স্যাটারথওয়াইট টি-পরীক্ষার পি-মান 0.522 থাকে has)

নোট করুন যে গণনাগুলির কোডটি প্রতিটি ক্ষেত্রেই ক্রমশক্তি পরীক্ষার সংমিশ্রণের জন্য 1 লাইন এবং পি-মানটি 1 লাইনেও করা যেতে পারে।

এটি কোনও ক্রিয়াকলাপের সাথে খাপ খাইয়ে দেওয়া যা কোনও ক্রমশক্তি পরীক্ষা বা র্যান্ডমাইজেশন পরীক্ষা চালায় এবং টি-টেস্টের পরিবর্তে আউটপুট উত্পাদন করে তুচ্ছ বিষয় হবে।

ফলাফলগুলির প্রদর্শন এখানে রয়েছে:

# Draw a display to show distn & p-vale region for both 
opar <- par()
par(mfrow=c(2,1))
hist(permmean, n=100, xlim=c(45,58))
abline(v=mean(x), col=3)
abline(v=mean(xyv)*2-mean(x), col=3, lty=2)
abline(v=mean(xyv), col=4)
hist(randmean, n=100, xlim=c(45,58))
abline(v=mean(x), col=3)
abline(v=mean(xyv)*2-mean(x), col=3, lty=2)
abline(v=mean(xyv), col=4)

par(opar)

— গ্লেন_বি -রিনস্টেট মনিকা
সূত্র

কোডের প্রথম ব্লকের 16 লাইনে একটি ছোট টাইপ রয়েছে। আমি বিশ্বাস করি এটি পড়তে হবে: # প্যালভেলু = গড় (অ্যাবস (পার্মিয়ান-গড় (xyv))> = অ্যাবস (অর্থ (এক্স) -মান (xyv)))। এছাড়াও, ডান লেজকে কেন ডান = গড় (পারমানিয়ান> = 2 * মানে (এক্সওয়াইভ) - মানে (এক্স)) হিসাবে পরীক্ষা করা হচ্ছে?

— আন্তোনি পরেল্লদা

ভাল উত্তর (+1), তবে আমি সাধারণত এই ধারণাটির সাথে একমত নই যে অনুমিতি না করে সাধারণত হারাতে হবে খুব কম, যদি না এটি কেবল টি-টেস্টকেই বোঝায়। এটি সাধারণ বিবৃতি হওয়ার কথা কিনা তা কিছুটা অস্পষ্ট। আরও জটিল মডেলগুলির জন্য এবং সীমাবদ্ধ নমুনার আকারগুলির অনুমানগুলি প্রায়শই গুরুত্বপূর্ণ, যেমন দুর্বল তথ্যবহুল প্রিরিয়ার আকারে।

— এরিক

@ এরিক এটি সাধারণ বিবৃতি হিসাবে লক্ষ্য করা হয়নি। আমাকে পরিষ্কার করতে দিন

— Glen_b -Rininstate মনিকা

t

$t$

t

$t$

@ স্টেফান সেখানে আরও অনেক বিবেচনা রয়েছে (এবং ব্যাপকভাবে ব্যবহৃত বিকল্পগুলির কিছুটা হ্রাসিত সেট, কমপক্ষে যদি আমরা একাধিক প্রতিরোধের দিকে নজর রাখি) তবে সে ক্ষেত্রে উত্তরটি দীর্ঘতর হতে পারে এবং কিছুটা পার্থক্য রয়েছে।

— গ্লেন_বি -রিনস্টেট মনিকা