নমুনাগুলি বিতরণ যখন স্বাভাবিক হয় না তখন স্বাধীন নমুনাগুলির টি-পরীক্ষা কতটা শক্ত?


24

আমি পড়েছি যে T -test হল "যুক্তিসঙ্গতভাবে শক্তসমর্থ" যখন নমুনার ডিস্ট্রিবিউশন স্বাভাবিক থেকে প্রস্থান। অবশ্যই, এটি গুরুত্বপূর্ণ যে পার্থক্যগুলির নমুনা বিতরণ। আমার কাছে দুটি গ্রুপের ডেটা রয়েছে। গ্রুপগুলির মধ্যে একটি নির্ভরশীল ভেরিয়েবলের উপর অত্যন্ত স্কিউড। উভয় দলের জন্য নমুনার আকার বেশ ছোট (একটিতে n = 33 এবং অন্যটিতে 45)। আমি মনে করি যে করা উচিত, এই অবস্থার অধীনে, আমার টি -test স্বাভাবিক ধৃষ্টতা লঙ্ঘনের শক্তসমর্থ হবে?


3
"অবশ্যই, এটি গুরুত্বপূর্ণ যে পার্থক্যগুলির নমুনা বিতরণ" - পার্থক্য কী? আমি ভবিষ্যতের পাঠকদের (এবং মূল পয়েন্টে স্পর্শকাতর) এর জন্য বিভ্রান্তিকর হওয়ার আশঙ্কায় আমি এটিকে প্রশ্নের বাইরে এডিট করতে প্রলুব্ধ হয়েছিলাম। আমার প্রথম চিন্তা এটি একটি ভুল রেফারেন্স এর ছিল যুক্ত করা টন যেখানে আমরা জোড়া মধ্যে পার্থক্য অনুমান -test, স্বাভাবিক, কিন্তু যে একটি স্বাধীন নমুনা পরীক্ষা প্রযোজ্য নয়। পার্থক্য করার মতো আমাদেরও জুড়ি নেই! সম্ভবত "উপায় মধ্যে পার্থক্য" উদ্দেশ্য? কিউ এর বাকী দুটি নমুনার স্বাভাবিকতা বিবেচনা করে, কোনও পার্থক্য নয়।
সিলভারফিশ

কিভাবে শক্তসমর্থ প্রশ্নে টি -test যেমন লঙ্ঘনের একজন গুরুত্বপূর্ণ ও বৈধ অন্যতম। কিন্তু একটি সম্পর্কিত সমস্যাটি হল এই যে আপনার ডেটা মধ্যে লঙ্ঘনের জন্য পরীক্ষণ প্রথম, এবং শুধুমাত্র তারপর সিদ্ধান্ত নেওয়ার সময় একটি আবেদন করতে টি -test বা কিছু বিকল্প পরীক্ষা, বাঞ্ছনীয় নয়। এই জাতীয় বহু-পদক্ষেপের পদ্ধতিতে অনিশ্চিত অপারেটিং বৈশিষ্ট্য রয়েছে। এই থ্রেডটি দেখুন: টি টেস্ট বা নন-প্যারাম্যাট্রিকের মধ্যে চয়ন করার জন্য একটি মূলনীতি যেমন ছোট নমুনায় উইলকক্সন
সিলভারফিশ

একটি বিশ্বাসযোগ্য উত্স কি? (আমি এটি গ্রহণ করি আমরা উভয়ই একমত হই যে সরকারী উত্স হিসাবে কিছুই নেই)। আমরা কি স্তর-দৃust়তা বা শক্তির দিকে তাকিয়ে আছি? এবং যদি 'শক্তিও' হয় ... আমরা কী ধরনের বিকল্পের কথা বলছি ?
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_বি দুঃখিত, স্ট্যাক ওভারফ্লোয়ের জন্য "অফিশিয়াল সোর্স" অনুগ্রহ বার্তা স্পষ্টতই বেশি! আমি কেবল অনুমান করি যে এই থ্রেডটি বেশ কয়েকটি প্রশংসাপত্রের যোগ্যতার জন্য কার্যত গুরুত্বপূর্ণ (আরও উচ্চতর ট্র্যাফিক এবং উইকিপিডিয়ায় দরিদ্র)। পিটার ফ্লমের উত্তর পরিষ্কারভাবে দেখায় যে "ক্যানোনিকাল উত্তর" অনুগ্রহ টেম্পলেট অনুপযুক্ত হবে। আমি এই বিষয়ে "জ্ঞানের একটি সাধারণ সংস্থা" অনুভূতি পেয়েছি - যদি আমাকে এই প্রশ্ন থেকে দূরে জিজ্ঞাসা করা হত তবে আমার তালিকাটি অনেকটা দালালালের মতো দেখাবে (আমি কুর্তোসিস যুক্ত করেছিলাম, তবে সেই সমান নমুনার আকারটি ছুঁড়ে দেখিনি) সাধারণ অ-স্বাভাবিকতা বনাম সুরক্ষা দেয়)
সিলভারফিশ

@ গ্লেেন_বি আপনার উত্তরটি একই রকম শিরা খনন করে তাই দেখে মনে হয় যে কয়েকটি বেসিক পয়েন্ট রয়েছে যা বহুলভাবে পরিচিত / গৃহীত হয়েছে। আমার ডিগ্রিটি অনুমানের ফলে নয় তবে লঙ্ঘনের পরিণতি নয়: আমার জ্ঞানটি বিভিন্ন উত্স, বিট এবং বব সম্পর্কে ছড়িয়ে ছিটিয়ে রয়েছে ("মনোবিজ্ঞানীদের পক্ষে পরিসংখ্যান" টাইপ বইগুলি অনেক পরিসংখ্যান তত্ত্বের পাঠ্যের চেয়ে পরিণতিগুলিতে বেশি মনোযোগ দিতে পারে) - অন্যথায় আমি পোস্ট করতাম একটি উত্তর একটি অনুগ্রহ না! যদি কেউ একটি ভাল পাঠ্যপুস্তকে একটি শালীন এক পৃষ্ঠার সংক্ষিপ্তসার জানেন তবে তা আমার পক্ষে ভাল। যদি এটি সিমুলেশন ফলাফল সহ বেশ কয়েকটি কাগজপত্র থাকে তবে তাও ঠিক। ভবিষ্যতের পাঠকদের যেকোন কিছু উল্লেখ করা এবং উদ্ধৃত করা যেতে পারে।
সিলভারফিশ

উত্তর:


16

দৃ rob়তা সম্পর্কে প্রশ্নগুলির উত্তরের পক্ষে খুব কঠিন - কারণ অনুমানগুলি অনেক উপায়ে এবং প্রতিটি উপায়ে বিভিন্ন স্তরে লঙ্ঘিত হতে পারে। সিমুলেশন কাজ কেবল সম্ভাব্য লঙ্ঘনের খুব সামান্য অংশের নমুনা করতে পারে।

কম্পিউটিংয়ের স্থিতি দেওয়া, আমি মনে করি প্যারামেট্রিক এবং একটি প্যারামিমেট্রিক পরীক্ষা উভয়ই চালনা করা বেশিরভাগ সময় উপযুক্ত । তারপরে আপনি ফলাফলগুলি তুলনা করতে পারেন।

আপনি যদি সত্যিই উচ্চাভিলাষী হন, আপনি এমনকি অনুমতিপত্র পরীক্ষাও করতে পারেন।

যদি অ্যালান টুরিং তার কাজটি রোনাল্ড ফিশার করার আগে করতেন? :-)।


1
পিটার, আপনি আমাকে questionতিহাসিক কথাসাহিত্য লিখতে অনুপ্রাণিত করেছেন ঠিক সেই প্রশ্নের উত্তর দেওয়ার জন্য!
সাইকোরাক্স

12

@ পিটারফ্লাম তার প্রথম বাক্যটি দিয়ে পেরেক মারা গিয়েছিলেন hit

আমি কোন স্টাডি দেখেছি তার মোটামুটি সংক্ষিপ্তসার দেওয়ার চেষ্টা করব (আপনি লিঙ্কগুলি চাইলে এটি কিছুটা সময় হতে পারে):

সামগ্রিকভাবে, দুটি নমুনা টি-পরীক্ষাটি যথাযথভাবে প্রতিসম অ-স্বাভাবিকতা থেকে পাওয়ার-মজবুত (সত্য টাইপ-ই-ত্রুটি-হার কিছুটা কুর্তোসিস দ্বারা প্রভাবিত হয়, বেশিরভাগই সেই শক্তি দ্বারা প্রভাবিত হয়)।

দুটি নমুনা যখন একই দিকে মৃদুভাবে সঙ্কুচিত হয় তখন এক-লেজযুক্ত টি-টেস্ট আর পক্ষপাতহীন থাকে না। টি-স্ট্যাটিস্টিক বিতরণ করার জন্য বিপরীতভাবে স্কিউ করা হয় এবং পরীক্ষাটি অন্যদিকে থাকলে তার চেয়ে একদিকে থাকলে আরও অনেক বেশি শক্তি রয়েছে। যদি তারা বিপরীত দিকগুলিতে স্কিউ হয় তবে টাইপ আই ত্রুটির হারটি খুব বেশি প্রভাবিত হতে পারে।

ভারী skewness এর আরও বড় প্রভাব ফেলতে পারে, তবে সাধারণভাবে বলতে গেলে দ্বি-লেজযুক্ত পরীক্ষার মধ্য দিয়ে মাঝারি স্নিগ্ধতা খুব খারাপ নয় যদি আপনি নিজের পরীক্ষার সারমর্মটিকে অন্যদিকে যে দিকটির আরও বেশি শক্তি বরাদ্দ করেন তাতে আপত্তি রাখেন না।

সংক্ষেপে - দ্বি-লেজযুক্ত, দ্বি-নমুনা টি-পরীক্ষাটি এই ধরণের জিনিসগুলির পক্ষে যথেষ্ট শক্তিশালী তবে যদি আপনি তাৎপর্য স্তর এবং কিছু হালকা পক্ষপাতের উপর কিছুটা প্রভাব সহ্য করতে পারেন।

বিতরণকে অ-সাধারণ করার জন্য অনেকগুলি, অনেকগুলি উপায় রয়েছে, যদিও সেগুলি এই মন্তব্যগুলিতে আচ্ছাদিত নয়।


এটিকে যথাযথভাবে শক্তিশালী বলাই ঠিক যে আমি নিশ্চিত নই! এটি যুক্তিসঙ্গত স্তরের-দৃust়, তাত্পর্য স্তরটি প্রায় সঠিক হবে, তবে উদাহরণস্বরূপ উইলকক্সন পরীক্ষাগুলি যথাযথভাবে স্বাভাবিকতার কাছাকাছি হওয়া বিকল্পগুলি সনাক্তকরণ করা শক্তির পক্ষে অনেক বেশি শক্তি থাকতে পারে। এটি এমন কারণগুলির উপরও নির্ভর করে যেমন প্রতিটি গ্রুপে সমান সংখ্যক পর্যবেক্ষণ রয়েছে: অসম-এন ক্ষেত্রে দৃust়তা অনেক বেশি ভঙ্গুর!
কেজেটিল বি হালওয়ারসেন

1
@ কেজেটিলভালভর্সেন অধ্যয়নগুলি আমি দেখেছি - কিছুটা সিমুলেশন আমি নিজেই করেছি (এবং আমি কিছুক্ষণের জন্য ভাল করে দেখিনি; আপনি হয়ত আমার কিছু না দেখে থাকতে পারেন), ক্ষমতার বেশিরভাগ প্রভাব দেখে মনে হয়েছিল বেশিরভাগ ক্ষেত্রে স্তরের উপর এবং নীচে চাপ দেওয়া (যা উইলকক্সনকে প্রভাবিত করে না)। এই পরিস্থিতিতে উইলকক্সনের সাধারনত ভাল পাওয়ার বৈশিষ্ট্য দেওয়া (বিশেষত ভারী লেজ সহ) উইলকক্সনকে পাওয়ারের পক্ষে যথেষ্ট - যদি আপনি স্তরগুলি সামঞ্জস্য করেন তবে এগুলি একই রকম হয়, তা আমাকে অবাক করে দিয়েছিল যে প্রায়শই কতটা ভাল? করেছিল.
গ্লেন_বি -রিনস্টেট মনিকা

7

@ পিটারফ্লম ইতিমধ্যে উল্লেখ করেছেন যে সিমুলেশন অধ্যয়ন কখনই সমস্ত পরিস্থিতি এবং সম্ভাবনাগুলি কভার করতে পারে না এবং তাই একটি নির্দিষ্ট উত্তর দিতে পারে না। যাইহোক, আমি এখনও কিছু সিমুলেশন পরিচালনা করে এই জাতীয় সমস্যাটি অন্বেষণ করা দরকারী বলে মনে করি (এটি শিক্ষার্থীদের কাছে মন্টি কার্লো সিমুলেশন অধ্যয়নের ধারণাটি প্রবর্তন করার সময় আমি যে ধরনের অনুশীলন ব্যবহার করতে চাই তা হ'ল এটিও ঘটে)। সুতরাং, আসুন এটি চেষ্টা করে দেখুন। আমি এই জন্য আর ব্যবহার করব।

কোড

n1 <- 33
n2 <- 45
mu1 <- 0
mu2 <- 0
sd1 <- 1
sd2 <- 1

iters <- 100000
p1 <- p2 <- p3 <- p4 <- p5 <- rep(NA, iters)

for (i in 1:iters) {

   ### normal distributions
   x1 <- rnorm(n1, mu1, sd1)
   x2 <- rnorm(n2, mu2, sd2)
   p1[i] <- t.test(x1, x2)$p.value

   ### both variables skewed to the right
   x1 <- (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p2[i] <- t.test(x1, x2)$p.value

   ### both variables skewed to the left
   x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p3[i] <- t.test(x1, x2)$p.value

   ### first skewed to the left, second skewed to the right
   x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- (rchisq(n2, df=1) - 1)/sqrt(2)      * sd2 + mu2
   p4[i] <- t.test(x1, x2)$p.value

   ### first skewed to the right, second skewed to the left
   x1 <- (rchisq(n1, df=1) - 1)/sqrt(2)      * sd1 + mu1
   x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p5[i] <- t.test(x1, x2)$p.value

}

print(round((apply(cbind(p1, p2, p3, p4, p5), 2, function(p) mean(p <= .05))), 3))

ব্যাখ্যা

  1. প্রথমে আমরা গ্রুপের আকার ( n1এবং n2) সেট করি , প্রকৃত গোষ্ঠীর অর্থ ( mu1এবং mu2) এবং সত্য মানক বিচ্যুতি ( sd1এবং sd2)।

  2. তারপরে আমরা পি-ভ্যালুগুলিতে সঞ্চয় করতে ভেক্টরগুলি চালনা এবং সেটআপ করার জন্য পুনরাবৃত্তির সংখ্যা নির্ধারণ করি।

  3. তারপরে আমি 5 টি পরিস্থিতিতে পরিস্থিতিতে ডেটা অনুকরণ করি:

    1. উভয় বিতরণ স্বাভাবিক।
    2. উভয় বিতরণ ডান দিকে skew হয়।
    3. উভয় বিতরণ বাম দিকে skew করা হয়।
    4. প্রথম বিতরণ বাম দিকে স্কু করা হয়, দ্বিতীয়টি ডানদিকে to
    5. প্রথম বিতরণ ডান দিকে স্কু করা হয়, দ্বিতীয়টি বামে।

    দ্রষ্টব্য যে আমি স্কিওড বিতরণগুলি উত্পন্ন করার জন্য চি-স্কোয়ার ডিস্ট্রিবিউশনগুলি ব্যবহার করছি। এক ডিগ্রি স্বাধীনতার সাথে সেগুলি অত্যন্ত বিতরণযোগ্য বিতরণ। যেহেতু এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার ডিস্ট্রিবিউজের প্রকৃত গড় এবং বৈকল্পিক যথাক্রমে 1 এবং 2 এর সমান ( উইকিপিডিয়া দেখুন ), আমি সেই বিতরণগুলি প্রথমে 0 এবং মান বিচ্যুতি 1 এর অর্থ পুনরুদ্ধার করেছি এবং তারপরে তাদের পুনরুদ্ধার করেছি পছন্দসই সত্যিকারের গড় এবং আদর্শ বিচ্যুতি (এটি এক ধাপে করা যেতে পারে, তবে এটি এভাবে করা আরও পরিষ্কার হতে পারে)।

  4. প্রতিটি ক্ষেত্রেই আমি টি-টেস্ট প্রয়োগ করি (ওয়েলচের সংস্করণ - এটি অবশ্যই শিক্ষার্থীর সংস্করণ বিবেচনা করতে পারে যা দুটি গ্রুপে সমান রূপগুলি গ্রহণ করে) এবং পূর্বে সেট করা ভেক্টরগুলিতে পি-মানটি সংরক্ষণ করে।

  5. সবশেষে, সমস্ত পুনরাবৃত্তি সম্পূর্ণ হয়ে গেলে, আমি প্রতিটি ভেক্টরের জন্য গণনা করি যে কতবার p-value .05 এর সমান বা নীচে হয় (অর্থাত্ পরীক্ষাটি "উল্লেখযোগ্য")। এটি অভিজ্ঞতাগত প্রত্যাখ্যান হার।

কিছু ফলাফল

  1. উপরের ফলনটির বর্ণিত ঠিক মতো অনুকরণ:

       p1    p2    p3    p4    p5 
    0.049 0.048 0.047 0.070 0.070
    

    α=.05

  2. যদি আমরা কোডটি এতে পরিবর্তন করি mu1 <- .5তবে আমরা পাই:

       p1    p2    p3    p4    p5 
    0.574 0.610 0.606 0.592 0.602
    

    সুতরাং, উভয় বন্টন স্বাভাবিক হিসাবে দেখা যায় (পরীক্ষা দ্বারা অনুমান হিসাবে), সঙ্কোচ একই দিকে থাকলে শক্তি আসলে কিছুটা বেশি বলে মনে হয় ! আপনি যদি এতে অবাক হন তবে আপনি এটি কয়েকবার পুনরায় চালু করতে চাইতে পারেন (অবশ্যই, প্রতিটি সময় কিছুটা ভিন্ন ফলাফল পেয়ে) তবে প্যাটার্নটি থেকে যাবে।

    মনে রাখবেন যে দুটি পরিস্থিতি যেখানে skewness বিপরীত দিকের অধীনে অনুভূতিগত শক্তি মানের মূল্য ব্যাখ্যা করতে সতর্ক হতে হবে, যেহেতু টাইপ 1 ত্রুটি হারটি খুব নামমাত্র নয় (একটি চরম ক্ষেত্রে হিসাবে, ধরুন আমি ডেটা যা তা বিবেচনা না করেই সর্বদা প্রত্যাখ্যান করি দেখান; তারপরে আমি সর্বদা সর্বাধিক শক্তির সাথে একটি পরীক্ষা করব, তবে অবশ্যই পরীক্ষার পরিবর্তে স্ফীতিযুক্ত টাইপ আই ত্রুটির হারও রয়েছে)।

কেউ mu1(এবং mu2- তবে আসলে কী গুরুত্বপূর্ণ তা উভয়ের মধ্যে পার্থক্য) এর জন্য বিভিন্ন মানের সন্ধান করতে শুরু করতে পারে এবং আরও গুরুত্বপূর্ণ, দুটি গ্রুপের (যেমন, sd1এবং sd2) সত্যিকারের স্ট্যান্ডার্ড বিচ্যুতি পরিবর্তন করা এবং বিশেষত এগুলি অসম করে তোলা শুরু করে। আমি ওপি দ্বারা উল্লিখিত নমুনা আকারগুলিতেও আটকেছি, তবে অবশ্যই এটিও ঠিকঠাক করা যেতে পারে। এবং স্কিউনেস অবশ্যই এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণে আমরা যা দেখি তার চেয়ে অনেকগুলি রূপ নিতে পারে। আমি এখনও মনে করি যে এই জিনিসগুলির কাছে যাওয়া কার্যকর, যদিও এটি একটি নির্দিষ্ট উত্তর দিতে পারে না despite


2
যেহেতু আজকাল আমাদের মধ্যে শক্তিশালী আধা-প্যারাম্যাট্রিক পদ্ধতি রয়েছে, কেন এই আলোচনা এতটাই উপযুক্ত?
ফ্রাঙ্ক হ্যারেল 13

(+1) আমি মনে করি যে এটি একটি মামুলি জনসংখ্যার থেকে একটি নমুনা আঁকা হয়েছিল এবং অন্যটি ছিল না, সেই ক্ষেত্রে এটি সহ মূল্যবান হতে পারে, কারণ ওপি ভেবেছিল তাদের ডেটাতে এটি ঘটছিল। তবে সুস্পষ্ট কোড সহ উত্তরটি দেখে ভাল লাগল। (সামান্য সাধারণীকরণ আসলে পাঠককে ট্র্যাডিশনাল টি-টেস্টের সাথে কতটা ভাল তুলনা করে তা খতিয়ে দেখার অনুমতি দেয়, যদি আপনি কাউকে এমন একটি পরীক্ষা প্রয়োগের ঝুঁকি শেখানোর চেষ্টা করছেন যার অনুমান লঙ্ঘন হয়েছে .. ।)
সিলভারফিশ

2

আপনার পরিস্থিতিতে টি-পরীক্ষা সম্ভবত টাইপ আই ত্রুটির হারের ক্ষেত্রে শক্তিশালী হবে তবে দ্বিতীয় ধরণের ত্রুটি হার নয়। আপনি সম্ভবত ক) কৃস্কাল-ওয়ালিস পরীক্ষা, বা খ) টি-টেস্টের আগে একটি স্বাভাবিক রূপান্তরকরণের মাধ্যমে সম্ভবত আরও শক্তি অর্জন করবেন।

আমি দুটি মন্টি কার্লো অধ্যয়নের উপর এই উপসংহারের ভিত্তি করছি। প্রথম ( খান অ্যান্ড রায়নার, ২০০৩ ) -তে স্ক-স্কু এবং কুর্তোসিসকে জি-ও-কে বিতরণ পরিবারের পরামিতিগুলির মাধ্যমে অপ্রত্যক্ষভাবে হেরফের করা হয়েছিল এবং ফলস্বরূপ শক্তিটি পরীক্ষা করা হয়েছিল। গুরুত্বপূর্ণভাবে, ক্রুসকল-ওয়ালিস পরীক্ষার শক্তি অ-স্বাভাবিকতা দ্বারা কম ক্ষতিগ্রস্থ হয়েছিল, বিশেষত এন> = 15 এর জন্য।

এই অধ্যয়ন সম্পর্কে কয়েকটি সতর্কতা / যোগ্যতা: শক্তি প্রায়শই উচ্চ কুর্তোসিস দ্বারা আহত হয়েছিল, তবে এটি স্কু দ্বারা কম আক্রান্ত হয়েছিল। প্রথম নজরে, এই প্যাটার্নটি আপনার পরিস্থিতিটির সাথে কম প্রাসঙ্গিক বলে মনে হতে পারে যে আপনি কুর্তোসিস নয়, স্কিউয়ের কোনও সমস্যা উল্লেখ করেছেন। তবে, আমি বাজি দিচ্ছি যে আপনার ক্ষেত্রে অতিরিক্ত কার্টোসিসও চরম। মনে রাখবেন যে অতিরিক্ত কার্টোসিস কমপক্ষে স্কু ^ 2 - 2 এর মতো কম হবে ((অতিরিক্ত কুর্তোসিসটি 4 র্থ মানিক মুহুর্তের বিয়োগ 3 এর সমান হতে দিন, যাতে অতিরিক্ত বিতরণের জন্য অতিরিক্ত কুরটোসিস = 0 থাকে)) আরও লক্ষ করুন যে খান এবং রায়নার ( 2003) 3 টি গ্রুপের সাথে অ্যানোভা পরীক্ষা করেছে, তবে তাদের ফলাফলগুলি দুটি-নমুনা টি-পরীক্ষায় সাধারণীকরণের সম্ভাবনা রয়েছে।

একটি দ্বিতীয় প্রাসঙ্গিক গবেষণা ( বিসলে, এরিকসন, এবং অ্যালিসন, ২০০৯)) চি-স্কোয়ারড (1) এবং ওয়েইবুল (1, .5) এর মতো বিভিন্ন অ-স্বাভাবিক বিতরণে টাইপ I এবং টাইপ II উভয় ত্রুটি পরীক্ষা করে। কমপক্ষে 25 টির আকারের নমুনা আকারের জন্য, টি-পরীক্ষা পর্যাপ্তরূপে টাইপ আই ত্রুটির হার নামমাত্র আলফা স্তরে বা তার নীচে নিয়ন্ত্রণ করে। তবে, টি-টেস্টের আগে ক্রুসকল-ওয়ালিস পরীক্ষা বা র‌্যাঙ্ক-ভিত্তিক ইনভার্স নরমাল ট্রান্সফর্মেশন (ব্লোম স্কোর) প্রয়োগ করে পাওয়ার সর্বাধিক ছিল। বিসলে এবং সহকর্মীরা সাধারণত নর্মালাইজিং পদ্ধতির বিরুদ্ধে তর্ক করেছিলেন, তবে এটি লক্ষ করা উচিত যে নরমালাইজিং পদ্ধতির ক্ষেত্রে এন> = 25 এর জন্য টাইপ 1 ত্রুটি হার নিয়ন্ত্রণ করা হয়েছিল এবং এর শক্তি কখনও কখনও ক্রুসকল-ওয়ালিস পরীক্ষার চেয়ে কিছুটা অতিক্রম করে। এটি হ'ল, স্বাভাবিককরণের পদ্ধতিটি আপনার পরিস্থিতির জন্য আশাব্যঞ্জক বলে মনে হচ্ছে। বিস্তারিত জানতে তাদের নিবন্ধের 1 এবং 4 সারণী দেখুন।

তথ্যসূত্র:

খান, এ।, এবং রায়নার, জিডি (2003) । বহু নমুনা অবস্থান সমস্যার জন্য সাধারণ পরীক্ষার অ-স্বাভাবিকতার প্রতি দৃ Rob়তা। ফলিত গণিত ও সিদ্ধান্ত বিজ্ঞান জার্নাল, 7 , 187-206।

বিসলে, টিএম, এরিকসন, এস।, এবং অ্যালিসন, ডিবি (২০০৯) । র‌্যাঙ্ক-ভিত্তিক বিপরীতমুখী সাধারণ রূপান্তরগুলি ক্রমবর্ধমান ব্যবহৃত হয়, তবে সেগুলি কি যোগ্য? আচরণগত জেনেটিক্স, 39 , 580-595।


(অতিরিক্ত) কুর্তোসিসনৈকতলীয়2-2

এটি নিজের থ্রেডের যোগ্য এমন প্রশ্নের মতো মনে হচ্ছে। সম্ভবত আপনার উদ্বেগ হ'ল অতিরিক্ত কুর্তোসিসটি ছোট নমুনাগুলিতে নিম্নমুখী পক্ষপাতদুষ্ট হবে? অবশ্যই, উপরের সিমুলেশন স্টাডিতে এটি ছিল, এবং কুর্তোসিস এখনও সেই পরিস্থিতিতে টি-টেস্টে কম শক্তি তৈরি করেছিল। আপনার প্রশ্নটি বেশিরভাগ মন্টি কার্লো অধ্যয়নের আরও সাধারণ সীমাবদ্ধতার দিকে ইঙ্গিত করে: সিদ্ধান্তগুলি প্রায়শই জনসংখ্যার বৈশিষ্ট্য, বৈশিষ্ট্যগুলির উপর ভিত্তি করে তৈরি হয় যা প্রয়োগকৃত গবেষক পর্যবেক্ষণ করতে পারেন না। নমুনা স্কিউ, কুর্তোসিস ইত্যাদির উপর ভিত্তি করে আপেক্ষিক শক্তির পূর্বাভাস দেওয়ার পক্ষে আরও দরকারী হবে
অ্যান্থনি

আমি এই সমস্যাটি সম্পর্কে একটি পৃথক প্রশ্ন পোস্ট করেছি: stats.stackexchange.com/questions/133247/…
অ্যান্টনি

0

প্রথমত, যদি আপনি ধরে নেন যে দুটি নমুনার বিতরণ আলাদা, তবে আপনি টি-পরীক্ষার ওয়েলচের সংস্করণটি ব্যবহার করছেন যা নিশ্চিত করে নিন যা দলগুলির মধ্যে অসম বৈকল্পিকতা অনুমান করে। এটি বিতরণের কারণে ঘটে এমন কিছু পার্থক্যের জন্য কমপক্ষে অ্যাকাউন্ট করার চেষ্টা করবে।

আমরা যদি ওয়েলচের টি-টেস্টের সূত্রটি দেখি:

টি=এক্স¯1-এক্স¯2গুলিএক্স¯1-এক্স¯2

গুলিএক্স¯1-এক্স¯2

গুলিএক্স¯1-এক্স¯2=গুলি12এন1+ +গুলি22এন2

আমরা দেখতে পাচ্ছি যে প্রতিবারই একটি এস আছে আমরা জানি যে বৈকল্পকে বিবেচনায় নেওয়া হচ্ছে। আসুন কল্পনা করুন যে দুটি বৈকল্পিক বাস্তবে একই, তবে একটি স্কিউড রয়েছে, যার ফলে ভিন্ন বৈকল্পিক অনুমান হয়। যদি ভেরিয়েন্সটির এই অনুমানটি স্কিউর কারণে আপনার ডেটার প্রতিনিধিত্ব না করে তবে প্রকৃতপক্ষে বাইসিং এফেক্টটি মূলত এটির গণনা করার জন্য ব্যবহৃত ডেটার পয়েন্টের সংখ্যায় বিভক্ত সেই পক্ষপাতিত্বের বর্গমূল হতে পারে। সুতরাং বৈকল্পিকের খারাপ অনুমানের প্রভাবটি স্কোয়ার-রুট এবং উচ্চতর এন দ্বারা কিছুটা ছড়িয়ে পড়ে এবং সম্ভবত এই কারণেই theকমত্য এটি একটি শক্তিশালী পরীক্ষা হিসাবে রয়ে গেছে।

স্কিউ বিতরণের অন্যান্য ইস্যুটি হ'ল এর অর্থ গণনাটিও প্রভাবিত হবে এবং সম্ভবত টেস্ট অনুমান লঙ্ঘনের আসল সমস্যাগুলি হ'ল উপায়গুলি স্কিউ করার ক্ষেত্রে তুলনামূলক সংবেদনশীল। এবং পরীক্ষার দৃust়তা মধ্যস্থতার পার্থক্যের তুলনায় (ধারণা হিসাবে) পার্থক্য গণনা করে মোটামুটি নির্ধারণ করা যেতে পারে। সম্ভবত আপনি টি-টেস্টের মিডিয়ানদের পার্থক্যটিকে আরও শক্তিশালী পরিমাপ হিসাবে প্রতিস্থাপনের চেষ্টা করতে পারেন (আমি নিশ্চিত যে কেউ এটি নিয়ে আলোচনা করেছেন তবে আমি লিঙ্কের জন্য খুব দ্রুত Google এ কিছু খুঁজে পাইনি)।

যদি আপনি যা করছেন সমস্ত টি-টেস্ট হয় তবে আমি অনুমতিপত্র পরীক্ষা চালানোর পরামর্শ দেব। ক্রমায়ন পরীক্ষা হুবহু পরীক্ষা, বিতরণ অনুমানের থেকে পৃথক। সর্বাধিক গুরুত্বপূর্ণভাবে, প্যারামেট্রিক পরীক্ষার অনুমানগুলি পূরণ করা হলে পারমিটেশন পরীক্ষা এবং টি-পরীক্ষা অভিন্ন ফলাফলের দিকে নিয়ে যায় । অতএব, আপনি যে দৃust়তা পরিমাপটি খুঁজছেন তা 1 হতে পারে - ক্রমান্বন এবং টি-পরীক্ষা পি-মানগুলির মধ্যে পার্থক্য, যেখানে 1 এর স্কোর নিখুঁত দৃ rob়তা এবং 0 বোঝায় মোটেও দৃust়তা নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.