কাঁচা তথ্যের চেয়ে নমুনা পরিসংখ্যান ইনপুট করে কীভাবে আর দ্বি-নমুনা টি-টেস্ট সম্পাদন করবেন?


32

ধরা যাক আমাদের নীচে দেওয়া পরিসংখ্যান রয়েছে

gender mean sd n
f 1.666667 0.5773503 3
m 4.500000 0.5773503 4

আপনি কীভাবে দ্বি-নমুনা টি-টেস্ট সম্পাদন করেন (দেখতে কিছু পরিবর্তনশীল নারী-পুরুষের মধ্যে কোনও উল্লেখযোগ্য পার্থক্য আছে কি না) প্রকৃত তথ্যের চেয়ে এই জাতীয় পরিসংখ্যান ব্যবহার করে?

কীভাবে এটি করা যায় তা আমি ইন্টারনেটে কোথাও খুঁজে পাইনি। বেশিরভাগ টিউটোরিয়াল এবং এমনকি ম্যানুয়াল কেবল পরীক্ষার সাথে প্রকৃত ডেটা সেট করে deal


2
এই উইকিপিডিয়া নিবন্ধটি প্লাস আর এর টি-বিতরণ ফাংশনগুলির জন্য সহায়তা পৃষ্ঠাতে (পেয়েছে ?pt) - বিশেষত দেখুন pt()- আপনার নিজের এটি করার জন্য প্রয়োজনীয় সমস্ত তথ্য আছে। এবং আপনি যদি এটি করেন তবে আপনি পরিসংখ্যান এবং আর সম্পর্কে অনেক কিছু শিখবেন ।
জোশ ওব্রায়ান

2
এখানে ইতিমধ্যে ভাল উত্তর আছে, এবং সত্যই এটি নিজের জন্য একটি ফাংশন লিখতে খুব সহজ (এবং ভাল অনুশীলন) উভয়ই; তবে আমি কেবল যুক্ত করব যে আপনি tsum.testপ্যাকেজ বিএসডিএ- র ফাংশনটি একবার দেখে নিতে পারেন , যা আপনার সরবরাহকৃত সংক্ষিপ্ত তথ্য থেকে একটি টি-পরীক্ষা (দুটি নমুনা; ওয়েলচ বা সমান বৈচিত্র এবং একটি নমুনা) প্রয়োগ করে। এটি মূলত ভ্যানিলা আর তে টি-টেস্টের মতো কাজ করে তবে সংক্ষিপ্তসার তথ্যে।
গ্লেন_বি -রিনস্টেট মনিকা

1
সত্যি কথা বলতে, আমি যখন প্রোগ্রাম শিখছিলাম তখন আমার শিক্ষক সর্বদা বলেছিলেন, "চাকাটি পুনরায় উদ্ভাবন করবেন না"। অতএব, সবচেয়ে যৌক্তিক ফাংশন হবে tsum.test()থেকে BSDA libraryযেমন @Nick কক্সবাজার দ্বারা বিবৃত। @ ম্যাক্রো কোডের লাইনে যা লিখেছেন ঠিক তেমনই এটি কাজ করে। যদি প্রশ্নটি জিজ্ঞাসা করা হয়, আর-তে টি-টেস্টের পরিসংখ্যান গণনা করার জন্য পটভূমি গণনার কী বোঝা যায় তবে মার্কো আরও উপযুক্ত উত্তর হতে পারে। দয়া করে মনে রাখবেন, আমি আমার পেশাগত পটভূমির সাথে সম্পর্কিত আমার ব্যক্তিগত মতামত জানিয়ে কেবল কাউকে আপত্তি করার চেষ্টা করছি না। এবং @ মার্কো যা কিছু ঝরঝরে কোডিং :)
tcratus

উত্তর:


37

দ্বি-নমুনা টেষ্টের মেকানিক্সটি সম্পর্কে আমরা কী জানি তার ভিত্তিতে আপনি নিজের ফাংশনটি লিখতে পারেন । উদাহরণস্বরূপ, এটি কাজটি করবে:

# m1, m2: the sample means
# s1, s2: the sample standard deviations
# n1, n2: the same sizes
# m0: the null value for the difference in means to be tested for. Default is 0. 
# equal.variance: whether or not to assume equal variance. Default is FALSE. 
t.test2 <- function(m1,m2,s1,s2,n1,n2,m0=0,equal.variance=FALSE)
{
    if( equal.variance==FALSE ) 
    {
        se <- sqrt( (s1^2/n1) + (s2^2/n2) )
        # welch-satterthwaite df
        df <- ( (s1^2/n1 + s2^2/n2)^2 )/( (s1^2/n1)^2/(n1-1) + (s2^2/n2)^2/(n2-1) )
    } else
    {
        # pooled standard deviation, scaled by the sample sizes
        se <- sqrt( (1/n1 + 1/n2) * ((n1-1)*s1^2 + (n2-1)*s2^2)/(n1+n2-2) ) 
        df <- n1+n2-2
    }      
    t <- (m1-m2-m0)/se 
    dat <- c(m1-m2, se, t, 2*pt(-abs(t),df))    
    names(dat) <- c("Difference of means", "Std Error", "t", "p-value")
    return(dat) 
}
x1 = rnorm(100)
x2 = rnorm(200) 
# you'll find this output agrees with that of t.test when you input x1,x2
t.test2( mean(x1), mean(x2), sd(x1), sd(x2), 100, 200)
Difference of means       Std Error               t         p-value 
        -0.05692268      0.12192273     -0.46687500      0.64113442 

1
আমার সম্পাদনাটি তুলনা করে t.testপ্রত্যাখ্যান করা হয়েছে, সুতরাং এখানে নিশ্চিত করার জন্য কিছু কোড দেওয়া হয়েছে:(tt2 <- t.test2(mean(x1), mean(x2), sd(x1), sd(x2), length(x1), length(x2))); (tt <- t.test(x1, x2)); tt$statistic == tt2[["t"]]; tt$p.value == tt2[["p-value"]]
ম্যাক্স ঘেনিস

20

আপনি এটি কেবল হাতে হাতে গণনা করুন:

টি=(গড়-গড়মি)-প্রত্যাশিত পার্থক্যএস  এস=গুলি2এন+ +গুলিমি2এনমি  কোথায়,    =এনমি+ +এন-2

প্রত্যাশিত পার্থক্য সম্ভবত শূন্য।

আপনি যদি পি-মানটি চান তবে কেবল pt()ফাংশনটি ব্যবহার করুন :

pt(t, df)

সুতরাং, কোড একসাথে রাখা:

> p = pt((((1.666667 - 4.500000) - 0)/sqrt(0.5773503/3 + 0.5773503/4)), (3 + 4 - 2))
> p
[1] 0.002272053

এটি সমান বৈচিত্রগুলি ধরে নিয়েছে যা সুস্পষ্ট কারণ তাদের একই স্ট্যান্ডার্ড বিচ্যুতি রয়েছে।


কয়েকটি জিনিস: এটি "ইন R" কেমন? পরীক্ষার পরিসংখ্যান বিতরণ কী (যেমন আপনি এটি থেকে মূল্যগুলিতে কীভাবে যান)? পি
ম্যাক্রো

এক্ষেত্রে প্রদত্ত ডিগ্রি স্বাধীনতা ভুল! আপনি আনপুলযুক্ত বৈকল্পিক ব্যবহার করেন যা অসম বৈচিত্রগুলি ধরে নেয়। সুতরাং, স্ক্যাটারওয়েট আনুমানিকতা ব্যবহার করে স্বাধীনতার ডিগ্রি আরও সঠিক।
lzstat

7

আপনি বইটিতে (ওয়েব পৃষ্ঠায়) সূত্রের ভিত্তিতে গণনাগুলি করতে পারেন, বা বর্ণিত বৈশিষ্ট্যযুক্ত র্যান্ডম ডেটা তৈরি করতে পারেন ( প্যাকেজের mvrnormফাংশনটি দেখুন MASS) এবং t.testসিমুলেটেড ডেটাতে নিয়মিত ফাংশন ব্যবহার করতে পারেন ।


যখন আপনি বলেন "আপনি বৈশিষ্ট্যগুলি বর্ণিত এলোমেলো ডেটা উত্পন্ন করতে পারবেন", আপনি কি জনসংখ্যার সাথে ডেটা সিমুলেট করার অর্থ এবং নমুনার মানগুলির সমান স্ট্যান্ডার্ড বিচ্যুতি বা সীমাবদ্ধতার অধীনে সিমুলেট করতে চান যে নমুনাটির অর্থ এবং স্ট্যান্ডার্ড বিচ্যুতি প্রাক-পূর্বের সমান? নির্দিষ্ট মান?
ম্যাক্রো

2
আপনি চান যে সিমুলেটেড ডেটাতে সমস্যাটি হিসাবে বর্ণিত ঠিক একই রকমের গড় (গুলি) এবং ভার (গুলি) রয়েছে। এটি করার একটি উপায় (আরও অনেকগুলি রয়েছে) হ'ল প্যাকেজে mvrnormফাংশনটি ব্যবহার করা MASS(আপনাকে সত্যায়নের অভিজ্ঞতামূলক যুক্তি নির্ধারণ করতে হবে)।
গ্রেগ তুষার

2

প্রশ্নটি আর সম্পর্কে জিজ্ঞাসা করে, তবে অন্য কোনও পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার নিয়ে সমস্যাটি দেখা দিতে পারে। উদাহরণস্বরূপ স্টাটাতে বিভিন্ন তথাকথিত তাত্ক্ষণিক কমান্ড রয়েছে, যা একা সারাংশের পরিসংখ্যান থেকে গণনার অনুমতি দেয়। কমান্ডের বিশেষ ক্ষেত্রে , যা এখানে প্রয়োগ হয় তার জন্য http://www.stata.com/manouts13/rttest.pdf দেখুন ttesti

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.