টি-পরীক্ষায় টি মান থেকে ম্যানুয়ালি পি মান গণনা করা হচ্ছে


49

আমার 31 টি মান সহ একটি নমুনা ডেটাसेट রয়েছে। সত্যিকারের গড় 10 এর সমান হলে পরীক্ষার জন্য আর ব্যবহার করে আমি একটি দ্বি-পুচ্ছ টি-টেস্ট চালিয়েছি:

t.test(x=data, mu=10, conf.level=0.95)

আউটপুট:

t = 11.244, df = 30, p-value = 2.786e-12
alternative hypothesis: true mean is not equal to 10 
95 percent confidence interval:
 19.18980 23.26907 
sample estimates:
mean of x 
 21.22944 

এখন আমি ম্যানুয়ালি একই জিনিস করার চেষ্টা করছি:

t.value = (mean(data) - 10) / (sd(data) / sqrt(length(data))) 
p.value = dt(t.value, df=length(lengths-1))

এই পদ্ধতিটি ব্যবহার করে গণনা করা টি-মান টি-টেস্ট আর ফাংশন দ্বারা আউটপুট হিসাবে একই। পি-মানটি অবশ্য 3.025803e-12 থেকে বেরিয়ে আসে।

কোন ধারণা আমি কি ভুল করছি?

ধন্যবাদ!

সম্পাদনা

আমার ডেটাসেট সহ পুরো আর কোডটি এখানে:

# Raw dataset -- 32 observations
data = c(21.75, 18.0875, 18.75, 23.5, 14.125, 16.75, 11.125, 11.125, 14.875, 15.5, 20.875,
            17.125, 19.075, 25.125, 27.75, 29.825, 17.825, 28.375, 22.625, 28.75, 27, 12.825, 
            26, 32.825, 25.375, 24.825, 25.825, 15.625, 26.825, 24.625, 26.625, 19.625)

# Student t-Test
t.test(x=data, mu=10, conf.level=0.95)

# Manually calculate p-value
t.value = (mean(data) - 10) / (sd(data) / sqrt(length(data)))
p.value = dt(t.value, df=length(data) - 1)

উত্তর:


43

এটি ব্যবহার করুন ptএবং এটি দুটি লেজযুক্ত করুন।

> 2*pt(11.244, 30, lower=FALSE)
[1] 2.785806e-12

1
আমি মনে করি একটি বিশদ অনুপস্থিত রয়েছে: লোয়ার = এফ কখন ব্যবহার করবেন? - দয়া করে আমার প্রশ্নটি এখানে দেখুন: stats.stackexchange.com/questions/133091/…
vonjd

3
মানটি ইতিবাচক হওয়া দরকার, সুতরাং যদি এটি ভেরিয়েবলের সাথে ব্যবহার করা হয় যা negativeণাত্মক হতে পারে তবে মোড়ানো হবে abs
অ্যারন - মনোকা পুনরায়

3
দুটি লেজযুক্ত পরীক্ষার জন্য, আপনি সম্ভাবনার সন্ধান করছেন যে মানটি -11.244 এর চেয়ে কম বা +11.244 এর চেয়ে বেশি। নিম্ন = এফ আর কে প্রথম প্যারামিটারের চেয়ে মান বেশি হওয়ার সম্ভাবনা গণনা করতে বলে। অন্যথায়, এটি আপনাকে প্রথম প্যারামিটারের চেয়ে কম হওয়ার সম্ভাবনা দেয়। যেমন, আপনি 2 * পিটিও করতে পারেন (-11.244, 30)। ব্যক্তিগতভাবে, আমি সাধারণত 2 * পিটি (-abs (q), df = n-1) আর ডিফল্ট হিসাবে কম = টি তে করি।
অ্যাশিক

9

আমি এটিকে একটি মন্তব্য হিসাবে পোস্ট করেছি তবে যখন আমি সম্পাদনায় আরও কিছু যুক্ত করতে চেয়েছিলাম তখন এটি দীর্ঘ হয়ে গেছে তাই আমি এটিকে এখানে নামিয়েছি।

সম্পাদনা করুন : আপনার পরীক্ষার পরিসংখ্যান এবং df সঠিক। অন্য উত্তরটিতে কলটিতে লেজের ক্ষেত্রের গণনা pt()এবং দ্বি- পুচ্ছের জন্য দ্বিগুণ করার বিষয়টি ইস্যুটি নোট করে যা আপনার পার্থক্যের সমাধান করে। তবুও আমি আমার আগের আলোচনা / মন্তব্যটি ছেড়ে দেব কারণ এটি চরম লেজগুলিতে পি-মানগুলি সম্পর্কে আরও সাধারণভাবে প্রাসঙ্গিক বিষয়গুলি তোলে:

এটি সম্ভব যে আপনি কোনও ভুল করছেন না এবং এখনও একটি পার্থক্য পেতে পারেন, তবে আপনি যদি একটি পুনরুত্পাদনযোগ্য উদাহরণ পোস্ট করেন তবে আপনার কিছু ত্রুটি রয়েছে কিনা তা আরও তদন্ত করা সম্ভব হতে পারে (ডিএফ-তে বলুন)।

এই জিনিসগুলি আনুমানিক থেকে গণনা করা হয় যা খুব চরম লেজের মধ্যে বিশেষভাবে সঠিক নাও হতে পারে।

দুটি জিনিস যদি একইরকম অনুমানগুলি ব্যবহার না করে তবে তারা ঘনিষ্ঠভাবে একমত হতে পারে না, তবে চুক্তির অভাবের বিষয়টি বিবেচনা করা উচিত নয় (সঠিক লেজ অঞ্চলটি যতটা অর্থবহ সংখ্যার জন্য, তার জন্য প্রয়োজনীয় অনুমানগুলি বিস্ময়কর ডিগ্রি ধরে রাখতে হবে) সঠিকতা). আপনার কি সত্যিকারের স্বাভাবিকতা, সঠিক স্বাধীনতা, ঠিক ধ্রুব বৈকল্পিকতা আছে?

2×10-123×10-120.0001


7

এটি ম্যানুয়ালি গণনার সর্বোত্তম উপায় হ'ল:

t.value = (mean(data) - 10) / (sd(data) / sqrt(length(data))) 
p.value = 2*pt(-abs(t.value), df=length(data)-1)

1


0

আমি absমন্তব্যগুলি সহ @ অ্যারোন প্রদত্ত উত্তরটি সত্যিই পছন্দ করি । আমি একটি সহজ নিশ্চিতকরণ চালানো হয়

pt(1.96, 1000000, lower.tail = F) * 2

যা ফলন দেয় 0.04999607

এখানে, আমরা সুপরিচিত সম্পত্তি ব্যবহার করছি যে সাধারণ বন্টনের আওতায় থাকা 95% অঞ্চলটি ~ 1.96 স্ট্যান্ডার্ড বিচ্যুতিতে ঘটে, সুতরাং 0.05 ডলার আউটপুট আমাদের পি-মান দেয়। আমি 1000000 ব্যবহার করেছি যেহেতু এন বিশাল, টি বিতরণ প্রায় সাধারণ বিতরণের মতোই। এটি চালানো আমাকে @ হারুনের সমাধানগুলিতে সান্ত্বনা দিয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.