আরএম মধ্যে lm এবং aov এর মধ্যে রিপোর্ট করা পি-মানগুলির মধ্যে পার্থক্য


12

নিম্নলিখিত aovএবং lmকলগুলিতে পি-মানগুলির পার্থক্য কী ব্যাখ্যা করে ? পার্থক্যটি কি কেবলমাত্র বিভিন্ন ধরণের স্কোম-অফ-বর্গ গণনার কারণে?

set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
summary(lm(data~f1*f2))$coeff

উত্তর:


13

summary(aov)স্কোয়ারের তথাকথিত টাইপ আই (ক্রমিক) ব্যবহার করে su summary(lm)স্কোরগুলির তথাকথিত প্রকার তৃতীয় অঙ্কগুলি ব্যবহার করে, যা অনুক্রমিক নয়। বিশদ জন্য গুং এর উত্তর দেখুন ।


নোট করুন যে আপনাকে কল করতে হবে lm(data ~ factor(f1) * factor(2))( aov()সূত্রের আরএইচএসকে স্বয়ংক্রিয়ভাবে উপাদানগুলিতে রূপান্তরিত করবে)। তারপরে লিনিয়ার রিগ্রেশন- এ সাধারণ স্ট্যাটাস্টিকের জন্য ডিনোমিনিটরটি নোট করুন ( আরও ব্যাখ্যাের জন্য এই উত্তরটি দেখুন ):টি

টি=ψ^-ψ0σ^'(এক্স'এক্স)-1

'(এক্স'এক্স)-1 each প্রতিটি পরীক্ষিত সহগের জন্য পৃথক হয় কারণ ভেক্টর । পরিবর্তিত হয়। বিপরীতে, আনোভা টেষ্টের ডোনামিনেটর সর্বদা এমএসই থাকে।βএফ


1
আমি মনে করি এই উত্তরের প্রথম বাক্যটি ভুল। বিভিন্ন ধরণের স্কোয়ারের যোগফলের কারণে পার্থক্যটি স্পষ্টভাবে মনে হচ্ছে : যথা, টাইপ I বনাম টাইপ II / III। প্রকার I টি অনুক্রমিক, যা lmপ্রতিবেদন করে, অন্যদিকে II / III টাইপ নয়। @ Gung এর উত্তরে যা আপনি লিঙ্ক করেছেন তাতে এটি বেশ কিছু বিশদে ব্যাখ্যা করা হয়েছে।
অ্যামিবা 21

@ অ্যামিবা উত্তরটি সংশোধন করার জন্য আপনার কী পরামর্শ?
কারাকাল

আমি প্রথম অনুচ্ছেদ সম্পাদনা করেছি, আপনি সম্পাদনার সাথে ঠিক আছেন কিনা তা দেখুন এবং নিজের পছন্দ মতো পরিবর্তন করতে পারেন।
অ্যামিবা বলেছেন মোনিকা

2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
            Df Sum Sq Mean Sq F value Pr(>F)
f1           1  0.535  0.5347   0.597  0.462
f2           1  0.002  0.0018   0.002  0.966
f1:f2        1  0.121  0.1208   0.135  0.723
Residuals    8  7.169  0.8962               
summary(lm(data~f1*f2))$coeff
               Estimate Std. Error    t value  Pr(>|t|)
(Intercept)  0.05222024   2.732756  0.0191090 0.9852221
f1          -0.17992329   1.728346 -0.1041014 0.9196514
f2          -0.62637109   1.728346 -0.3624106 0.7264325
f1:f2        0.40139439   1.093102  0.3672066 0.7229887

এগুলি দুটি ভিন্ন কোড। এলএম মডেল থেকে আপনার সহগের দরকার। যখন অ্যাওভ মডেলটি থেকে আপনি কেবল তারতম্যের উত্সগুলি টেবুলেট করছেন। কোড চেষ্টা করে দেখুন

anova(lm(data~f1*f2))
Analysis of Variance Table

Response: data
          Df Sum Sq Mean Sq F value Pr(>F)
f1         1 0.5347 0.53468  0.5966 0.4621
f2         1 0.0018 0.00177  0.0020 0.9657
f1:f2      1 0.1208 0.12084  0.1348 0.7230
Residuals  8 7.1692 0.89615   

এটি একই ফলাফলের দিকে পরিচালিত ভিন্নতার উত্সগুলির সারণীর সারণী দেয়।


2
এটি প্রশ্নের উত্তর হিসাবে উপস্থিত হয় না, যা আপনার শীর্ষ প্যানেলের দুটি সংক্ষিপ্তসারগুলির জন্য পি-মানগুলি কেন f1এবং f2পৃথক করে তা জিজ্ঞাসা করে । দেখে মনে হচ্ছে আপনি শুধুমাত্র দেখাচ্ছেন যে summary(aov(...))এবং anova(lm(...))মধ্যে Rঅনুরূপ আউটপুট আছে।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.