কীভাবে আর তে একটি আনকোভা করা যায়


17

আমি উদ্ভিদের এপিফাইটগুলির ঘনত্ব সম্পর্কিত ডেটার একটি অ্যানকোভা বিশ্লেষণ করতে চাই। প্রথমে, আমি জানতে চাই যে দুটি opালু, একটি এন এবং একটি এস এর মধ্যে গাছের ঘনত্বের মধ্যে কোনও পার্থক্য রয়েছে কিনা, তবে আমার কাছে অন্যান্য ডেটা রয়েছে যেমন উচ্চতা, ক্যানোপি খোলামেলা এবং হোস্ট প্ল্যান্টের উচ্চতা। আমি জানি যে আমার covariate দুটি opাল (N এবং S) হতে হবে। আমি এই মডেলটি তৈরি করেছি যা আরে চলে এবং যদিও এটি ভাল অভিনয় করে তবে আমার কোনও ধারণা নেই। এছাড়াও আমি জানতে চাই যদি আমি প্রতীকটি ব্যবহার করি +বা পার্থক্য কি *

model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1

3
+ কেবলমাত্র প্রধান প্রভাবগুলি গণনা করবে, * * এর সাথে সংযুক্ত ফ্যাক্টরের মধ্যে মিথস্ক্রিয়াটির অনুমান করবে। আনকোভা ফ্রেমওয়ার্কগুলি সাধারণত অবিচ্ছিন্ন ফ্যাক্টরের একটি প্রধান প্রভাব অনুমান করে তবে সমস্ত গোষ্ঠীযুক্ত উপাদানগুলির মধ্যে মিথস্ক্রিয়া।
রাসেলপিয়ের্স

উত্তর:


14

এর মূল সরঞ্জামটি হ'ল lm; নোট যে aovএকটি আবরণ জন্য lm

বিশেষত, যদি আপনার কিছু গ্রুপিং ভেরিয়েবল (ফ্যাক্টর), g এবং একটি অবিচ্ছিন্ন কোভারিয়েট x তবে মডেলটি y ~ x + gমূল প্রভাবগুলি আনকোভা মডেলের y ~ x * gসাথে খাপ খায়, যখন কোভারিয়েটের সাথে মিথস্ক্রিয়াকে অন্তর্ভুক্ত করে এমন একটি মডেল ফিট করে। aovএকই সূত্র গ্রহণ করবে।

বিশেষভাবে নজর দিতে Noteসহায়তার মধ্যে aov

হিসাবে +বনাম *, russellpierce প্রায় কাছাকাছি কভার এটা, কিন্তু আমি আপনি তাকান বলতে চাই ?lmএবং ?formulaএবং সবচেয়ে বিশেষত ম্যানুয়াল বিভাগে 11.1 আর পরিচিতি যে (অথবা আপনি অনলাইনে জানতে পারেন আর দিয়ে আসে যদি মূর্ত আউট না কিভাবে আছে আপনার কম্পিউটারে এটি সন্ধান করতে; খুব সহজেই এর মধ্যে আর বা আরস্টুডিও উভয়ের মধ্যে "সহায়তা" টান মেনু সন্ধান করা জড়িত)।


ধরা যাক, আমার দুটি গ্রুপ ফ্যাক্টর রয়েছে , এবং দুটি কোভেরিয়েট x 1 , x 2 , আমার মডেলটি y i j = μ + α i + η j + x i j 1 γ 1 + x i j 2 γ 2 + ϵ i j y ~ g_1 + g_2 + x_1 + x_2 একই কৌশল করে? X_1 এবং x_2 পরীক্ষার বিপরীতে প্রাপ্ত F মানগুলি করুন γ 1 = 0 এবং γ γ1,2এক্স1,এক্স2
Yআমি=μ+ +αআমি+ +η+ +এক্সআমি1γ1+ +এক্সআমি2γ2+ +εআমি
γ1=0 যথাক্রমে? γ2=0
সায়ান

আমি কীভাবে এটি মিস করেছি তা নিশ্চিত নয়। হ্যাঁ. .... এবং আপনি যদি একবারে উভয়ই পরীক্ষা করতে চান তবে তাদের সাথে এবং ছাড়া উভয়ই ফিট করুন এবং লাগানো এলএম অবজেক্টগুলিতে পাস করুন anova(আপনি শীঘ্রই দেখতে পাবেন যে আপনি সেগুলিকে ভুল ক্রমে দিচ্ছেন কিনা কারণ কিছু এসএস যদি নেতিবাচক হয় তবে )
গ্লেন_বি -রিনস্টেট মনিকা

10

আমি ফিল্ড বাই আর ব্যবহার করে পরিসংখ্যান আবিষ্কারের পড়ার এবং পড়ার পরামর্শ দিচ্ছি । আনকোভাতে তাঁর একটি চমৎকার বিভাগ রয়েছে।

আর-তে আনকোভা চালাতে নিম্নলিখিত প্যাকেজগুলি লোড করুন:

car
compute.es
effects
ggplot2
multcomp
pastecs
WRS

আপনি যদি ব্যবহার করছেন lmবা aov(আমি ব্যবহার করি aov) তা নিশ্চিত করে নিন যে আপনি aovবা করার আগে "বিপরীতে" ফাংশন ব্যবহার করে বৈসাদৃশ্যগুলি সেট করেছেন lm। আর ডি-ডিফল্ট হিসাবে অ-orthogonal বিপরীতে ব্যবহার করে যা একটি ANCOVA- এ সমস্ত কিছু গোলমাল করতে পারে। আপনি যদি অर्थোগোনাল বৈসাদৃশ্যগুলি সেট করতে চান তবে:

contrasts(dataname$factorvariable)=contr.poly(# of levels, i.e. 3) 

তারপরে আপনার মডেলটি চালান

model.1=aov(dv~covariate+factorvariable, data=dataname)

মডেল ব্যবহার দেখতে:

Anova(model.1, type="III") 

নিশ্চিত করুন যে আপনি Anovaএখানে মূলধন "এ" ব্যবহার করেছেন এবং না anova। এটি তৃতীয় এসএস টাইপ ব্যবহার করে ফলাফল দেবে।

summary.lm(model.1)আর একটি সংক্ষিপ্তসার দেবে এবং এতে আর-বর্গ অন্তর্ভুক্ত থাকবে। আউটপুট।

posth=glht(model.1, linfct=mcp(factorvariable="Tukey"))  ##gives the post-hoc Tukey analysis
summary(posth) ##shows the output in a nice format.

আপনি যদি রিগ্রেশন opালুগুলির একজাততার জন্য পরীক্ষা করতে চান তবে আপনি IV এবং covariate এর জন্য একটি মিথস্ক্রিয়া শব্দও অন্তর্ভুক্ত করতে পারেন। এটি হবে:

model=aov(dv~covariate+IV+covariate:IV, data=dataname)

যদি ইন্টারঅ্যাকশন শব্দটি তাৎপর্যপূর্ণ হয় তবে আপনার একজাতীয়তা নেই।


নন-অर्थোগোনাল কেন বিপর্যস্ত সব কিছু নিয়ে যায়?
টিনথিনথং

1
"নন-অরথোগোনাল সবকিছুকে কীভাবে বিশৃঙ্খলা করে" এই বিষয়ে উপরের প্রশ্নের উত্তর দেওয়ার জন্য। উত্তরটি হ'ল অ-অर्थোগোনাল (অর্থাত্ পার্থক্যের মধ্যে পার্থক্য) এর জন্য আর ডিফল্ট যা আপনি প্রতিটি চতুর্থের অবদান আলাদাভাবে দেখতে চাইলে সমস্যা সৃষ্টি করতে পারে। যখন আমরা অर्थোগোনাল বিপরীতে উল্লেখ করি তখন আমরা আরকে বলি যে আমরা চাই চতুর্থ শ্রেণির এসএস সম্পূর্ণ বিভাজন এবং অ-ওভারল্যাপিংয়ের জন্য। এইভাবে আমরা প্রতিটি পূর্বাভাসকারীকে পরিষ্কার এবং পরিষ্কারভাবে চিহ্নিত করা তারতম্যটি দেখতে পাচ্ছি। আপনি যদি নির্দিষ্ট না করেন তবে আর বিপরীতে আরও উদার পদ্ধতির কাছে ডিফল্ট হয়।

2
তৃতীয় এসএস টাইপের আগ্রহ কেন?
ফ্র্যাঙ্ক হ্যারেল 16

4

@ বুটারোভিচ প্রস্তাবিত পদ্ধতির একটি পরিপূরক ডকুমেন্টেশন http://goo.gl/yxUZ1R এখানে । এছাড়াও, আমার পর্যবেক্ষণটি হ'ল যখন কোভারিয়েট বাইনারি হয়, তখন সারাংশ (lm.object) ব্যবহার করে আনোভা (lm.object, টাইপ = "III") উত্পন্ন হিসাবে একই আইভি অনুমান দেয়।


1
এটি কোনও উত্তর বলে মনে করা হচ্ছে এটি পরিষ্কার নয়। তাই কি? যদি তা হয় তবে দয়া করে স্পষ্ট করতে সম্পাদনা করুন। যদি এটি কোনও প্রশ্ন হয় তবে দয়া ASK QUESTIONকরে উপরে ক্লিক করে ও এটি জিজ্ঞাসা করে জিজ্ঞাসা করুন। তাহলে আমরা আপনাকে সঠিকভাবে সহায়তা করতে পারি।
গুং - মনিকা পুনরায়

একমত। বার্তাটি পূর্বের উত্তরটির পরিপূরক হিসাবে পরিমার্জন করা হয়েছে।
XX

3

আমরা মডেলগুলি তৈরি করতে রিগ্রেশন বিশ্লেষণ ব্যবহার করি যা প্রতিক্রিয়াশীল ভেরিয়েবলের প্রেডেক্টর ভেরিয়েবলের পরিবর্তনের প্রভাব বর্ণনা করে। কখনও কখনও যদি আমাদের কাছে হ্যাঁ / না বা পুরুষ / মহিলা ইত্যাদির মান সহ শ্রেণীবদ্ধ ভেরিয়েবল থাকে তবে সাধারণ রিগ্রেশন বিশ্লেষণ শ্রেণীবদ্ধ ভেরিয়েবলের প্রতিটি মানের জন্য একাধিক ফলাফল দেয়। এই জাতীয় দৃশ্যে, আমরা ভবিষ্যদ্বাণীকারী ভেরিয়েবলের সাথে ব্যবহার করে এবং শ্রেণিবদ্ধ ভেরিয়েবলের প্রতিটি স্তরের জন্য রিগ্রেশন লাইনের তুলনা করে শ্রেণীবদ্ধ ভেরিয়েবলের প্রভাব অধ্যয়ন করতে পারি। এ জাতীয় বিশ্লেষণকে কোভারিয়েন্সের অ্যানালাইসিস বলা হয় যা তাকে এনকোভা নামেও ডাকা হয়।

উদাহরণ অন্তর্নির্মিত ডেটা সেটটি
বিবেচনা করুন । এটিতে আমরা পর্যবেক্ষণ করি যে ক্ষেত্রটি সংক্রমণ প্রকারের (অটো বা ম্যানুয়াল) প্রতিনিধিত্ব করে। এটি 0 এবং 1 এর মানগুলির সাথে একটি বিভক্ত পরিবর্তনশীল যা কোনও গাড়ির গ্যালন মান ( ) প্রতি মাইল মাইল এছাড়াও ঘোড়ার শক্তি ( ) এর মান ছাড়াও এটির উপর নির্ভর করতে পারে । আমরা এবং এর মধ্যে রিগ্রেশনটির মানটির প্রভাবটি অধ্যয়ন করি । এটি অনুসরণ করে ফাংশনটি ব্যবহার করে করা হয়Rmtcarsammpghpammpghpaov()anova()একাধিক রিগ্রেশনগুলির সাথে তুলনা করার জন্য ।

ইনপুট ডেটা
ক্ষেত্র ধারণকারী একটি ডাটা ফ্রেম তৈরি করুন mpg, hpএবং amডেটা সেট থেকে mtcars। এখানে আমরা mpgপ্রতিক্রিয়াশীল ভেরিয়েবল hpহিসাবে, ভবিষ্যদ্বাণীকারী ভেরিয়েবল amহিসাবে এবং শ্রেণিবদ্ধ ভেরিয়েবল হিসাবে গ্রহণ করি।

input <- mtcars[,c("am","mpg","hp")]
head(input)

যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:

                  am  mpg  hp
Mazda RX4          1 21.0 110
Mazda RX4 Wag      1 21.0 110
Datsun 710         1 22.8  93
Hornet 4 Drive     0 21.4 110
Hornet Sportabout  0 18.7 175
Valiant            0 18.1 105

ANCOVA বিশ্লেষণ
আমরা একটি রিগ্রেশন মডেল গ্রহণ তৈরি hppredictor পরিবর্তনশীল এবং mpgপ্রতিক্রিয়া পরিবর্তনশীল মধ্যে পারস্পরিক কথোপকথন একাউন্টে গ্রহণ যেমন amএবং hp

শ্রেণীবদ্ধ ভেরিয়েবল এবং প্রিডেক্টর ভেরিয়েবলের মধ্যে মিথস্ক্রিয়া সহ মডেল

রিগ্রেশন মডেল 1 তৈরি করুন

result1 <- aov(mpg~hp*am,data=mtcars)
summary(result1)

যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:

            Df Sum Sq Mean Sq F value   Pr(>F)    
hp           1  678.4   678.4  77.391 1.50e-09 ***
am           1  202.2   202.2  23.072 4.75e-05 ***
hp:am        1    0.0     0.0   0.001    0.981    
Residuals   28  245.4     8.8                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

এই ফলাফলটি দেখায় যে উভয় ক্ষেত্রে পি-মান 0.05 এর চেয়ে কম হওয়ায় উভয় ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের গ্যালন প্রতি মাইলের উপর উল্লেখযোগ্য প্রভাব রয়েছে। তবে এই দুটি ভেরিয়েবলের মধ্যে মিথস্ক্রিয়াটি উল্লেখযোগ্য নয় কারণ পি-মান 0.05 এর বেশি।

শ্রেণীবদ্ধ ভেরিয়েবল এবং প্রিডেক্টর ভেরিয়েবলের মধ্যে মিথস্ক্রিয়া ছাড়াই মডেল

রিগ্রেশন মডেল 2 তৈরি করুন

result2 <- aov(mpg~hp+am,data=mtcars)
summary(result2)

যখন আমরা উপরের কোডটি কার্যকর করি তখন এটি নিম্নলিখিত ফলাফল উত্পন্ন করে:

            Df Sum Sq Mean Sq F value   Pr(>F)    
hp           1  678.4   678.4   80.15 7.63e-10 ***
am           1  202.2   202.2   23.89 3.46e-05 ***
Residuals   29  245.4     8.5                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

এই ফলাফলটি দেখায় যে উভয় ক্ষেত্রে পি-মান 0.05 এর চেয়ে কম হওয়ায় উভয় ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের গ্যালন প্রতি মাইলের উপর উল্লেখযোগ্য প্রভাব রয়েছে।

দুটি মডেলের তুলনা করা
এখন আমরা দুটি মডেলের তুলনা করতে পারব যদি ভেরিয়েবলের মিথস্ক্রিয়া সত্যই তুচ্ছ হয়। এর জন্য আমরা anova()ফাংশনটি ব্যবহার করি ।

 anova(result1,result2)

 Model 1: mpg ~ hp * am
 Model 2: mpg ~ hp + am
   Res.Df    RSS Df  Sum of Sq     F Pr(>F)
 1     28 245.43                           
 2     29 245.44 -1 -0.0052515 6e-04 0.9806

পি-মান 0.05 এর চেয়ে বেশি হওয়ায় আমরা উপসংহারে পৌঁছলাম যে ঘোড়ার শক্তি এবং সংক্রমণ প্রকারের মধ্যে মিথস্ক্রিয়া গুরুত্বপূর্ণ নয়। সুতরাং গ্যালন প্রতি মাইলেজ অটো এবং ম্যানুয়াল উভয় সংক্রমণ মোডে গাড়ির ঘোড়া শক্তির উপর একইভাবে নির্ভর করবে।


সুতরাং যা প্রথম এসেছিল, এই উত্তর বা এই পোস্ট টিউটোরিয়াল পয়েন্ট? tutorialspPoint.com/r/r_analysis_of_covariance.htm । এই উত্তর চুরি করা উচিত? বা টিউটোরিয়ালগুলি এখান থেকে কেবল অনুলিপি করেছে?
জন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.