আমি কীভাবে একটি লিনিয়ার মডেলটিতে স্থানিক সমবায় জন্য অ্যাকাউন্ট করতে পারি?


10

পটভূমি

আমার কাছে একটি ফিল্ড স্টাডি থেকে ডেটা রয়েছে যেখানে চারটি চিকিত্সার স্তর রয়েছে এবং দুটি ব্লকের প্রত্যেকটিতে ছয়টি প্রতিলিপি রয়েছে। (4x6x2 = 48 পর্যবেক্ষণ)

ব্লকগুলি প্রায় 1 মাইল দূরে, এবং ব্লকগুলির মধ্যে, 42, 2 মি x 4 মি প্লটের গ্রিড এবং 1 মি প্রশস্ত ওয়াকওয়ে রয়েছে; আমার গবেষণায় প্রতিটি ব্লকে 24 টি প্লট ব্যবহৃত হয়েছিল।

আমি স্থানিক covariance মূল্যায়ন মূল্যায়ন করতে চাই।

স্থানীয় একাকীত্বের জন্য অ্যাকাউন্টিং না করে একক ব্লক থেকে ডেটা ব্যবহার করে এখানে বিশ্লেষণের উদাহরণ রয়েছে। ডেটাসেটে, plotপ্লটের আইডি xহ'ল x অবস্থান এবং y1, 0, 0 তে কেন্দ্রিক 1 প্লট সমেত প্রতিটি প্লটের y অবস্থান levelচিকিত্সা স্তর এবং responseপ্রতিক্রিয়ার পরিবর্তনশীল।

layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L, 
17L, 18L, 22L, 23L, 26L, 28L, 30L, 31L, 32L, 35L, 36L, 37L, 39L, 
40L, 42L), level = c(0L, 10L, 1L, 4L, 10L, 0L, 4L, 10L, 0L, 4L, 
0L, 1L, 0L, 10L, 1L, 10L, 4L, 4L, 1L, 1L, 1L, 0L, 10L, 4L), response = c(5.93, 
5.16, 5.42, 5.11, 5.46, 5.44, 5.78, 5.44, 5.15, 5.16, 5.17, 5.82, 
5.75, 4.48, 5.25, 5.49, 4.74, 4.09, 5.93, 5.91, 5.15, 4.5, 4.82, 
5.84), x = c(0, 0, 0, 3, 3, 3, 3, 6, 6, 6, 6, 9, 9, 12, 12, 12, 
15, 15, 15, 15, 18, 18, 18, 18), y = c(0, 10, 20, 0, 5, 20, 25, 
10, 15, 20, 25, 15, 20, 0, 15, 25, 0, 5, 20, 25, 0, 10, 20, 
25)), .Names = c("plot", "level", "response", "x", "y"), row.names = c(NA, 
-24L), class = "data.frame")

model <- lm(response ~ level, data = layout)      
summary(model)

প্রশ্নাবলি

  1. আমি কীভাবে কোনও সমবায় ম্যাট্রিক্স গণনা করতে পারি এবং এটিকে আমার নিগ্রহের মধ্যে অন্তর্ভুক্ত করতে পারি?
  2. ব্লকগুলি খুব আলাদা, এবং শক্তিশালী চিকিত্সা রয়েছে * ব্লক ইন্টারঅ্যাকশন। এগুলি আলাদা করে বিশ্লেষণ করা কি উপযুক্ত?

1
প্লট 37 এবং 39 উভয়ই x = 18, y = 10 এ রয়েছে। ভুল টাইপ করেছেন?
অ্যারন

@ অ্যারন এটি নির্দেশ করার জন্য আপনাকে ধন্যবাদ। y = [0,10]। সংশোধন করা হয়েছে।
ডেভিড লেবাউয়ার 16:51

উত্তর:


10

1) আপনি nlmeগ্রন্থাগারের সাথে স্থানিক পারস্পরিক সম্পর্ক মডেল করতে পারেন ; বেশ কয়েকটি সম্ভাব্য মডেল আপনি বেছে নিতে পারেন। পিনহিরো / বেটসের 260-266 পৃষ্ঠা দেখুন।

পারস্পরিক সম্পর্ক দূরত্বের উপর নির্ভর করে কীভাবে তা দেখার জন্য একটি ভাল প্রথম পদক্ষেপ।

library(nlme)
m0 <- gls(response ~ level, data = layout)  
plot(Variogram(m0, form=~x+y))

এখানে নমুনা সেমিভারিওগ্রাম দূরত্বের সাথে বৃদ্ধি পায় তা দেখায় যে পর্যবেক্ষণগুলি সত্যই স্থানিকভাবে সম্পর্কিত।

পারস্পরিক সম্পর্ক কাঠামোর জন্য একটি বিকল্প একটি গোলাকার কাঠামো; এটি নিম্নলিখিত উপায়ে মডেল করা যেতে পারে।

m1 <- update(m0, corr=corSpher(c(15, 0.25), form=~x+y, nugget=TRUE))

এই মডেলটি কোনও পারস্পরিক সম্পর্ক কাঠামোযুক্ত মডেলের চেয়ে ভাল ফিট করে বলে মনে হচ্ছে, যদিও এটি সম্পূর্ণভাবে সম্ভব এটি অন্য সম্ভাব্য পারস্পরিক সম্পর্কের কাঠামোর একটিতেও উন্নত হতে পারে।

> anova(m0, m1)
   Model df     AIC      BIC    logLik   Test  L.Ratio p-value
m0     1  3 46.5297 49.80283 -20.26485                        
m1     2  5 43.3244 48.77961 -16.66220 1 vs 2 7.205301  0.0273

2) আপনি মডেল সহ xএবং yসরাসরি চেষ্টা করতে পারেন ; পারস্পরিক সম্পর্কের প্যাটার্নটি কেবল দূরত্বের চেয়ে বেশি নির্ভর করে যদি এটি উপযুক্ত হতে পারে। আপনার ক্ষেত্রে (sesqu এর ছবিগুলি দেখে) মনে হচ্ছে যে এই ব্লকের জন্য যাইহোক, আপনার একটি তির্যক প্যাটার্ন থাকতে পারে।

এখানে আমি এম 0 এর পরিবর্তে মূল মডেলটি আপডেট করছি কারণ আমি কেবল স্থির প্রভাবগুলিই পরিবর্তন করছি, তাই মডেলগুলি উভয়ই সর্বাধিক সম্ভাবনা ব্যবহার করে ফিট হওয়া উচিত।

> model2 <- update(model, .~.+x*y)
> anova(model, model2)
Analysis of Variance Table

Model 1: response ~ level
Model 2: response ~ level + x + y + x:y
  Res.Df    RSS Df Sum of Sq      F   Pr(>F)   
1     22 5.3809                                
2     19 2.7268  3    2.6541 6.1646 0.004168 **

তিনটি মডেলের তুলনা করতে আপনাকে glsআরএএমএল-এর ডিফল্ট পদ্ধতির পরিবর্তে তাদের সমস্তটি এবং সর্বাধিক সম্ভাবনার পদ্ধতির সাথে ফিট করতে হবে ।

> m0b <- update(m0, method="ML")
> m1b <- update(m1, method="ML")
> m2b <- update(m0b, .~x*y)
> anova(m0b, m1b, m2b, test=FALSE)
    Model df      AIC      BIC     logLik
m0b     1  3 38.22422 41.75838 -16.112112
m1b     2  5 35.88922 41.77949 -12.944610
m2b     3  5 29.09821 34.98847  -9.549103

মনে রাখবেন যে বিশেষত আপনার অধ্যয়নের জ্ঞান দিয়ে আপনি এমন একটি মডেল নিয়ে আসতে সক্ষম হতে পারেন যা এর যে কোনওটির চেয়ে ভাল। যে, মডেল m2bঅগত্যা এখনও সেরা হিসাবে বিবেচনা করা উচিত নয়।

দ্রষ্টব্য: এই গণনাগুলি 37 থেকে 0 এর প্লটের এক্স-মান পরিবর্তন করার পরে সম্পাদিত হয়েছিল।


আপনার সহায়ক উত্তরের জন্য ধন্যবাদ; এটি স্পষ্ট নয় যে আপনি দ্বিতীয় ভাগে যেমন modelপরিবর্তে আপডেট করেছেন m0m2 <- update(m0, .~.+x*y)যাতে তিনটি মডেল ব্যবহার করে তুলনা করা যায় anova(m0,m1,m2); এটি করার পরে, m2এটি একটি বড় আলগা (এআইসি = 64) মনে হচ্ছে আপনার অংশ
ডেভিড লেবউয়ার

পিএস শেষ লাইনটি 'প্লটের 37 এর 5 এর মান পরিবর্তন করার পরে' হওয়া উচিত; আসল মান 0, তবে ফলাফল সমান।
ডেভিড লেবাউর

যদি আপনি তুলনা করেন m0, m1এবং m2আপনার পরামর্শ হিসাবে আপনি সতর্কতাটি পেয়েছেন: Fitted objects with different fixed effects. REML comparisons are not meaningful. স্থির প্রতিক্রিয়াগুলির তুলনা করতে আপনাকে আরএমএল এর পরিবর্তে নিয়মিত সর্বাধিক সম্ভাবনা ব্যবহার করতে হবে। সম্পাদনা দেখুন।
অ্যারন

আপনার সকল সাহায্যের জন্য আপনাকে ধন্যবাদ. আমি কেন তা নিশ্চিত নই, তবে আমি যখন অন্য পারস্পরিক সম্পর্ক কাঠামোর সাথে ফিট করার চেষ্টা করি তখন আমি ত্রুটিগুলি পাচ্ছি, যেমন পিনহিরো এবং বেটসের উদাহরণ হিসাবে করপেট ব্যবহার করে। আমি এই ত্রুটিটি সম্পর্কে এসও তে একটি প্রশ্ন খুলেছি , তবে আপনার ইনপুটটি প্রশংসিত হবে।
ডেভিড লেবাউর

4

1) আপনার স্থানিক ব্যাখ্যা পরিবর্তনশীল কি? দেখে মনে হচ্ছে যে এক্স * ওয়াই প্লেনটি স্থানিক প্রভাবের জন্য একটি দরিদ্র মডেল হবে।

চিকিত্সা এবং প্রতিক্রিয়া প্লট

i=c(1,3,5,7,8,11,14,15,16,17,18,22,23,25,28,30,31,32,35,36,39,39,41,42)
l=rep(NA,42)[i];l[i]=level
r=rep(NA,42)[i];r[i]=response
image(t(matrix(-l,6)));title("treatment")
image(t(matrix(-r,6)));title("response")

২) ব্লকগুলি কীভাবে 1 মাইল দূরে রয়েছে এবং আপনি কেবল 30 মিটারের জন্য প্রভাব দেখতে পাচ্ছেন তা দেখে, আমি বলব এটি পৃথকভাবে বিশ্লেষণ করা সম্পূর্ণ উপযুক্ত।


ভিজ্যুয়ালাইজেশন সহায়ক, তবে আপনি যদি চিত্রের উপরের ডানদিকে নীচের ডানদিকে তুলনা করেন, তবে আমার কাছে মনে হয় যে অবস্থানটি স্তরটির চেয়ে শক্তিশালী প্রভাব ফেলে। (PS আমি মনে করি l [i] = প্রতিক্রিয়া হওয়া উচিত r [i] = ...)
ডেভিড লেবাউয়ার 15:48

হ্যাঁ. অবস্থানের প্রভাব লক্ষণীয়, এবং তাই আপনি চিকিত্সার প্রভাবগুলি অনুমান করা শুরু করার আগে আপনি তার জন্য সত্যিই একটি ভাল মডেল চান। দুর্ভাগ্যক্রমে, প্রচুর পরিমাণে অনুপস্থিত তথ্য রয়েছে তাই এটি কী হওয়া উচিত তা বলা শক্ত - প্রতিবেশীর প্রতিক্রিয়া + এলোমেলো উপাদানগুলির গড় হিসাবে আমি যে মডেলিংয়ের অবস্থানের প্রভাবটি গড়ে উঠতে পারি তা হ'ল এবং তারপরে চিকিত্সা চেষ্টা করে যাচ্ছি । এটি খুব সন্দেহজনক, সুতরাং কোনও অতিরিক্ত ডোমেন জ্ঞান মূল্যবান হবে। টাইপো স্থির
sesqu

@ ডেস্ক ... কোনও অনুপস্থিত ডেটা নেই, এলোমেলোভাবে অবস্থিত 24 টি প্লট থেকে ডেটা রয়েছে।
ডেভিড লেবাউর

এই অর্থে এমন তথ্য নেই যা প্রতি x, y জোড়ের ডেটা থাকে না।
অ্যারন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.