একাধিক পৃষ্ঠের যোগাযোগের পরে ব্যাকটিরিয়া আঙুলগুলিতে উঠেছে: অ-স্বাভাবিক তথ্য, পুনরাবৃত্তি ব্যবস্থা, অংশগ্রহণকারীদের অতিক্রম করে


9

ইন্ট্রো

আমার অংশগ্রহণকারীরা যারা বারবার E. কলির সাথে দূষিত পৃষ্ঠগুলিকে দুটি শর্তে স্পর্শ করছেন ( = গ্লাভস পরেছেন, বি = কোনও গ্লোভ নেই)। আমি জানতে চাই যে তাদের গ্লাভসের সাথে এবং ছাড়াও তাদের আঙুলের নখের ব্যাকটেরিয়ার পরিমাণের মধ্যেও যোগাযোগের সংখ্যার মধ্যে পার্থক্য রয়েছে কিনা। উভয় উপাদান অংশগ্রহণকারী মধ্যে।

পরীক্ষামূলক পদ্ধতি:

অংশগ্রহণকারীরা (n = 35) সর্বোচ্চ 8 টি পরিচিতির জন্য একই আঙুল দিয়ে একবারে প্রতিটি বর্গ স্পর্শ করুন (চিত্র দেখুন)। ক) আটটি পৃষ্ঠের সাথে আঙুলের যোগাযোগগুলি, খ) প্রতিটি পৃষ্ঠের যোগাযোগের পরে আঙ্গুলগুলিতে সিএফইউ

আমি তারপরে অংশগ্রহণকারীটির আঙুলটি সোয়াব করি এবং প্রতিটি যোগাযোগের পরে আঙুলের নখের ব্যাকটেরিয়াগুলি পরিমাপ করি। এরপরে তারা 1 থেকে 8 টি পরিচিতি পর্যন্ত বিভিন্ন সংখ্যক পৃষ্ঠের স্পর্শ করতে একটি নতুন আঙুল ব্যবহার করে (চিত্র দেখুন খ)।

এখানে আসল তথ্য: বাস্তব তথ্য

ডেটাটি স্বাভাবিক নয় তাই নীচে নীচে ব্যাকটেরিয়া | নাম্বার যোগাযোগের প্রান্তিক বিতরণ দেখুন। এক্স = ব্যাকটেরিয়া। প্রতিটি দিকটি যোগাযোগের একটি পৃথক সংখ্যা।

এখানে চিত্র বর্ণনা লিখুন

মডেল

Lme4 :: গ্যামার (লিঙ্ক = "লগ") ব্যবহার করে অ্যামিবার পরামর্শের উপর ভিত্তি করে উজ্জ্বল থেকে চেষ্টা করে এবং নাম্বার যোগাযোগের জন্য বহুপদী:

cfug<-glmer(CFU ~ Gloves + poly(NumberContacts,2) + (-1+NumberContacts|Participant),
            data=(K,CFU<4E5),
           family=Gamma(link="log")
            )
plot(cfug)

বিশেষ দ্রষ্টব্য। গামা (লিঙ্ক = "বিপরীত") চলবে না বলে পিআরএলএসের ধাপ-অর্ধ বিচ্যুতি হ্রাস করতে ব্যর্থ হয়েছে।

ফলাফল:

সিফগের জন্য লাগানো বনাম অবশিষ্টাংশগুলি এখানে চিত্র বর্ণনা লিখুন

qqp (বাসিন্দাদের (cfug))

এখানে চিত্র বর্ণনা লিখুন

প্রশ্ন:

আমার glmer মডেল সঠিকভাবে প্রতিটি অংশগ্রহণকারী র্যান্ডম প্রভাব এবং সত্য যে সবাই উভয় পরীক্ষা করে নিগমবদ্ধ হিসেবে সংজ্ঞায়িত করা হয় একটি পরীক্ষা দ্বারা অনুসরণ বি ?

সংযোজন:

অংশগ্রহণকারীদের মধ্যে স্বতঃসংশ্লিষ্টতা বিদ্যমান বলে মনে হচ্ছে। এটি সম্ভবত কারণ একই দিনে তাদের পরীক্ষা করা হয়নি এবং সময়ের সাথে ব্যাকটেরিয়ার ফ্লাস্ক বৃদ্ধি এবং হ্রাস পেয়েছে। এটা কোন ব্যাপার?

এসিএফ (সিএফইউ, লেগ = 35) একজন অংশগ্রহণকারী এবং পরবর্তী অংশীদারের মধ্যে একটি গুরুত্বপূর্ণ পারস্পরিক সম্পর্ক দেখায়।

এখানে চিত্র বর্ণনা লিখুন


1
আপনি NumberContactsএকটি সংখ্যার ফ্যাক্টর হিসাবে ব্যবহার করতে পারেন এবং একটি চতুর্ভুজ / ঘনক বহুপদী পদ অন্তর্ভুক্ত করতে পারেন । বা জেনারালাইজড অ্যাডেটিভ মিশ্রিত মডেলগুলি দেখুন।
অ্যামিবা

1
@ অ্যামিবা আপনার সহায়তার জন্য আপনাকে ধন্যবাদ সমস্ত অংশগ্রহণকারীরা বি (অবলোভিত) এর পরে এ (গ্লোভড) করেছে। আপনি কি বিশ্লেষণে অন্যান্য মৌলিক সমস্যা আছে বলে মনে করেন? যদি তাই হয় তবে আমি আর কোনও উত্তরের জন্য উন্মুক্ত।
এইচসিএআই

1
যদি তা হয় তবে আপনি গ্লাভের এলোমেলো প্রভাব অন্তর্ভুক্ত করতে পারেন। এছাড়াও, আমি বুঝতে পারি না আপনি কেন এলোমেলো ইন্টারসেপ্ট সরিয়ে ফেলেন এবং কেন আপনি এলোমেলো অংশে পুরো ২ য় ডিগ্রি বহুবর্ষকে অন্তর্ভুক্ত করবেন না। এবং আপনার গ্লোভ * নাম্বার ইন্টারঅ্যাকশন থাকতে পারে। তাহলে কেন CFU ~ Gloves * poly(NumberContacts,2) + (Gloves * poly(NumberContacts,2) | Participant)বা এমন কিছু নয় ।
অ্যামিবা

1
ওহ, আমি ইন্টারসেপ্ট সম্পর্কে বুঝতে পারি, তবে তারপরে আপনাকেও স্থির ইন্টারসেপ্টটি দমন করতে হবে। এছাড়াও, শূন্য পরিচিতির জন্য আপনার শূন্য সিএফইউ থাকা উচিত, তবে লগ-লিঙ্কের সাথে এটি কোনও অর্থ দেয় না। এবং আপনার কাছে 1 টি পরিচিতিতে শূন্য সিএফইউয়ের কাছাকাছি আর নেই। তাই আমি ইন্টারসেপ্টটি দমন করব না । রূপান্তর না করা ভাল নয়, এলোমেলো অংশ থেকে মিথস্ক্রিয়াটি সরিয়ে দেওয়ার চেষ্টা করুন: CFU ~ Gloves * poly(NumberContacts,2) + (Gloves + poly(NumberContacts,2) | Participant)অথবা সেখান থেকে গ্লাভস সরিয়ে ফেলুন CFU ~ Gloves * poly(NumberContacts,2) + (poly(NumberContacts,2) | Participant)...
অ্যামিবা

1
আমি মনে করি Gloves * poly(NumberContacts,2) + (poly(NumberContacts,2) | Participant)এটি একটি সুন্দর শালীন মডেল।
অ্যামিবা

উত্তর:


6

ডেটা অন্বেষণ করতে কিছু প্লট

নীচে আটটি পৃষ্ঠার পরিচিতির প্রতিটি সংখ্যার জন্য একটি, জাই প্লটগুলি গ্লোভগুলি বনাম কোনও গ্লোভস দেখাচ্ছে showing

প্রতিটি ব্যক্তি একটি বিন্দু দিয়ে চক্রান্ত করা হয়। গড় এবং প্রকরণ এবং সমবায়তা একটি লাল বিন্দু এবং উপবৃত্ত (জনসংখ্যার 97.5% এর সাথে মিলিত মহালানোবিস দূরত্ব) দ্বারা নির্দেশিত হয়।

আপনি দেখতে পাচ্ছেন যে জনসংখ্যার বিস্তারের তুলনায় প্রভাবগুলি কেবলমাত্র কম। গড়টি 'কোনও গ্লাভস' এর জন্য উচ্চতর নয় এবং আরও তলদেশের পরিচিতিগুলির জন্য গড় কিছুটা বেশি উপরে পরিবর্তিত হবে (যা তাৎপর্যপূর্ণ হিসাবে দেখানো যেতে পারে)। তবে প্রভাবটি আকারে খুব সামান্যই (সামগ্রিকভাবে একটি লগ হ্রাস), এবং গ্লোভগুলির সাথে প্রকৃতপক্ষে উচ্চতর ব্যাকটিরিয়া রয়েছে এমন ব্যক্তিদের জন্য অনেক ব্যক্তি রয়েছেন ।14

ছোট পারস্পরিক সম্পর্কটি দেখায় যে প্রকৃতপক্ষে ব্যক্তিদের থেকে একটি এলোমেলো প্রভাব রয়েছে (যদি কোনও ব্যক্তির পক্ষ থেকে কোনও প্রভাব না আসে তবে জোড়যুক্ত গ্লাভস এবং কোনও গ্লোভের মধ্যে কোনও সম্পর্ক নেই)। তবে এটি কেবলমাত্র একটি ছোট প্রভাব এবং 'গ্লোভস' এবং 'নো গ্লোভস' এর জন্য কোনও ব্যক্তির বিভিন্ন র্যান্ডম এফেক্ট থাকতে পারে (যেমন সমস্ত ভিন্ন যোগাযোগের পয়েন্টের জন্য ব্যক্তি 'গ্লোভস' না 'গ্লোভস' এর চেয়ে ধারাবাহিকভাবে উচ্চ / নিম্ন গননা থাকতে পারে) ।

গ্লোভসের সাথে এবং ছাড়াই xy প্লট

প্লটের নীচে 35 জন ব্যক্তির প্রত্যেকের জন্য পৃথক প্লট রয়েছে। এই প্লটটির ধারণাটি হ'ল আচরণটি একজাতীয় কিনা এবং এটি কী ধরণের কার্যকারিতা উপযুক্ত বলে মনে হয় তাও দেখার জন্য।

মনে রাখবেন যে 'গ্লোভস ছাড়াই' লাল in বেশিরভাগ ক্ষেত্রে লাল রেখা বেশি, 'গ্লোভস ছাড়াই' ক্ষেত্রে আরও ব্যাকটিরিয়া থাকে।

আমি বিশ্বাস করি যে এখানে ট্রেন্ডগুলি ক্যাপচার করার জন্য একটি লিনিয়ার প্লট যথেষ্ট হওয়া উচিত। চতুষ্কোণ চক্রান্তের অসুবিধাটি হ'ল গুণাগুণগুলি ব্যাখ্যা করা আরও কঠিন হবে (directlyালটি ইতিবাচক বা নেতিবাচক কিনা আপনি সরাসরি দেখতে পাচ্ছেন না কারণ লিনিয়ার টার্ম এবং চতুর্ভুজ শব্দ দুটিই এর উপর প্রভাব ফেলে) on

তবে আরও গুরুত্বপূর্ণ আপনি দেখতে পাচ্ছেন যে প্রবণতাগুলি বিভিন্ন ব্যক্তিদের মধ্যে প্রচুর পরিমাণে পৃথক হয় এবং তাই কেবল বিরতি নয়, ব্যক্তির theালু ক্ষেত্রেও এলোমেলো প্রভাব যুক্ত করা কার্যকর হতে পারে।

প্রতিটি পৃথক জন্য প্লট

মডেল

নীচে মডেল সহ

  • প্রতিটি স্বতন্ত্র নিজস্ব বক্ররেখা লাগবে (রৈখিক সহগের জন্য এলোমেলো প্রভাব)।
  • মডেলটি লগ-ট্রান্সফর্মড ডেটা ব্যবহার করে এবং একটি নিয়মিত (গাউসিয়ান) লিনিয়ার মডেলের সাথে ফিট করে। মন্তব্যে অ্যামিবা উল্লেখ করেছেন যে লগ লিঙ্ক কোনও লগনারাল বিতরণের সাথে সম্পর্কিত নয়। তবে এটি ভিন্ন। থেকে ভিন্নyN(log(μ),σ2)log(y)N(μ,σ2)
  • ওজন প্রয়োগ করা হয় কারণ ডেটা হিটারোস্কেস্টাস্টিক। প্রকরণটি উচ্চ সংখ্যার দিকে আরও সংকীর্ণ। এটি সম্ভবত কারণ ব্যাকটিরিয়া গণনার কিছু সিলিং রয়েছে এবং তারতম্যটি বেশিরভাগ ক্ষেত্রে পৃষ্ঠ থেকে আঙুলের ব্যর্থ সংক্রমণ (= নিম্ন মানের সাথে সম্পর্কিত) ব্যর্থতার কারণে ঘটে। ৩৫ টি প্লটেও দেখুন। প্রধানত কয়েকটি ব্যক্তি রয়েছেন যার জন্য ভিন্নতা অন্যদের তুলনায় অনেক বেশি। (আমরা কিউকিউ প্লটগুলিতে আরও বড় লেজ, ওভারডিস্পেরেশনও দেখি)
  • কোনও বিরতি শব্দ ব্যবহার করা হয় না এবং একটি 'বিপরীতে' শব্দ যুক্ত করা হয়। সহগের ব্যাখ্যা করতে সহজ করার জন্য এটি করা হয়।

K    <- read.csv("~/Downloads/K.txt", sep="")
data <- K[K$Surface == 'P',]
Contactsnumber   <- data$NumberContacts
Contactscontrast <- data$NumberContacts * (1-2*(data$Gloves == 'U'))
data <- cbind(data, Contactsnumber, Contactscontrast)
m    <- lmer(log10CFU ~ 0 + Gloves + Contactsnumber + Contactscontrast + 
                        (0 + Gloves + Contactsnumber + Contactscontrast|Participant) ,
             data=data, weights = data$log10CFU)

এই দেয়

> summary(m)
Linear mixed model fit by REML ['lmerMod']
Formula: log10CFU ~ 0 + Gloves + Contactsnumber + Contactscontrast + (0 +  
    Gloves + Contactsnumber + Contactscontrast | Participant)
   Data: data
Weights: data$log10CFU

REML criterion at convergence: 180.8

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-3.0972 -0.5141  0.0500  0.5448  5.1193 

Random effects:
 Groups      Name             Variance  Std.Dev. Corr             
 Participant GlovesG          0.1242953 0.35256                   
             GlovesU          0.0542441 0.23290   0.03            
             Contactsnumber   0.0007191 0.02682  -0.60 -0.13      
             Contactscontrast 0.0009701 0.03115  -0.70  0.49  0.51
 Residual                     0.2496486 0.49965                   
Number of obs: 560, groups:  Participant, 35

Fixed effects:
                  Estimate Std. Error t value
GlovesG           4.203829   0.067646   62.14
GlovesU           4.363972   0.050226   86.89
Contactsnumber    0.043916   0.006308    6.96
Contactscontrast -0.007464   0.006854   -1.09

qqplot

অবশিষ্টাংশ

প্লট প্রাপ্ত করার কোড

কেমোমেট্রিক্স :: ড্রমহল ফাংশন

# editted from chemometrics::drawMahal
drawelipse <- function (x, center, covariance, quantile = c(0.975, 0.75, 0.5, 
                                              0.25), m = 1000, lwdcrit = 1, ...) 
{
  me <- center
  covm <- covariance
  cov.svd <- svd(covm, nv = 0)
  r <- cov.svd[["u"]] %*% diag(sqrt(cov.svd[["d"]]))
  alphamd <- sqrt(qchisq(quantile, 2))
  lalpha <- length(alphamd)
  for (j in 1:lalpha) {
    e1md <- cos(c(0:m)/m * 2 * pi) * alphamd[j]
    e2md <- sin(c(0:m)/m * 2 * pi) * alphamd[j]
    emd <- cbind(e1md, e2md)
    ttmd <- t(r %*% t(emd)) + rep(1, m + 1) %o% me
#    if (j == 1) {
#      xmax <- max(c(x[, 1], ttmd[, 1]))
#      xmin <- min(c(x[, 1], ttmd[, 1]))
#      ymax <- max(c(x[, 2], ttmd[, 2]))
#      ymin <- min(c(x[, 2], ttmd[, 2]))
#      plot(x, xlim = c(xmin, xmax), ylim = c(ymin, ymax), 
#           ...)
#    }
  }
  sdx <- sd(x[, 1])
  sdy <- sd(x[, 2])
  for (j in 2:lalpha) {
    e1md <- cos(c(0:m)/m * 2 * pi) * alphamd[j]
    e2md <- sin(c(0:m)/m * 2 * pi) * alphamd[j]
    emd <- cbind(e1md, e2md)
    ttmd <- t(r %*% t(emd)) + rep(1, m + 1) %o% me
#    lines(ttmd[, 1], ttmd[, 2], type = "l", col = 2)
    lines(ttmd[, 1], ttmd[, 2], type = "l", col = 1, lty=2)  #
  }
  j <- 1
  e1md <- cos(c(0:m)/m * 2 * pi) * alphamd[j]
  e2md <- sin(c(0:m)/m * 2 * pi) * alphamd[j]
  emd <- cbind(e1md, e2md)
  ttmd <- t(r %*% t(emd)) + rep(1, m + 1) %o% me
#  lines(ttmd[, 1], ttmd[, 2], type = "l", col = 1, lwd = lwdcrit)
  invisible()
}

5 এক্স 7 প্লট

#### getting data
K <- read.csv("~/Downloads/K.txt", sep="")

### plotting 35 individuals

par(mar=c(2.6,2.6,2.1,1.1))
layout(matrix(1:35,5))

for (i in 1:35) {
  # selecting data with gloves for i-th participant
  sel <- c(1:624)[(K$Participant==i) & (K$Surface == 'P') & (K$Gloves == 'G')]
      # plot data
  plot(K$NumberContacts[sel],log(K$CFU,10)[sel], col=1,
       xlab="",ylab="",ylim=c(3,6))
      # model and plot fit
  m <- lm(log(K$CFU[sel],10) ~ K$NumberContacts[sel])
  lines(K$NumberContacts[sel],predict(m), col=1)

  # selecting data without gloves for i-th participant 
  sel <- c(1:624)[(K$Participant==i) & (K$Surface == 'P') & (K$Gloves == 'U')]
     # plot data 
  points(K$NumberContacts[sel],log(K$CFU,10)[sel], col=2)
     # model and plot fit
  m <- lm(log(K$CFU[sel],10) ~ K$NumberContacts[sel])
  lines(K$NumberContacts[sel],predict(m), col=2)
  title(paste0("participant ",i))
}

2 এক্স 4 প্লট

#### plotting 8 treatments (number of contacts)

par(mar=c(5.1,4.1,4.1,2.1))
layout(matrix(1:8,2,byrow=1))

for (i in c(1:8)) {
  # plot canvas
  plot(c(3,6),c(3,6), xlim = c(3,6), ylim = c(3,6), type="l", lty=2, xlab='gloves', ylab='no gloves')

  # select points and plot
  sel1 <- c(1:624)[(K$NumberContacts==i) & (K$Surface == 'P') & (K$Gloves == 'G')]
  sel2 <- c(1:624)[(K$NumberContacts==i) & (K$Surface == 'P') & (K$Gloves == 'U')]
  points(K$log10CFU[sel1],K$log10CFU[sel2])

  title(paste0("contact ",i))

  # plot mean
  points(mean(K$log10CFU[sel1]),mean(K$log10CFU[sel2]),pch=21,col=1,bg=2)

  # plot elipse for mahalanobis distance
  dd <- cbind(K$log10CFU[sel1],K$log10CFU[sel2])
  drawelipse(dd,center=apply(dd,2,mean),
            covariance=cov(dd),
            quantile=0.975,col="blue",
            xlim = c(3,6), ylim = c(3,6), type="l", lty=2, xlab='gloves', ylab='no gloves')
}

আপনাকে অনেক ধন্যবাদ মার্তিজান, আপনি বিষয়গুলি এত স্পষ্টভাবে ব্যাখ্যা করেছেন। অ্যামেজিং! যেহেতু অনুগ্রহটি নির্ধারিত হওয়ার আগেই শেষ হয়েছিল, তাই আমি আপনাকে একটি আলাদা পরিমাণের অফার দিতে চাই (আমি এখন এটি কীভাবে করব তা দেখব)। যদিও আমার কিছু প্রশ্ন রয়েছে: প্রথমত, ডেটা রুপান্তরিত করে মনে হয় চিন্তার বিদ্যালয় রয়েছে: কেউ কেউ সম্মত হন এবং কিছু দৃ .়ভাবে একমত নন। কেন এখানে ঠিক আছে? দ্বিতীয়ত, কেন এলোমেলো ইন্টারসেপ্ট অপসারণ সহগের ব্যাখ্যা করতে সহজ করে?
এইচসিএআই

(২) আমি অনুমান করি যে রূপান্তরটি ঠিক আছে যখন আপনি তর্ক করতে পারেন যে রূপান্তরটি যৌক্তিক করে তোলে এমন একটি প্রক্রিয়া রয়েছে (ফলস্বরূপ অনিচ্ছাকৃতভাবে রূপান্তর করা কারণ এটি ফলাফলকে সুন্দর দেখায় এটি ডেটা ম্যানিপুলেশন এবং ভুল উপস্থাপক ফলাফল হিসাবে দেখা যায় পাশাপাশি অন্তর্নিহিতটি না পেয়ে থাকে মডেল)
সেক্সটাস এম্পেরিকাস

আমি @ মার্তিজন দেখছি, কমপক্ষে জীববিজ্ঞানে লগ 10 দ্বারা রূপান্তরিত করা ব্যাকটিরিয়ার পক্ষে সাধারণ। আমি অনুগ্রহ দিতে খুশি, আপনি এটি প্রাপ্য। আপনি কেন এই "বিপরীতে শব্দ" ব্যবহার করেন দয়া করে কিছুটা বিশদ বিবরণে আপত্তি করবেন?
এইচসিএআই

1
বৈসাদৃশ্য সম্পর্কে এখানে stats.stackexchange.com/a/308644/164061 দেখুন বিরতি শব্দটি প্রায় সরানোর আপনার স্বাধীনতা আছে। একটি সম্ভবত কার্যকর উপায় হ'ল দুটি বিভাগের মধ্যে ইন্টেরসেপ সেট করা এবং প্রভাবটিকে দুটি প্রভাবের মধ্যে পার্থক্য হতে দেওয়া (এর মধ্যে একটি ইতিবাচক অন্য ধনাত্মক হবে) যার অর্থ বিরতি শর্তের তুলনায়। (এমন নয় যে এর জন্য আমাকে একটি ভেরিয়েবল যুক্ত করতে হয়েছিল)
সেক্সটাস এম্পেরিকাস

1
আদর্শভাবে আপনার চিকিত্সাগুলি এলোমেলোভাবে সময়ের সাথে বিতরণ করা হবে যাতে সময়ের পরিবর্তনের কারণে যে কোনও সম্ভাব্য প্রভাব শেষ হয়ে যায়। তবে আমি আসলে এতটা স্বতঃসংশ্লিষ্টতা দেখি না। আপনি কি বোঝাতে চান যে অংশীদার 5 তে 5 থেকে 6 টি যোগাযোগের পরে লাইন আবার স্থিতিশীল হয়? আমি মনে করি যে এগুলি এতটা খারাপ নয় এবং সর্বাধিক শব্দ যোগ করে তবে আপনার পদ্ধতিতে হস্তক্ষেপ করবে না (সিগন্যাল / শব্দ কম করা বাদে)। আপনি যখন সময়ের সাথে নিয়মতান্ত্রিক পরিবর্তন দেখতে না পান তখন আপনি আরও নিশ্চিত হতে পারেন। আপনি যদি অংশগ্রহণকারীদের ক্রমক্রমে প্রক্রিয়া করেন তবে আপনি সময়ের সাথে সাথে তাদের গড় সিএফইউ প্লট করতে পারেন।
সেক্সটাস এম্পেরিকাস

2

প্রথমত, আপনার গ্রাফে ভাল কাজ; এটি ডেটার একটি পরিষ্কার প্রতিনিধিত্ব দেয়, সুতরাং আপনি ইতিমধ্যে পরিচিতির সংখ্যা এবং গ্লাভসের ব্যবহার বা অনুপস্থিতির উপর ভিত্তি করে ডেটাতে ধরণের ধরণটি দেখতে পারেন। এই গ্রাফটি দেখে, আমি মনে করি আপনি অংশগ্রহণকারীদের জন্য এলোমেলো প্রভাব সহ একটি বেসিক লগ-বহুবর্ষীয় মডেল দিয়ে ভাল ফলাফল পাবেন। আপনার চয়ন করা মডেলটি যুক্তিসঙ্গত দেখাচ্ছে তবে আপনি যোগাযোগের সংখ্যার জন্য চতুর্ভুজ শব্দটি যুক্ত করার বিষয়টিও বিবেচনা করতে পারেন।

আপনার মডেলটি ব্যবহার করবেন MASS:glmmPQLবা ব্যবহার করবেন কিনা তা সম্পর্কে lme4:glmerআমার বোধগম্যতা হ'ল এই দুটি ফাংশনই একই মডেলের সাথে মানানসই হবে (যতক্ষণ আপনি মডেল সমীকরণ, বিতরণ এবং লিঙ্ক ফাংশনটিকে একই সেট করেন) তবে তারা ফিট খুঁজে পেতে বিভিন্ন প্রাক্কলন পদ্ধতি ব্যবহার করে। আমার ভুল হতে পারে, তবে ডকুমেন্টেশন থেকে আমার বোঝা হ'ল ওল্ফিংগার এবং ও'কনেল (১৯৯৩) তেglmmPQL বর্ণিত দণ্ডিত পরিমাণের মতো সম্ভাবনা ব্যবহার করে , যেখানে গাউস-হার্মাইট চতুষ্পদ ব্যবহার করা হয়েছে। আপনি যদি উদ্বিগ্ন হন তবে আপনি উভয় পদ্ধতির সাথে আপনার মডেলকে ফিট করতে পারেন এবং পরীক্ষা করতে পারেন যে তারা একই গুণফলের অনুমান দেয় এবং এইভাবে আপনার আরও আত্মবিশ্বাস হবে যে ফিটিং অ্যালগরিদমটি সহগের সত্যিকারের এমএলইতে রূপান্তরিত হয়েছে।glmer


উচিত NumberContactsএকটি শ্রেণীগত ফ্যাক্টর হতে?

এই ভেরিয়েবলটির একটি প্রাকৃতিক ক্রম রয়েছে যা আপনার প্লট থেকে প্রতিক্রিয়ার ভেরিয়েবলের সাথে একটি সুসম্পর্কপূর্ণ সম্পর্ক হিসাবে উপস্থিত হয়, তাই আপনি যুক্তিসঙ্গতভাবে এটি একটি সংখ্যাসঙ্গিক হিসাবে পরিবর্তনশীল হিসাবে বিবেচনা করতে পারেন। আপনি যদি অন্তর্ভুক্ত হন factor(NumberContacts)তবে আপনি এর ফর্মকে সীমাবদ্ধ করবেন না এবং আপনি স্বাধীনতার অনেক ডিগ্রী হারাবেন না। এমনকি Gloves*factor(NumberContacts)অনেকগুলি ডিগ্রি অফ-স্বাধীনতা না হারিয়ে আপনি ইন্টারঅ্যাকশনটিও ব্যবহার করতে পারেন । যাইহোক, এটি একটি ফ্যাক্টর ভেরিয়েবল ব্যবহার করে ডেটা অতিরিক্ত-ফিট করে জড়িত কিনা তা বিবেচনা করার মতো। আপনার প্লটে মোটামুটি মসৃণ সম্পর্ক রয়েছে তা প্রদত্ত যে কোনও সাধারণ লিনিয়ার ফাংশন বা চতুর্ভুজটি অতিরিক্ত-ফিটনেস ছাড়াই ভাল ফলাফল পাবে।


কীভাবে আপনি Participantএলোমেলো পরিবর্তনশীল না করে এলোমেলো slাল তৈরি করেন?

আপনি ইতিমধ্যে লগারিদমিক লিঙ্ক ফাংশনটি ব্যবহার করে আপনার প্রতিক্রিয়া পরিবর্তনশীলটিকে একটি লগ-স্কেলে রেখেছেন, সুতরাং এর জন্য একটি ইন্টারসেপ্ট Participantইফেক্টটি প্রতিক্রিয়ার উপর একটি গুণকে প্রভাব দেয়। আপনি যদি NumberContactsএটির সাথে ইন্টারঅ্যাক্ট করে একটি এলোমেলো slাল দিই তবে প্রতিক্রিয়াটির উপর এটি একটি পাওয়ার-ভিত্তিক প্রভাব ফেলবে। আপনি যদি এটি চান তবে আপনি এটি পেতে পারেন (~ -1 + NumberContacts|Participant)যা দিয়ে বিরতি সরিয়ে ফেলবে তবে যোগাযোগের সংখ্যার ভিত্তিতে একটি slাল যুক্ত করবে।


আমার ডেটা রুপান্তর করার জন্য আমার কি বাক্স-কক্স ব্যবহার করা উচিত? (যেমন ল্যাম্বদা = 0.779)

যদি সন্দেহ হয় তবে এই রূপান্তরটি দিয়ে কোনও মডেলকে ফিট করার চেষ্টা করুন এবং দেখুন কীভাবে এটি যথাযথ সদ্ব্যবহারের পরিসংখ্যান ব্যবহার করে অন্যান্য মডেলগুলির সাথে তুলনা করে। আপনি যদি এই রূপান্তরটি ব্যবহার করতে যাচ্ছেন তবে পরামিতিটি একটি নিখরচায় প্যারামিটার হিসাবে রেখে দেওয়া ভাল এবং কোনও মান প্রাক-নির্দিষ্টকরণের চেয়ে এটি আপনার মডেলের অংশ হিসাবে অনুমান করা উচিত।λ


বৈচিত্রের জন্য আমার ওজন অন্তর্ভুক্ত করা উচিত?

ভিন্নধর্মীতার প্রমাণ আছে কিনা তা দেখতে আপনার অবশিষ্ট অবধি চক্রান্ত দেখে শুরু করুন। আপনি ইতিমধ্যে অন্তর্ভুক্ত প্লটগুলির উপর ভিত্তি করে এটি আমার কাছে দেখে মনে হচ্ছে এটি কোনও সমস্যা নয়, সুতরাং আপনার বৈকল্পিকতার জন্য কোনও ওজন যুক্ত করার দরকার নেই। যদি সন্দেহ হয় আপনি একটি সাধারণ লিনিয়ার ফাংশন ব্যবহার করে ওজন যুক্ত করতে পারেন এবং তারপরে ওজনটির opeাল সমতল কিনা তা দেখতে একটি পরিসংখ্যান পরীক্ষা করতে পারেন। এটি হেটেরোসেসটেস্টিটিটির একটি আনুষ্ঠানিক পরীক্ষার পরিমাণ হবে, যা আপনাকে আপনার পছন্দের জন্য কিছু ব্যাকআপ দেবে।


আমার কি স্বতঃসিদ্ধকরণ অন্তর্ভুক্ত করা উচিত NumberContacts?

যদি আপনি ইতিমধ্যে অংশগ্রহণকারীদের জন্য একটি এলোমেলো প্রভাব শব্দটি অন্তর্ভুক্ত করেন তবে যোগাযোগের সংখ্যার সাথে একটি স্বয়ংক্রিয়-সম্পর্কিত শব্দ যুক্ত করা সম্ভবত একটি খারাপ ধারণা হবে। আপনার পরীক্ষাটি বিভিন্ন সংখ্যক পরিচিতির জন্য একটি আলাদা আঙুল ব্যবহার করে যাতে আপনি ইতিমধ্যে অংশগ্রহীতাকে যে অ্যাকাউন্টটিতে রেখেছেন সেই ক্ষেত্রে স্বতঃসংশোধের আশা করবেন না। অংশগ্রহণকারী প্রভাব ছাড়াও একটি স্বতঃসংশোধন শব্দ যুক্ত করার অর্থ এই যে আপনি মনে করেন যে বিভিন্ন আঙ্গুলের ফলাফলের মধ্যে শর্তসাপেক্ষ নির্ভরতা রয়েছে, পরিচিতির সংখ্যার উপর ভিত্তি করে এমনকি কোনও প্রদত্ত অংশগ্রহণকারীকেও।


আপনার গ্রাফটি সম্পর্কগুলি দেখানোর ক্ষেত্রে ভাল তবে আপনি একটি শিরোনাম এবং সাবটাইটেল তথ্য যুক্ত করে এবং আরও ভাল অক্ষের লেবেল দিয়ে নান্দনিকভাবে এটি উন্নত করতে পারেন। আপনি আপনার কিংবদন্তিটিকে এর শিরোনামটি সরিয়ে এবং 'হ্যাঁ' থেকে 'গ্লোভস' এবং 'না' থেকে 'না গ্লোভস' এ পরিবর্তন করে সহজ করতে পারেন।


ধন্যবাদ, এটি একটি আশ্চর্যজনক উত্তর! শেষ পর্যন্ত আমি গামা (লিঙ্ক = "লগ") চেষ্টা করেছিলাম এবং অভিযোগটি ছাড়াই উজ্জ্বল রূপান্তরিত হয়েছে, হুররে! উজ্জ্বল (সিএফইউ ~ গ্লোভস + পলি (নাম্বার যোগাযোগ, 2) + (-1 + নাম্বার যোগাযোগ | অংশগ্রহণকারী), ডেটা = না.ওমিট (উপসেট (কে, সিএফইউ <4.5e5 এবং পৃষ্ঠ == "পি")), পরিবার = গামা ( লিঙ্ক = "লগ"))। কিউকিপ্লট আমার কাছে মনে হয় ঠিক আছে (সিআই এর বাইরে কিছু নেই) তবে লাগানো বনাম রেডিয়ুডালগুলি ফানেলিং করছে (এই মন্তব্যটি পোস্ট হওয়ার পরে এটি যোগ করা পিকটি মিলছে না তবে দেখুন) আমার কি খুব বেশি বিরক্ত হওয়া উচিত?
এইচসিএআই

1
কিউকিউ প্লটটি আমার কাছে দুর্দান্ত দেখাচ্ছে। এছাড়াও, মনে রাখবেন যে একটি জিএলএম-তে পিয়ারসন অবশিষ্টাংশগুলি অগত্যা একটি সাধারণ বিতরণ অনুসরণ করে না। দেখে মনে হচ্ছে আপনার ভাল বিশ্লেষণ হয়েছে।
বেন - মনিকা পুনরায় ইনস্টল

1

প্রকৃতপক্ষে, এটি যুক্তিযুক্ত যুক্তিসঙ্গত যে একটি অংশগ্রহীতার কাছ থেকে নেওয়া পরিমাপ অন্য অংশগ্রহীতার কাছ থেকে নেওয়া থেকে পৃথক নয়। উদাহরণস্বরূপ, কিছু লোক আরও বেশি (বা কম) বল দিয়ে তাদের আঙুলটি টিপতে পারে, যা প্রতিটি সংখ্যার পরিচিতি জুড়ে তাদের সমস্ত পরিমাপকে প্রভাবিত করে।

সুতরাং 2-উপায় পুনরাবৃত্তি-ব্যবস্থা ANOVA এক্ষেত্রে আবেদন করার জন্য একটি গ্রহণযোগ্য মডেল হবে।

বিকল্পভাবে, কেউ participantএলোমেলো উপাদান হিসাবে একটি মিশ্র-প্রভাব মডেল প্রয়োগ করতে পারে । এটি আরও উন্নত এবং আরও পরিশীলিত সমাধান।


আপনাকে ধন্যবাদ মাইকেল, আপনি চাপটি সম্পর্কে একদম ঠিক বলেছেন। হুম আমি এখানে মিক্সড-ইফেক্ট মডেল সম্পর্কে পড়ছিলাম rcompanion.org/handbook/I_09.html তবে মিথস্ক্রিয়া এবং নেস্টেড কারণগুলির বিষয়ে নিশ্চিত নই। আমার কারণগুলি বাসা বেঁধেছে?
এইচসিএআই

আমার এও উল্লেখ করা উচিত যে প্রতিটি যোগাযোগের জন্য ডেটা সাধারণত বিতরণ করা হয় না তাই পেনালাইজড কোয়াশি-সম্ভাবনা ( পিকিউএল ) মডেলিংয়ের দিকে নজর রেখেছেন : ase.tufts.edu/gsc/gradresferences/guidetomixedmodelsinr/… । আপনি কি মনে করেন এটি একটি ভাল পছন্দ?
এইচসিএআই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.