R এ lme4 এর সাথে মিশ্র ইফেক্ট মডেলগুলি বিশ্লেষণ করার কি এটি একটি গ্রহণযোগ্য উপায়?


14

বিশ্লেষণের জন্য আমার কাছে ভারসাম্যহীন পুনরাবৃত্তি ব্যবস্থা ডেটা রয়েছে এবং আমি পড়েছি যে বেশিরভাগ পরিসংখ্যান প্যাকেজগুলি এএনওওএর সাথে পরিচালনা করে (যেমন স্কোরের তৃতীয় সংখ্যার টাইপ) ভুল। অতএব, আমি এই ডেটাগুলি বিশ্লেষণ করতে একটি মিশ্র প্রভাবগুলির মডেলটি ব্যবহার করতে চাই। আমি মিশ্র মডেলগুলি সম্পর্কে অনেক কিছু পড়েছি R, তবে আমি এখনও খুব নতুন Rএবং মিশ্র ইফেক্টের মডেল এবং খুব আস্থা নেই যে আমি জিনিসগুলি সঠিকভাবে করছি am মনে রাখবেন যে আমি এখনও নিজেকে "" তিহ্যবাহী " পদ্ধতির সাথে পুরোপুরি বিবাহবিচ্ছেদ করতে পারি না এবং এখনও পি ভ্যালু এবং পোস্টের এইচ টেস্টের প্রয়োজন।

আমি জানতে চাই যে নীচের পদ্ধতির কোনও অর্থ হয় কিনা, বা আমি ভয়াবহভাবে কোনও ভুল করছি। আমার কোডটি এখানে:

# load packages
library(lme4)
library(languageR)
library(LMERConvenienceFunctions)
library(coda)
library(pbkrtest)

# import data
my.data <- read.csv("data.csv")

# create separate data frames for each DV & remove NAs
region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1))

# output summary of data
data.summary <- summary(region.data)

# fit model
# "time" is a factor with three levels ("t1", "t2", "t3")
region.lmer <- lmer(dv ~ time + (1|subject), data=region.data)

# check model assumptions
mcp.fnc(region.lmer)

# remove outliers (over 2.5 standard deviations)
rm.outliers <- romr.fnc(region.lmer, region.data, trim=2.5)
region.data <- rm.outliers$data
region.lmer <- update(region.lmer)

# re-check model assumptions
mcp.fnc(region.lmer)

# compare model to null model
region.lmer.null <- lmer(dv ~ 1 + (1|subject), data=region.data)
region.krtest <- KRmodcomp(region.lmer, region.lmer.null)

# output lmer summary
region.lmer.summary <- summary(region.lmer)

# run post hoc tests
t1.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)

region.lmer <- lmer(dv ~ relevel(time,ref="t2") + (1|subject), data=region.data)
t2.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)

region.lmer <- lmer(dv ~ relevel(time,ref="t3") + (1|subject), data=region.data)
t3.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)

# Get mcmc mean and 50/95% HPD confidence intervals for graphs
# repeated three times and stored in a matrix (not shown here for brevity)
as.numeric(t1.pvals$fixed$MCMCmean)
as.numeric(t1.pvals$fixed$HPD95lower)
as.numeric(t1.pvals$fixed$HPD95upper)
HPDinterval(as.mcmc(t1.pvals$mcmc),prob=0.5)
    HPDinterval(as.mcmc(t1.pvals$mcmc),prob=0.5)

আমার কাছে কিছু নির্দিষ্ট প্রশ্ন রয়েছে:

  1. এটি কি মিশ্র প্রভাবগুলির মডেলগুলি বিশ্লেষণের একটি কার্যকর উপায়? যদি তা না হয় তবে তার পরিবর্তে আমার কী করা উচিত।
  2. মডেল অনুমানগুলি যাচাই করার জন্য mcp.fnc দ্বারা সমালোচনা প্লট আউটপুট কি যথেষ্ট ভাল, বা আমার অতিরিক্ত পদক্ষেপ নেওয়া উচিত?
  3. আমি পেয়েছি যে মিশ্র মডেলগুলি বৈধ হওয়ার জন্য, ডেটাটির স্বাভাবিকতা এবং সমকামীতার সম্মান অনুমানগুলি প্রয়োজন। "আনুমানিক স্বাভাবিক" কী এবং এমসিপি.এফএনসি দ্বারা উত্পাদিত সমালোচনা প্লটগুলি দেখে কী হয় তা আমি কীভাবে বিচার করব? আমার কি কেবল এটির জন্য অনুভূতি অর্জন করা দরকার, না তাদের কাজ করার একটি নির্ধারিত পদ্ধতি? এই অনুমানের ক্ষেত্রে মজবুত মডেলগুলি কতটা শক্তিশালী?
  4. আমার নমুনায় থাকা বিষয়গুলির ~ 20 বৈশিষ্ট্য (বায়োমেকারস) এর জন্য আমার তিনটি সময় পয়েন্টের মধ্যে পার্থক্য মূল্যায়ন করতে হবে। প্রতিটি গ্রহণযোগ্যতার জন্য এতক্ষণ পৃথক মডেলগুলি ফিট এবং টেস্টিং করা যতক্ষণ না আমি সমস্ত গৃহীত পরীক্ষাগুলি রিপোর্ট করি (তা উল্লেখযোগ্য বা না), বা একাধিক তুলনার জন্য আমার কোনও ফর্ম সংশোধন প্রয়োজন।

পরীক্ষার ক্ষেত্রে আরও কিছুটা সুনির্দিষ্ট হওয়ার জন্য, এখানে আরও কিছু বিশদ দেওয়া হল। আমরা বেশ কয়েকজন অংশগ্রহণকারীকে অনুদৈর্ঘ্যভাবে অনুসরণ করেছি কারণ তারা একটি চিকিত্সা করেছেন। আমরা চিকিত্সা শুরুর আগে এবং পরে দুটি সময় পয়েন্টে বেশ কয়েকটি বায়োমারক পরিমাপ করেছি। আমি যেটি দেখতে চাই তা হ'ল যদি এই তিনটি পয়েন্টের মধ্যে এই বায়োমারকগুলির মধ্যে পার্থক্য থাকে।

আমি এই টিউটোরিয়ালে এখানে যা করছি তার বেশিরভাগ ভিত্তিই করছি , তবে আমার প্রয়োজনীয়তা এবং আমি যে জিনিসগুলি পড়েছি তার উপর ভিত্তি করে কিছু পরিবর্তন করেছি। আমি যে পরিবর্তনগুলি করেছি তা হ'ল:

  1. pvals.fnc (ভাষাআর প্যাকেজ থেকে) এর সাথে t1-t2, t2-t3, এবং t1-t3 তুলনা পেতে "সময়" ফ্যাক্টরটি পুনর্বিবেচনা করুন
  2. আমার মিশ্রিত মডেলটির তুলনা কেনোয়ার্ড-রজারের পদ্ধতির (পিবিক্রিটেস্ট প্যাকেজ ব্যবহার করে) সম্ভাব্য অনুপাতের পরীক্ষার পরিবর্তে আনুমানিক এফ-টেস্ট ব্যবহার করে নাল মডেলের সাথে তুলনা করুন (কারণ আমি পড়েছি যে কেনওয়ার্ড-রজারকে এখনই আরও ভাল বিবেচনা করা হচ্ছে)
  3. অনুমানগুলি যাচাই করতে এবং বহিরাগতদের অপসারণ করতে LMERConvenienceFuntions প্যাকেজটি ব্যবহার করুন (কারণ আমি পড়েছি যে মিশ্র মডেলগুলি বিদেশীদের প্রতি খুব সংবেদনশীল)

1
(+1) সুন্দরভাবে তৈরি (একাধিক) প্রশ্ন (গুলি)।
chl

উত্তর:


22

আপনার প্রশ্ন (গুলি) কিছুটা "বড়", সুতরাং আমি কিছু সাধারণ মন্তব্য এবং টিপস দিয়ে শুরু করব।

কিছু পটভূমি পঠন এবং দরকারী প্যাকেজ

আপনার সম্ভবত মিশ্র মডেলগুলি ব্যবহারের কয়েকটি টিউটোরিয়াল ভূমিকা সম্পর্কে একবার নজর দেওয়া উচিত, আমি বায়েন এট আল (২০০৮) দিয়ে শুরু করার পরামর্শ দেব - বায়ন এর লেখক languageR। বার এট আল (২০১৩) এলোমেলো প্রভাবগুলির কাঠামো নিয়ে কিছু সমস্যা নিয়ে আলোচনা করেছেন এবং বেন বলকার বর্তমান বিকাশকারীদের মধ্যে অন্যতম lme4। বায়েন এট আল আপনার প্রশ্নের পক্ষে বিশেষত ভাল কারণ তারা বুটস্ট্র্যাপিং / পারমিটেশন পরীক্ষার (পিছনের জিনিসগুলি mcp.fnc) ব্যবহারের বিষয়ে আলোচনা করতে অনেক সময় ব্যয় করে ।

সাহিত্য

ফ্লোরিয়ান জায়েজারের কাছে তার ল্যাবের ব্লগে মিশ্র মডেলগুলির ব্যবহারিক দিকটিতে প্রচুর স্টাফ রয়েছে ।

মিশ্র মডেলগুলির ভিজ্যুয়ালাইজ এবং পরীক্ষার জন্য বেশ কয়েকটি দরকারী আর প্যাকেজ রয়েছে, যেমন lmerTestএবং effectseffectsপ্যাকেজ বিশেষত চমৎকার কারণ এটি আপনাকে প্লটে বিভক্ত রৈখিক রিগ্রেশনের ও আস্থা অন্তর লোকচক্ষুর অন্তরালে চলছে করার সুযোগ দিচ্ছে।

ফিট এবং তুলনা মডেল এর সদল্য

পিlmerTest

anova()merχ2χ2পি- দুটি মডেলের সরাসরি তুলনা করার মান। এর নেতিবাচক দিকটি হ'ল এটি আপনার ফিট ফিট কতটা তত্ক্ষণাত্ পরিষ্কার নয় clear

টিsummary()|টি|>2fixef()

আপনার নিশ্চিত হওয়া উচিত যে আপনার কোনও স্থিরপ্রতিক্রিয়া খুব বেশি দৃ strongly়ভাবে সম্পর্কিত নয় - বহুবিধ লাইন মডেল অনুমানগুলি লঙ্ঘন করে। ফ্লোরিয়ান জায়েজার এ সম্পর্কে কিছুটা লিখেছেন , পাশাপাশি কয়েকটি সম্ভাব্য সমাধানও দিয়েছেন।

একাধিক তুলনা

আমি আপনার প্রশ্ন # 4 আরও কিছুটা সরাসরি সম্বোধন করব। উত্তরটি মূলত traditionalতিহ্যবাহী আনোভা-র সাথে ভাল অনুশীলনের মতোই, দুর্ভাগ্যক্রমে এটি এমন একটি জায়গা বলে মনে হয় যেখানে বেশিরভাগ গবেষকের জন্য অনেক বড় অনিশ্চয়তা রয়েছে। (এটি traditionalতিহ্যবাহী আনোভা হিসাবে একই কারণ লিনিয়ার মিশ্র-প্রভাবগুলির মডেল এবং আনোভা উভয়ই সাধারণ রৈখিক মডেলের উপর ভিত্তি করে, এটি ঠিক যে মিশ্র মডেলগুলির এলোমেলো প্রভাবগুলির জন্য অতিরিক্ত শব্দ থাকে)) আপনি যদি ধরেই নিচ্ছেন যে সময় উইন্ডোজ একটি করে তোলে পার্থক্য এবং সময়ের প্রভাবগুলির তুলনা করতে চান, আপনার সময়টি আপনার মডেলটিতে অন্তর্ভুক্ত করা উচিত। ঘটনাক্রমে এটি আপনার পক্ষে বিচার করার সুবিধাজনক উপায়ও সরবরাহ করবে যে সময় একটি পার্থক্য করেছে কিনা: সময়ের জন্য কোনও মূল (স্থির) প্রভাব আছে কি? এই রুটে যাওয়ার ক্ষতির দিকটি হ'ল আপনার মডেলটি আরও অনেক জটিল এবং একক "সুপার" পাবে প্যারামিটার হিসাবে সময়ের সাথে মডেল প্যারামিটার হিসাবে সময় ব্যতীত তিনটি ছোট মডেলের তুলনায় সম্ভবত আরও বেশি সময় নেয়। প্রকৃতপক্ষে, মিশ্র মডেলগুলির ক্লাসিক টিউটোরিয়াল উদাহরণটিsleepstudy যা সময়কে প্যারামিটার হিসাবে ব্যবহার করে।

টিforeachlme4χ2

যদি আপনার বৈশিষ্ট্যগুলি নির্ভরশীল পরিবর্তনশীল হয়, তবে আপনাকে যাইহোক বিভিন্ন মডেল গণনা করতে হবে, এবং তারপরে ফলাফলগুলি তুলনা করতে আপনি এআইসি এবং বিআইসি ব্যবহার করতে পারেন।


বিস্তারিত প্রতিক্রিয়া জন্য ধন্যবাদ! আমি সরবরাহিত কয়েকটি রেফারেন্স পড়েছি, তবে অবশ্যই অন্যান্যটির দিকে একবার নজর রাখব। আমি পি-ভ্যালুগুলির মন্দকে যতটা বুঝতে পারি, পর্যালোচকরা দুর্ভাগ্যক্রমে প্রায়শই অন্যথায় ভাবেন (কমপক্ষে এখনকার জন্য)। বেটস দ্বারা প্রস্তাবিত হিসাবে, আমি এমসিএমসি স্যাম্পলিং ব্যবহার করছি, যা আমার বোধগম্যতার ফলে সমস্যার অংশ হিসাবে রয়েছে (অর্থাত কোনও লিমার মডেলের স্বাধীনতার ডিগ্রি সঠিকভাবে অনুমান করা সম্ভব নয়)। বৈশিষ্ট্যগুলি একটি ডিভি, আমি পরিষ্কার করার জন্য আরও কিছু তথ্য যুক্ত করব।
ン ボ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.