কীভাবে একটি মিশ্র মডেল (lme4) এর শ্রেণীবদ্ধ ফ্যাক্টরের জন্য একটি "সামগ্রিক" পি-মান এবং প্রভাবের আকার পাবেন?


28

আমি পি-মান এবং একটি স্বতন্ত্র শ্রেণীবদ্ধ ভেরিয়েবলের একটি প্রভাব আকার পেতে চাই (বেশ কয়েকটি স্তর সহ) - এটি "সামগ্রিক" এবং প্রতিটি স্তরের জন্য আলাদাভাবে নয়, lme4আর থেকে প্রাপ্ত সাধারণ আউটপুট যেমন এটি ঠিক তেমন হয় একটি আনোভা চলাকালীন লোকেরা যে জিনিসটির প্রতিবেদন করে।

আমি এটি কিভাবে পেতে পারি?


আপনি কি পরিসংখ্যান ঠিক চান? আপনি anova()লিনিয়ার মডেলগুলির মতো লিনিয়ার মিশ্রিত মডেলগুলির সাথে একটি আনোভা টেবিল পেতে ফাংশনটি ব্যবহার করতে পারেন ।
স্মিলিগ

আমি আনোভা চেষ্টা করেছি () তবে এটি আমাকে ডিএফ, সুম বর্গ, মীন বর্গ এবং এফ মান দেয়। আমি প্রভাবের আকার এবং পি মান দেখতে পাচ্ছি না। এই সম্পর্কে আপনার কোন ধারণা আছে?
ব্যবহারকারী 3288202

1
প্রভাব আকার দ্বারা, আপনি কি সমতুল্য কিছু ? পি-মানগুলির প্রতি শ্রদ্ধা সহ, তাদের অনুমানের চারপাশে এবং এগুলিকে বাস্তবায়নের আশেপাশে একটি দীর্ঘ এবং যথেষ্ট বিতর্ক রয়েছে । আরও তথ্যের জন্য এই প্রশ্নে আলোচনাটি দেখুন। R2lme4
স্মিলিগ

লিঙ্কটির জন্য ধন্যবাদ, স্মিলিগ। এর অর্থ কী যে পি মান গণনার ক্ষেত্রে সমস্যা আছে, সামগ্রিকভাবে ফ্যাক্টরের প্রভাবের আকারটিও একটি সমস্যা?
ব্যবহারকারী 3288202

এগুলি সরাসরি সম্পর্কিত সমস্যা নয়। যাইহোক, আপনার মনে রাখা উচিত যে একটি রৈখিক মিশ্র মডেল এলোমেলো প্রভাব ছাড়াই লিনিয়ার মডেলের মতো আচরণ করে না তাই এমন একটি পরিমাপ যা লিনিয়ার মডেলের জন্য উপযুক্ত হতে পারে তা মিশ্রিত মডেলগুলিতে সাধারণভাবে প্রয়োজন না not
স্মিলিগ

উত্তর:


48

আপনি যে ধারণাগুলি উল্লেখ করেছেন উভয়েরই (পি-মানগুলি এবং লিনিয়ার মিশ্রিত মডেলগুলির এফেক্ট মাপ) এর অন্তর্নিহিত সমস্যা রয়েছে। প্রভাব আকারের ক্ষেত্রে , এর মূল লেখক ডগ বেটসের উদ্ধৃতি দিয়ে lme4,

অনুমান করে যে কোনও একটি পরিমাপের সংজ্ঞা দিতে চায় , আমি মনে করি যে লিনিয়ার মডেল থেকে স্কোয়ারের অবশিষ্টাংশের যোগফলকে আমরা একইভাবে বিবেচনা করি তেমনভাবে একটি রৈখিক মিশ্র মডেল থেকে বর্গক্ষেত্রের অবশিষ্টাংশের যোগফলের চিকিত্সার জন্য একটি যুক্তি তৈরি করা যেতে পারে। অথবা কেউ শাস্তির বিহীন স্কোয়ারের অবশিষ্ট অবধি বা কোনও নির্দিষ্ট শর্তাবলী থেকে প্রাপ্ত স্কোয়ারের ন্যূনতম অবশিষ্টাংশের যোগফল ব্যবহার করতে পারে, যা অসীম নির্ভুলতার ম্যাট্রিক্সের সাথে মিলে যায়। আমি জানি না। এটি আপনি কী বৈশিষ্ট্যযুক্ত করার চেষ্টা করছেন তার উপর নির্ভর করে।R2

আরও তথ্যের জন্য, আপনি এই থ্রেড , এই থ্রেড এবং এই বার্তাটি দেখতে পারেন । মূলত, বিষয়টি হ'ল মডেলটির এলোমেলো প্রভাব থেকে বৈচিত্রের অন্তর্ভুক্তি এবং ক্ষয়করণের জন্য একমত পদ্ধতি নেই। তবে কয়েকটি মান রয়েছে যা ব্যবহার করা হয়। আপনার যদি উইকিটি আর-সিগ-মিক্সড-মডেল মেলিং তালিকার জন্য / দ্বারা সেট আপ করা আছে তবে আপনি কয়েকটি পদ্ধতির তালিকাভুক্ত রয়েছেন।

প্রস্তাবিত পদ্ধতিগুলির মধ্যে একটি লাগানো এবং পর্যবেক্ষণকৃত মানগুলির মধ্যে পারস্পরিক সম্পর্ককে দেখায়। এই প্রয়োগ করা যেতে পারে আর হিসাবে যারা থ্রেডের এক জ্যারেট Byrnes দ্বারা প্রস্তাবিত:

r2.corr.mer <- function(m) {
  lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
  summary(lmfit)$r.squared
}

সুতরাং উদাহরণস্বরূপ, বলুন যে আমরা নিম্নলিখিত রৈখিক মিশ্র মডেলটি অনুমান করি:

set.seed(1)
d <- data.frame(y = rnorm(250), x = rnorm(250), z = rnorm(250),
                g = sample(letters[1:4], 250, replace=T)       )
library(lme4)
summary(fm1 <- lmer(y ~ x + (z | g), data=d))
# Linear mixed model fit by REML ['lmerMod']
# Formula: y ~ x + (z | g)
#    Data: d
# REML criterion at convergence: 744.4
# 
# Scaled residuals: 
#     Min      1Q  Median      3Q     Max 
# -2.7808 -0.6123 -0.0244  0.6330  3.5374 
# 
# Random effects:
#  Groups   Name        Variance Std.Dev. Corr 
#  g        (Intercept) 0.006218 0.07885       
#           z           0.001318 0.03631  -1.00
#  Residual             1.121439 1.05898       
# Number of obs: 250, groups: g, 4
# 
# Fixed effects:
#             Estimate Std. Error t value
# (Intercept)  0.02180    0.07795   0.280
# x            0.04446    0.06980   0.637
# 
# Correlation of Fixed Effects:
#   (Intr)
# x -0.005

আমরা উপরের সংজ্ঞায়িত ফাংশনটি ব্যবহার করে এফেক্ট আকারটি গণনা করতে পারি:

r2.corr.mer(fm1)
# [1] 0.0160841

Ong as হিসাবে উল্লেখ করা রঙ্গুয়ু জু-র একটি কাগজে অনুরূপ বিকল্পের প্রস্তাব দেওয়া হয়েছে , এবং কেবলমাত্র আর-তে গণনা করা যেতে পারে :Ω02

1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
# [1] 0.01173721  # Usually, it would be even closer to the value above

পি-মানগুলির প্রতি শ্রদ্ধা সহ , এটি অনেক বেশি বিতর্কিত সমস্যা (কমপক্ষে আর / lme4সম্প্রদায়ে)। প্রশ্ন আলোচনা দেখুন এখানে , এখানে , এবং এখানে অনেক প্রমুখ। আবার উইকি পৃষ্ঠার উল্লেখ করে, রৈখিক মিশ্র মডেলগুলির প্রভাবগুলির উপর অনুমানের পরীক্ষা করার জন্য কয়েকটি পন্থা রয়েছে। "সবচেয়ে খারাপ থেকে সেরা" এর তালিকাভুক্ত ( উইকি পৃষ্ঠার লেখকদের মতে যা আমি বিশ্বাস করি যে ডগ বেটসের পাশাপাশি বেন বলকারও এখানে রয়েছে যা এখানে প্রচুর অবদান রাখে):

  • ওয়াল্ড জেড-টেস্টস
  • সুষম, নেস্টেড এলএমএমগুলির জন্য যেখানে ডিএফ গণনা করা যায়: ওয়াল্ড টি-টেস্ট
  • সম্ভাবনা অনুপাত পরীক্ষা, নয়তো মডেল স্থাপনের যাতে প্যারামিটার বিচ্ছিন্ন করা যেতে পারে / বাদ (মাধ্যমে anovaবা drop1), অথবা সম্ভাবনা প্রোফাইলের কম্পিউটিং মাধ্যমে
  • MCMC বা প্যারামেট্রিক বুটস্ট্র্যাপ আস্থা আত্মবিশ্বাস

তারা মার্কোভ চেইন মন্টি কার্লো স্যাম্পলিং পদ্ধতির প্রস্তাব দেয় এবং নীচে তালিকাভুক্ত সিউডো এবং সম্পূর্ণ বায়েশীয় পদ্ধতিগুলি থেকে এটি বাস্তবায়নের জন্য বেশ কয়েকটি সম্ভাবনার তালিকাও দেয়।

ছদ্ম-Bayesian:

  • এই পোস্টে এইচ স্যাম্পলিং, সাধারণত (1) ফ্ল্যাট প্রিয়ার ধরে নেওয়া এবং (2) এমএলই থেকে শুরু করে, সম্ভবত প্রার্থীর বন্টন বেছে নিতে আনুমানিক বৈচিত্র্য-কোভারিয়েন্স অনুমান ব্যবহার করে
  • এর মাধ্যমে mcmcsamp(আপনার সমস্যার জন্য যদি পাওয়া যায়: সহজ র্যান্ডম প্রভাব সঙ্গে অর্থাত LMMs - না GLMMs বা জটিল র্যান্ডম প্রভাব)
    মাধ্যমে pvals.fnclanguageRপ্যাকেজ, একটি মোড়কের mcmcsamp)
  • এডি মডেল বিল্ডারে সম্ভবত glmmADMBপ্যাকেজটির মাধ্যমে ( mcmc=TRUEবিকল্পটি ব্যবহার করুন ) বা R2admbপ্যাকেজটি (AD মডেল বিল্ডারে আপনার নিজস্ব মডেল সংজ্ঞাটি লিখুন), বা আর এর বাইরে
  • প্যাকেজটি simথেকে ফাংশনটির মাধ্যমে arm(কেবলমাত্র বিটা (স্থির-প্রভাব) সহগের জন্য পশ্চাতটি সিমুলেট করে

সম্পূর্ণ বায়েশিয়ান যোগাযোগ:

  • MCMCglmmপ্যাকেজ মাধ্যমে
  • ব্যবহার glmmBUGS(/ মোড়কের একটি WinBUGS আর ইন্টারফেস)
  • rjags/ r2jags/ R2WinBUGS/ BRugsপ্যাকেজগুলির মাধ্যমে জেএজিএস / উইনবুগস / ওপেনবগিজ ইত্যাদি ব্যবহার করা হচ্ছে

উদাহরণস্বরূপ, এটি দেখতে কেমন হতে পারে তা দেখানোর জন্য নীচে একটি প্যাকেজটি MCMCglmmব্যবহার করে অনুমান করা হয় MCMCglmmযা আপনি উপরের মডেলটির মতো একই ফলস্বরূপ দেখতে পাবেন এবং কিছু ধরণের বায়সিয়ান পি-মান রয়েছে:

library(MCMCglmm)
summary(fm2 <- MCMCglmm(y ~ x, random=~us(z):g, data=d))
# Iterations = 3001:12991
# Thinning interval  = 10
#  Sample size  = 1000 
# 
#  DIC: 697.7438 
# 
#  G-structure:  ~us(z):g
# 
#       post.mean  l-95% CI u-95% CI eff.samp
# z:z.g 0.0004363 1.586e-17 0.001268    397.6
# 
#  R-structure:  ~units
# 
#       post.mean l-95% CI u-95% CI eff.samp
# units    0.9466   0.7926    1.123     1000
# 
#  Location effects: y ~ x 
# 
#             post.mean l-95% CI u-95% CI eff.samp pMCMC
# (Intercept)  -0.04936 -0.17176  0.07502     1000 0.424
# x            -0.07955 -0.19648  0.05811     1000 0.214

আমি এই কিছুটা সাহায্য করে আশা করি। আমি মনে করি যে কারও জন্য লিনিয়ার মিশ্র মডেলগুলি শুরু করে এবং আর এটিকে অনুমান করার চেষ্টা করার জন্য সর্বোত্তম পরামর্শটি উইকি ফ্যাক্সগুলি পড়া যেখানে থেকে এই তথ্যটির বেশিরভাগ অংশ আঁকা হয়েছিল। এটি বেসিক থেকে উন্নত এবং মডেলিং থেকে প্লটিং পর্যন্ত সমস্ত ধরণের মিশ্র প্রভাবগুলির থিমগুলির জন্য দুর্দান্ত উত্স।


অনেক ধন্যবাদ স্মাইলি সুতরাং আমি সামগ্রিক পরামিতিগুলির জন্য প্রভাব আকারের প্রতিবেদন করতে পারি না।
ব্যবহারকারী 3288202

... এবং অবশ্যই ফলস্বরূপ আরও পর্যবেক্ষণ সহ নমুনা ইউনিটগুলির (এবং এটি শর্ত না বলেই যায়) পক্ষপাতদুষ্ট হবে। R2
রাসেলপিয়ের্স

3
+6, চিত্তাকর্ষকভাবে পরিষ্কার, বিস্তৃত, এবং পুঙ্খানুপুঙ্খভাবে টিকা দেওয়া।
গুং - মনিকা পুনরায়

1
অতিরিক্তভাবে, আপনি এফেক্স-প্যাকেজ এবং বিশেষত মিশ্র-ফাংশনটি দেখতে পারেন। দেখতে এখানে
শিক্ষানবিস

6

তাত্পর্য ( পি ) মান গণনা প্রসঙ্গে , লূক (২০১)) আর-এ রৈখিক মিশ্র-প্রভাবগুলির মডেলগুলির তাত্পর্য মূল্যায়নের মূল্যায়ন করছে যে সর্বোত্তম পদ্ধতিটি হয় স্বাধীনতার ডিগ্রিগুলির জন্য কেনওয়ার্ড-রোজার বা স্যাটারথওয়েটের সান্নিধ্য (যেমন প্যাকেজগুলির সাথে আরে উপলব্ধ lmerTestবা afex)।

বিমূর্ত

পরীক্ষামূলক তথ্য বিশ্লেষণে মিশ্র-প্রভাবগুলির মডেলগুলি আরও বেশি ঘন ঘন ব্যবহৃত হচ্ছে। যাইহোক, আর-এর lme4 প্যাকেজে এই মডেলগুলির স্থির প্রভাবগুলির তাত্পর্য মূল্যায়নের জন্য মান (যেমন, পি-মানগুলি অর্জন) কিছুটা অস্পষ্ট। এর পিছনে ভাল কারণ রয়েছে তবে গবেষকরা যারা এই মডেলগুলি ব্যবহার করছেন তাদের ক্ষেত্রে পি-ভ্যালুগুলি প্রতিবেদন করার জন্য অনেক ক্ষেত্রে প্রয়োজন হয়, মডেল আউটপুটটির তাত্পর্য মূল্যায়নের জন্য কিছু পদ্ধতি প্রয়োজন। এই কাগজটি সিমুলেশনের ফলাফলগুলি দেখায় যে তাত্পর্য মূল্যায়ন করার জন্য দুটি খুব সাধারণ পদ্ধতি, সম্ভাবনা অনুপাতের পরীক্ষা ব্যবহার করা এবং মডেল আউটপুট (টি-অ্যাস-জেড) থেকে ওয়াল্ড টি মানগুলিতে জেড বিতরণ প্রয়োগ করা কিছুটা রক্ষণশীল বিরোধী, বিশেষত ছোট নমুনা আকারের জন্য। তাত্পর্য মূল্যায়নের জন্য অন্যান্য পদ্ধতি,এই সিমুলেশনের ফলাফলগুলি সূচিত করে যে টাইপ 1 ত্রুটির হারগুলি .05 এর নিকটতম, যখন মডেলগুলি আরএমএল ব্যবহার করে এবং পি-মানগুলি কেনওয়ার্ড-রজার বা স্যাটারথওয়াইট অনুমানগুলি ব্যবহার করে নেওয়া হয়, কারণ এই আনুমানিক উভয়ই গ্রহণযোগ্য প্রকার 1 ত্রুটি হার এমনকি ছোটর জন্যই উত্পাদিত হয়েছিল নমুনা।

(সামনে জোর দাও)


4
+1 এই লিঙ্কটি ভাগ করে নেওয়ার জন্য ধন্যবাদ। আমি কেবল সংক্ষেপে মন্তব্য করব যে কেনওয়ার্ড-রজারের অনুমান lmerTestপ্যাকেজে পাওয়া যায় ।
অ্যামিবা

5

আমি lmerTestপ্যাকেজটি ব্যবহার করি । এটিতে anova()আমার এমএলএম বিশ্লেষণের জন্য আউটপুটে পি-ভ্যালুটির অনুমানটি সুবিধামতভাবে অন্তর্ভুক্ত করা হয়েছে , তবে এখানে অন্যান্য পোস্টগুলিতে প্রদত্ত কারণগুলির জন্য কোনও প্রভাব আকার দেয় না।


1
আমার ক্ষেত্রে, আমি lsmeans ব্যবহার করে যুগ্মতর তুলনা পছন্দ করি কারণ এটি আমারে পি মানগুলি সহ সমস্ত বিপরীতে বিতরণ করে। আমি যদি লামার টেস্ট ব্যবহার করি তবে সমস্ত জোড়া বৈপরীত্য দেখতে আমাকে বিভিন্ন বেসলাইন সহ ছয়বার মডেল চালাতে হবে।
ব্যবহারকারী 3288202
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.