এলোমেলো প্রভাব উল্লেখযোগ্য কিনা তা আমি কীভাবে পরীক্ষা করতে পারি?


34

আমি কখন এলোমেলো প্রভাব ব্যবহার করব এবং কখন এটি অপ্রয়োজনীয় তা বোঝার চেষ্টা করছি। আমি আপনার কাছে 4 বা ততোধিক গোষ্ঠী / ব্যক্তি থাকি যা আমি করি (15 টি পৃথক মুজ) thumb এই মুজগুলির মধ্যে কিছু 29 টি মোট 29 টি পরীক্ষার জন্য 2 বা 3 বার পরীক্ষা করা হয়েছিল। আমি যদি জানতে চাই যে তারা যখন ঝুঁকিপূর্ণ প্রাকৃতিক দৃশ্যে না থাকে তখন তারা আলাদা আচরণ করে কিনা different সুতরাং, আমি ভেবেছিলাম আমি ব্যক্তিটিকে এলোমেলো প্রভাব হিসাবে সেট করব। তবে, আমাকে এখন বলা হচ্ছে যে ব্যক্তিটিকে এলোমেলো প্রভাব হিসাবে অন্তর্ভুক্ত করার দরকার নেই কারণ তাদের প্রতিক্রিয়াতে খুব বেশি প্রকরণ নেই। আমি যা বুঝতে পারি না তা হ'ল ব্যক্তিগতভাবে একটি এলোমেলো প্রভাব হিসাবে সেট করার সময় যদি কিছু সত্যিই জবাবদিহি করা হয় তবে কীভাবে পরীক্ষা করতে হয়। সম্ভবত একটি প্রাথমিক প্রশ্ন হ'ল: স্বতন্ত্র একটি ভাল ব্যাখ্যাযোগ্য পরিবর্তনশীল এবং এটির একটি স্থির প্রভাব - কিউকি প্লট হওয়া উচিত কিনা তা নির্ধারণ করার জন্য আমি কোন পরীক্ষা / ডায়াগনস্টিক করতে পারি? histograms? ছিটান প্লট? এবং আমি এই নিদর্শনগুলিতে কি সন্ধান করব।

আমি ব্যক্তিটির সাথে এলোমেলো প্রভাব হিসাবে এবং ছাড়াও মডেলটি চালিয়েছিলাম তবে আমি http://glmm.wikidot.com/faq পড়ি যেখানে তারা উল্লেখ করেছে:

সংশ্লিষ্ট lm ফিট বা গ্লিমার / গ্ল্যামের সাথে লার মডেলগুলির তুলনা করবেন না; লগ-সম্ভাবনাগুলি সামঞ্জস্যপূর্ণ নয় (যেমন, তারা বিভিন্ন সংযোজনীয় পদগুলি অন্তর্ভুক্ত করে)

এবং এখানে আমি এর অর্থ গ্রহণ করি এর অর্থ আপনি এলোমেলো প্রভাব বা ছাড়া ছাড়া কোনও মডেলের মধ্যে তুলনা করতে পারবেন না। তবে যাইহোক তাদের মধ্যে আমার কী তুলনা করা উচিত তা আমি সত্যিই জানতাম না।

এলোমেলো প্রভাব সহ আমার মডেলটিতে আমি আউটপুটটিও দেখার চেষ্টা করছিলাম যে আরই এর কী ধরনের প্রমাণ বা তাত্পর্য রয়েছে

lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv)

Linear mixed model fit by maximum likelihood 
Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) 
   Data: tv 
    AIC    BIC logLik deviance REMLdev
 -13.92 -7.087  11.96   -23.92   15.39
Random effects:
 Groups   Name        Variance Std.Dev.
 ID       (Intercept) 0.00000  0.00000 
 Residual             0.02566  0.16019 
Number of obs: 29, groups: ID, 15

Fixed effects:
              Estimate Std. Error t value
(Intercept)  3.287e-01  5.070e-02   6.483
D.CPC.min   -1.539e-03  3.546e-04  -4.341
FD.CPC       1.153e-04  1.789e-05   6.446

Correlation of Fixed Effects:
          (Intr) D.CPC.
D.CPC.min -0.010       
FD.CPC    -0.724 -0.437

আপনি দেখতে পাচ্ছেন যে পৃথক আইডি থেকে আমার বৈকল্পিক এবং এসডি এলোমেলো প্রভাব হিসাবে 0 = এটি কীভাবে সম্ভব? 0 এর অর্থ কী? এটা কি সঠিক? তারপরে আমার বন্ধু যিনি বলেছিলেন যেহেতু "যেহেতু র্যান্ডম এফেক্টটি অপ্রয়োজনীয় হিসাবে আইডি ব্যবহার করে কোনও প্রকরণ নেই" সঠিক? সুতরাং, তাহলে আমি কি এটি একটি স্থির প্রভাব হিসাবে ব্যবহার করব? তবে এতটা ভিন্নতা আছে কি না তা বোঝার অর্থ কি এটি আমাদের কিছু বলবে না?


এলোমেলো প্রভাবের সঠিক 0 টি বৈকল্পিকতা অর্জনের জন্য দেখুন stats.stackexchange.com/questions/115090
অ্যামিবা

উত্তর:


21

অনুমান, IDএর বৈকল্পিকতা = 0, ইঙ্গিত দেয় যে গ্রুপের মধ্যে পরিবর্তনের মাত্রা মডেলটিতে এলোমেলো প্রভাব অন্তর্ভুক্ত করার জন্য যথেষ্ট নয়; অর্থাত। আপনার মডেল অবক্ষয় হয়।

আপনি যেমন নিজেকে সঠিকভাবে সনাক্ত করেছেন: সম্ভবত, হ্যাঁ; IDএলোমেলো প্রভাব হিসাবে অপ্রয়োজনীয়। এই অনুমানটি পরীক্ষা করতে কিছু জিনিস মনে মনে বসত:

  1. আপনি REML = Fএআইসি (বা আপনার পছন্দসই আইসি সাধারণভাবে) এলোমেলো প্রভাব ছাড়াও এবং কোনও মডেলের মধ্যে তুলনা করতে পারেন এবং দেখুন কীভাবে তা হয়।
  2. আপনি anova()দুটি মডেলের আউটপুট তাকান ।
  3. আপনি আপনার মূল মডেল দ্বারা সংজ্ঞায়িত পোস্টেরিয়র বিতরণ ব্যবহার করে একটি প্যারামেট্রিক বুটস্ট্র্যাপ করতে পারেন।

আপনার পছন্দ 1 এবং 2 এর মধ্যে একটি সমস্যা আছে মনে রাখবেন: আপনি এমন কিছু যা যা প্যারামিটার স্পেসের সীমানায় রয়েছে তা খতিয়ে দেখছেন যাতে প্রকৃতপক্ষে সেগুলি প্রযুক্তিগতভাবে সাবলীল নয়। এই বলে, আমি মনে করি না আপনি তাদের কাছ থেকে ভুল অন্তর্দৃষ্টি পেয়ে যাবেন এবং প্রচুর লোক তাদের ব্যবহার করবেন (যেমন, lme4 এর বিকাশকারীদের মধ্যে ডগলাস বেটস, তাদের বইতে ব্যবহার করেছেন তবে প্যারামিটারের মানগুলি পরীক্ষা করার বিষয়ে স্পষ্টতই বলেছেন) সম্ভাব্য মানগুলির সেটগুলির সীমানায়)। চয়েস 3 3 টির মধ্যে সবচেয়ে ক্লান্তিকর তবে বাস্তবে কী চলছে তা সম্পর্কে আপনাকে সেরা ধারণা দেয়। কিছু লোক নন-প্যারামেট্রিক বুটস্ট্র্যাপ ব্যবহার করার জন্যও প্রলুব্ধ হয় তবে আমি মনে করি যে আপনি যে প্যারাম্যাট্রিক অনুমান করছেন তা দিয়ে আপনি শুরু করার পাশাপাশি সেগুলি ব্যবহার করতে পারেন I


6
সিমুলেশন-ভিত্তিক সম্ভাবনা অনুপাতের পরীক্ষাগুলি ব্যবহার করে র্যান্ডম এফেক্টগুলি পরীক্ষা করার জন্য আরএলআরসিম প্যাকেজটি সত্যই সুবিধাজনক উপায়।
atrichornis

@ এট্রিচর্নিস: +1। আকর্ষণীয় প্যাকেজ; আমি এটি সম্পর্কে জানতাম না। আমি কেবল তার কোডটি দেখেছি, বেশ সোজা আমি বলতে পারি। আমি আশা করি তারা এটি (বা এর মতো কিছু) lme4বিশেষত এখন mcmcsamp()ভেঙে গেছে এবং কিছু শালীন পি-মান ইত্যাদি বের করার জন্য লোকেরা কেবল তাদের নিজস্ব অ্যাড-হক বুটস্ট্র্যাপ বাস্তবায়ন রেখে গেছে।
usεr11852

সত্য, মিশ্র মডেলগুলি আর তে সহজ সরল নয় ots প্রচুর পরিমাণে অনুমান এবং কর্মপরিকল্পনা ... যদিও আমি এসএএস ইত্যাদি সংগ্রহ করি ঠিক তেমনি কিছু অনিশ্চয়তার উপর কিছুটা দেখছি? বেন বলকার উভয় প্যাকেজের সহকারী, এটি এটি সংহত না করার জন্য তার কারণ থাকতে পারে। সম্ভবত সময়!
atrichornis

4
প্যারামিটার স্থান সীমানা উপর বুটস্ট্র্যাপ বিষয় ও সমস্যার অসঙ্গতি নেতৃস্থানীয় তার নিজস্ব সেট আছে । বুটস্ট্র্যাপ কোনও রোগ নিরাময়ের জিনিস নয় এবং হালকাভাবে ব্যাগের মধ্যে ফেলে দেওয়া উচিত নয় যে এটি সবকিছু সমাধান করবে।
স্টাসকে

2
একবার দেখুন, যুক্তি খুব সূক্ষ্ম। আমি যতদূর মনে করতে পারি, এটি এটিকে ফোটায় যে আপনি শূন্য থেকে পৃথক একটি বিতরণ থেকে বুটস্ট্র্যাপ করছেন; এবং সীমানায় প্রাপ্ত অ-মানক বিতরণ দেওয়া হলে, নিয়মিততার শর্ত লঙ্ঘিত হয় এবং বুটস্ট্র্যাপ বিতরণ লক্ষ্যতে রূপান্তরিত হয় না। আমি মনে করি নন-প্যারামেট্রিক বুটস্ট্র্যাপটি এখানে অবশিষ্টাংশের গ্রুপ উপায়গুলি বের করেই তৈরি করা যেতে পারে। তবে, গ্রুপগুলির মধ্যে পর্যবেক্ষণের স্বাধীনতা লঙ্ঘনের সাথে সাথে জটিলতার আরও একটি স্তর উত্থিত হতে পারে।
স্টাস্ক

3

আমি নিশ্চিত নই যে আমি যে পদ্ধতির পরামর্শ দিতে যাচ্ছি তা যুক্তিসঙ্গত, সুতরাং যারা এই বিষয় সম্পর্কে আরও বেশি জানেন তারা ভুল হয়ে থাকলে আমাকে সংশোধন করেন।

আমার প্রস্তাবটি হ'ল আপনার ডেটাতে একটি অতিরিক্ত কলাম তৈরি করা যা এর ধ্রুবক মান 1:

IDconst <- factor(rep(1, each = length(tv$Velocity)))

তারপরে, আপনি এমন একটি মডেল তৈরি করতে পারেন যা এই কলামটিকে আপনার এলোমেলো প্রভাব হিসাবে ব্যবহার করে:

fm1 <- lmer(Velocity ~ D.CPC.min + FD.CPC + (1|IDconst), 
  REML = FALSE, family = gaussian, data = tv)

এই মুহুর্তে, তোমার তুলনা পারে (এআইসি) র্যান্ডম প্রভাব সঙ্গে আপনার মূল মডেল ID(এটা কল দিন fm0) নতুন মডেল যে একাউন্টে লাগবে না সঙ্গে IDযেহেতু IDconstআপনার সমস্ত ডেটা জন্য একই।

anova(fm0,fm1)

হালনাগাদ

ব্যবহারকারী 11852 উদাহরণ চাইছিল, কারণ তার মতে উপরের পদ্ধতির এমনকি কার্যকর হবে না। বিপরীতে, আমি দেখাতে পারি যে পদ্ধতির কাজ হয় (অন্তত lme4_0.999999-0আমি বর্তমানে ব্যবহার করছি তার সাথে )।

set.seed(101)
dataset <- expand.grid(id = factor(seq_len(10)), fac1 = factor(c("A", "B"),
  levels = c("A", "B")), trial = seq_len(10))
dataset$value <- rnorm(nrow(dataset), sd = 0.5) +
      with(dataset, rnorm(length(levels(id)), sd = 0.5)[id] +
      ifelse(fac1 == "B", 1.0, 0)) + rnorm(1,.5)
    dataset$idconst <- factor(rep(1, each = length(dataset$value)))

library(lme4)
fm0 <- lmer(value~fac1+(1|id), data = dataset)
fm1 <- lmer(value~fac1+(1|idconst), data = dataset)

anova(fm1,fm0)

আউটপুট:

  Data: dataset
  Models:
  fm1: value ~ fac1 + (1 | idconst)
  fm0: value ~ fac1 + (1 | id)

      Df    AIC    BIC  logLik  Chisq Chi Df Pr(>Chisq)
  fm1  4 370.72 383.92 -181.36                      
  fm0  4 309.79 322.98 -150.89 60.936      0  < 2.2e-16 ***

এই শেষ পরীক্ষা অনুসারে, আমাদের এলোমেলো প্রভাব রাখতে হবে যেহেতু fm0মডেলটির সর্বনিম্ন এআইসি পাশাপাশি বিআইসি রয়েছে।

আপডেট 2

যাইহোক, এই একই পদ্ধতিটি এনডাব্লু গালওয়ে 'মিশ্র মডেলিংয়ের পরিচিতি: রিগ্রেশন অ্যান্ড ভার্সিয়েন্সের বাইন্ডিয়েন্সের বাইরের' পৃষ্ঠায় 213-214 পৃষ্ঠায় প্রস্তাব করেছেন।


আপনি কি আপনার ধারণা পরীক্ষা করেছেন? দয়া করে আমাকে ভুল প্রমাণ করুন তবে আমি মনে করি আপনার ধারণাটি কার্যকর হবে না। যদি IDconstআপনার সমস্ত ডেটার জন্য একই থাকে তবে আপনার কোনও গ্রুপিং নেই। কমপক্ষে একটি নমুনা স্তর এবং মডেলটি সেট আপ করার জন্য আপনার কোনও গ্রুপিং ফ্যাক্টর দরকার। আমি সম্ভবত "এলোমেলো গ্রুপিং" ব্যবহারের যুক্তি বিশ্বাস করতে পারি তবে এটি একসাথে আলাদা বল-খেলা। কিছু ডামি ডেটা দিয়ে আপনার পদ্ধতির পরীক্ষা করুন। আমি দৃ strongly়ভাবে বিশ্বাস করি যে আপনার প্রস্তাবিত সেটআপটি lmer()চলবে না। (আমি ব্যবহার করি lme4_0.99999911-1)
usεr11852

@ user11852 দয়া করে আমার আপডেটটি দেখুন এবং এই পদ্ধতির সাথেও কাজ করে কিনা তা আমাদের জানান lme4_0.99999911-1
ভিএলসি

না, এটি কাজ করবে না। এবং আমি বলেছিলাম, " এটি হওয়া উচিত নয় " কারণ ধারণার সাথে আপনার কোনও মিশ্র মডেল শুরু হচ্ছে না। (দুঃখিত, আমি আমার আগের মন্তব্যে আক্রমণাত্মক মনে হতে পারছিলাম।) আমি অনুমান করি আপনি যা অর্জন করতে চাইছেন তা ম্যাট্রিক্সকে একক ভেক্টর হিসাবে সেটআপ করা হবে তবে আপনি যদি স্পষ্টভাবে আর-তে এটি করার কোনও উপায় খুঁজে পান না (যেমন আপনার লিখুন আপনার নিজস্ব বিচ্যুতি ফাংশন) আপনার ভাগ্যের বাইরে। Z
ইউএসআর 11852 12

3
হ্যাঁ, আপনার পরামর্শ অনুসারে আমি তা করেছি; এটি কাজ করে / গণনা করবে না। Error in lFormula(formula = value ~ fac1 + (1 | idconst), data = dataset) : grouping factors must have at least 1 sampled level। এবং আমি যেমন বলেছি, ধারণাগতভাবে এটি ভুল। কিছু নম্বর দেওয়ার জন্য সফ্টওয়্যারটি ট্রিক করে তোলার বিষয় নয়, আপনি যা বলছেন এটি যুক্তিযুক্ত কিনা তা বিবেচ্য। আপনার সাথে তুলনা করার জন্য দ্বিতীয় মিশ্র মডেল নেই যদি সেই মডেলটিতে এলোমেলো প্রভাব নির্মাণ দ্বারা ধ্রুবক হয়। আপনি এটি পাশাপাশি বাদ দিতে পারেন এবং পরিবর্তে একটি রৈখিক মডেল চেষ্টা করতে পারেন।
usεr11852 বলছে মিনিক

1
একক গ্রুপের এলোমেলো ভেরিয়েবল সংজ্ঞায়িত কনসার্ট আপডেট করুন lme4। এই যদি বিকল্প সেট করা সম্ভব: control=lmerControl(check.nlev.gtr.1="ignore")। বেন বলকার এখানে উল্লেখ করেছেন: github.com/lme4/lme4/issues/411
রবিন বিউমন্ট

1

আমি আরও 'প্রাথমিক' প্রশ্নের উত্তর দিতে চাই।

আপনি যদি কিছু কারণের কারণে নির্ভরশীল ভেরিয়েবলের মধ্যে বৈকল্পিকতার মধ্যে কোনও ধরণের বিজাতীয়তা সন্দেহ করেন তবে আপনার এগিয়ে যাওয়া উচিত এবং স্ক্যাটার এবং বক্স প্লট ব্যবহার করে ডেটা প্লট করা উচিত। কিছু সাধারণ নিদর্শন যাচাই করার জন্য, আমি ওয়েবে বিভিন্ন উত্স থেকে এই তালিকাটি নীচে রেখেছি।

হিটারোস্কেস্টাস্টিটি প্যাটার্নস

এছাড়াও, নিয়মিত বৈকল্পিক আছে কিনা তা দেখার জন্য ফ্যাক্টর / চিকিত্সা গোষ্ঠীগুলি দ্বারা আপনার নির্ভরশীল পরিবর্তনশীলটিকে প্লট করুন। যদি তা না হয় তবে আপনি এলোমেলো প্রভাব বা ভারযুক্ত রেগ্রেশনগুলি অন্বেষণ করতে চাইতে পারেন। যেমন যেমন নীচে এই চার্টটি আমার চিকিত্সার গ্রুপগুলিতে ফানেলের আকারের বৈচিত্রের একটি উদাহরণ। তাই আমি এলোমেলো প্রভাবগুলি বেছে নেওয়ার এবং slাল এবং ইন্টারসেপ্টের উপরের প্রভাবগুলি পরীক্ষা করতে পছন্দ করি।

হিটারোস্কেস্টাস্টিটি পরীক্ষা করার জন্য বক্সপ্লট

এখান থেকে উপরের উত্তরগুলি আপনার মূল প্রশ্নটি পূরণ করে। হিটারোস্কেস্টাস্টিটি পরীক্ষা করে এমন পরীক্ষাও রয়েছে, এর মধ্যে একটি হ'ল https://dergipark.org.tr/download/article-file/94971 । তবে আমি নিশ্চিত নই যে গ্রুপ স্তরীয় ভিন্ন ভিন্নতা সনাক্ত করার জন্য কোনও পরীক্ষার উপস্থিতি রয়েছে কিনা।


ওপি-র প্রশ্নের উত্তর সরবরাহ করতে দয়া করে কেবল "আপনার উত্তর" ক্ষেত্রটি ব্যবহার করুন। সিভি একটি কঠোর প্রশ্নোত্তর সাইট, কোনও আলোচনার ফোরাম নয়। আপনার পোস্টের পরবর্তী, সাহসী অংশটি একটি নতুন প্রশ্ন, এই প্রশ্নের উত্তর নয়। আপনার যদি নতুন প্রশ্ন ASK QUESTIONথাকে তবে উপরের ধূসর টিপুন এবং এটি জিজ্ঞাসা করুন। যেহেতু আপনি এখানে নতুন, আপনি আমাদের সফর নিতে চাইতে পারেন , যাতে নতুন ব্যবহারকারীদের জন্য তথ্য রয়েছে।
gung - পুনর্বহাল মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.