লিনিয়ার মিশ্রিত-প্রভাব মডেলের পুনরাবৃত্তিগুলির জন্য ব্যবহার করে


41

সম্পাদনা 2: আমি প্রাথমিকভাবে ভেবেছিলাম যে আমার একটি ফ্যাক্টরের উপর বারবার ব্যবস্থা নিয়ে একটি দ্বি-গুণক আনোভা চালানো দরকার, তবে আমি এখন মনে করি একটি লিনিয়ার মিশ্র-প্রভাব মডেল আমার ডেটার জন্য আরও ভাল কাজ করবে। আমার মনে হয় আমি কী হতে হবে তা প্রায় জানি, তবে এখনও কয়েকটি পয়েন্টে আমি বিভ্রান্ত।

বিশ্লেষণের জন্য আমার যে পরীক্ষাগুলি প্রয়োজন তা এ জাতীয় চেহারা:

  • বিষয়গুলি বেশ কয়েকটি চিকিত্সা গ্রুপকে দেওয়া হয়েছিল
  • প্রতিটি বিষয়ের পরিমাপ একাধিক দিনে নেওয়া হয়েছিল
  • তাই:
    • বিষয় চিকিত্সার মধ্যে নেস্ট করা হয়
    • চিকিত্সা দিনের সাথে পার হয়

(প্রতিটি বিষয় কেবল একটি চিকিত্সার জন্য বরাদ্দ করা হয়, এবং প্রতিটি বিষয়ে প্রতিটি বিষয়ে পরিমাপ নেওয়া হয়)

আমার ডেটাসেটে নিম্নলিখিত তথ্য রয়েছে:

  • বিষয় = ব্লকিং ফ্যাক্টর (এলোমেলো ফ্যাক্টর)
  • দিন = বিষয় বা পুনরাবৃত্তি ব্যবস্থা ফ্যাক্টরের মধ্যে (স্থির ফ্যাক্টর)
  • চিকিত্সা = বিষয় ফ্যাক্টরের মধ্যে (স্থির ফ্যাক্টর)
  • ওবস = পরিমাপক (নির্ভরশীল) পরিবর্তনশীল

আপডেট ঠিক আছে, তাই আমি গিয়ে একজন পরিসংখ্যানবিদদের সাথে কথা বললাম, তবে সে একজন এসএএস ব্যবহারকারী। তিনি মনে করেন যে মডেলটি হওয়া উচিত:

চিকিত্সা + দিন + বিষয় (চিকিত্সা) + দিন * বিষয় (চিকিত্সা)

স্পষ্টতই তাঁর স্বরলিপিটি আর সিনট্যাক্স থেকে পৃথক, তবে এই মডেলটির জন্য অ্যাকাউন্টিং করার কথা রয়েছে:

  • চিকিত্সা (স্থির)
  • দিন (স্থির)
  • চিকিত্সা * দিনের মিথস্ক্রিয়া
  • বিষয় চিকিত্সার মধ্যে নেস্টেড (এলোমেলো)
  • "চিকিত্সার মধ্যে সাবজেক্ট" (এলোমেলো) দিয়ে দিনটি পার হয়ে গেল

সুতরাং, এটি কি সঠিক বাক্য গঠন?

m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata)

আমি বিশেষত উদ্বিগ্ন যে দিনটি "চিকিত্সার মধ্যে সাবজেক্টের" অংশটি সঠিকভাবে পার হয়ে গেছে কিনা। এসএএসের সাথে পরিচিত কেউ, বা আত্মবিশ্বাসী যে তাঁর মডেলটিতে কী চলছে তা তারা বুঝতে পেরেছেন, আর সিনট্যাক্সে আমার দুঃখজনক প্রচেষ্টা মেলে কিনা সে বিষয়ে মন্তব্য করতে সক্ষম?

এখানে একটি মডেল তৈরি এবং সিনট্যাক্স লেখার আমার আগের প্রচেষ্টাগুলি (উত্তর এবং মন্তব্যে আলোচিত):

m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata)

বিষয়টিকে চিকিত্সার মধ্যে বাসা বেঁধে দেওয়া হয়েছে কীভাবে আমি তা মোকাবিলা করব? এর থেকে কীভাবে m1আলাদা হয়:

m2 <- lmer(Obs ~ Treatment * Day + (Treatment|Subject), mydata)
m3 <- lmer(Obs ~ Treatment * Day + (Treatment:Subject), mydata)

এবং হয় m2এবং m3সমতুল্য (এবং যদি না, কেন)?

এছাড়াও, আমি যদি সম্পর্কের কাঠামোটি (যেমন correlation = corAR1) নির্দিষ্ট করতে চান তবে lme4 এর পরিবর্তে nlme ব্যবহার করা দরকার ? পুনরাবৃত্তি ব্যবস্থা অনুসারে , একটি ফ্যাক্টরের উপর বারবার ব্যবস্থা নিয়ে পুনরাবৃত্তি-বিশ্লেষণের জন্য, সমবায় কাঠামো (একই বিষয়ের পরিমাপের মধ্যে পারস্পরিক সম্পর্কের প্রকৃতি) গুরুত্বপূর্ণ।

যখন আমি বারবার ব্যবস্থা আনোভা করার চেষ্টা করছিলাম তখন আমি টাইপ II এসএস ব্যবহার করার সিদ্ধান্ত নিয়েছি; এটি কি এখনও প্রাসঙ্গিক, এবং যদি তাই হয় তবে আমি কীভাবে তা উল্লেখ করব?

ডেটা দেখতে কেমন লাগে তার উদাহরণ এখানে:

mydata <- data.frame(
  Subject  = c(13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 
               34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 
               19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 
               40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 
               29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65), 
  Day       = c(rep(c("Day1", "Day3", "Day6"), each=28)), 
  Treatment = c(rep(c("B", "A", "C", "B", "C", "A", "A", "B", "A", "C", "B", "C", 
                      "A", "A", "B", "A", "C", "B", "C", "A", "A"), each = 4)), 
  Obs       = c(6.472687, 7.017110, 6.200715, 6.613928, 6.829968, 7.387583, 7.367293, 
                8.018853, 7.527408, 6.746739, 7.296910, 6.983360, 6.816621, 6.571689, 
                5.911261, 6.954988, 7.624122, 7.669865, 7.676225, 7.263593, 7.704737, 
                7.328716, 7.295610, 5.964180, 6.880814, 6.926342, 6.926342, 7.562293, 
                6.677607, 7.023526, 6.441864, 7.020875, 7.478931, 7.495336, 7.427709, 
                7.633020, 7.382091, 7.359731, 7.285889, 7.496863, 6.632403, 6.171196, 
                6.306012, 7.253833, 7.594852, 6.915225, 7.220147, 7.298227, 7.573612, 
                7.366550, 7.560513, 7.289078, 7.287802, 7.155336, 7.394452, 7.465383, 
                6.976048, 7.222966, 6.584153, 7.013223, 7.569905, 7.459185, 7.504068, 
                7.801867, 7.598728, 7.475841, 7.511873, 7.518384, 6.618589, 5.854754, 
                6.125749, 6.962720, 7.540600, 7.379861, 7.344189, 7.362815, 7.805802, 
                7.764172, 7.789844, 7.616437, NA, NA, NA, NA))

উত্তর:


18

আমি মনে করি যে আপনার পদ্ধতিটি সঠিক। মডেল m1প্রতিটি বিষয়ের জন্য একটি পৃথক ইন্টারসেপ্ট নির্দিষ্ট করে। মডেল m2প্রতিটি বিষয়ের জন্য একটি পৃথক opeাল যুক্ত করে। বিষয়গুলি কেবলমাত্র একটি চিকিত্সার গ্রুপে অংশগ্রহণ করায় আপনার opeাল পুরো দিন জুড়ে। আপনি যদি মডেলটি m2নিম্নরূপে লিখেন তবে এটি আরও স্পষ্ট যে আপনি প্রতিটি বিষয়ের জন্য একটি পৃথক ইন্টারসেপ্ট এবং opeাল মডেল করেন

m2 <- lmer(Obs ~ Treatment * Day + (1+Day|Subject), mydata)

এটি সমান:

m2 <- lmer(Obs ~ Treatment + Day + Treatment:Day + (1+Day|Subject), mydata)

অর্থাত্ চিকিত্সার প্রধান প্রভাব, দিন এবং দুজনের মধ্যে মিথস্ক্রিয়া।

আমি মনে করি যে যতক্ষণ আপনি চিকিত্সা দলের মধ্যে সাবজেক্ট আইডির পুনরাবৃত্তি না করেন ততক্ষণ বাসা বাঁধার বিষয়ে আপনার চিন্তা করার দরকার নেই। কোন মডেলটি সঠিক, আপনার গবেষণার প্রশ্নের উপর নির্ভর করে। চিকিত্সা প্রভাব ছাড়াও বিষয়গুলির opালু আলাদা হতে পারে তা বিশ্বাস করার কোনও কারণ আছে? আপনি উভয় মডেল চালাতে পারেন এবং তাদের সাথে তুলনা anova(m1,m2)করতে পারবেন ডেটা কোনওটিকে সমর্থন করে কিনা।

আমি নিশ্চিত না আপনি মডেল দিয়ে m3কী প্রকাশ করতে চান ? নেস্টিং সিনট্যাক্সে একটি ব্যবহার করা হয় /, যেমন (1|group/subgroup)

আমি মনে করি না যে এত অল্প সংখ্যক টাইম পয়েন্টের সাথে আপনাকে অটোকোরিয়েশন সম্পর্কে চিন্তা করতে হবে।


এটি সঠিক নয়। চিকিত্সা একটি স্তর -২ পরিবর্তনশীল, এটি সাবজেক্টের মধ্যে নেস্ট করা যায় না।
প্যাট্রিক কলম্বে

স্বতঃসংশ্লিষ্টতা এবং সময় পয়েন্টের সংখ্যা সম্পর্কে: আমি এই উদাহরণে কেবলমাত্র তিনটি ডেটা দেখি তবে আমার আসল তথ্যগুলিতে 8 টি বিভিন্ন দিনে পর্যবেক্ষণ রয়েছে, তাই আমি মনে করি এটি সম্ভবত একটি সমস্যা হবে। কোন ধারণা কিভাবে এটি রাখা?
ফসফোরেলেটেড

1
এছাড়াও, আমি এখন বাসা বাঁধার বিষয়ে বেশ বিভ্রান্ত; (1 + চিকিত্সা / বিষয়) থেকে (1 + চিকিত্সা | বিষয়) পৃথক? "|" কি করে মানে, সরল ইংরেজিতে? আমি যে ব্যাখ্যাগুলি পড়েছি তা বুঝতে পারি না।
ফসফোরলেটেড

ওহে. এখানে "প্রতিটি বিষয়ের পৃথক opeাল" কী? কারণ বিষয়টি একটি ফ্যাক্টর ভেরিয়েবল, ক্রমাগত পরিবর্তনশীল নয় not
22:25

12

আমি আপনার স্বতঃসংশ্লিষ্ট ত্রুটি ইস্যুতে মন্তব্য করতে যথেষ্ট স্বাচ্ছন্দ্য বোধ করি না (বা lme4 বনাম এনএলএম-র বিভিন্ন বাস্তবায়ন সম্পর্কেও) তবে আমি বাকীগুলির সাথে কথা বলতে পারি।

আপনার মডেলটি m1এলোমেলো-ইন্টারসেপ্ট মডেল, যেখানে আপনি চিকিত্সা এবং দিনের মধ্যে ক্রস-লেভেল ইন্টারঅ্যাকশন অন্তর্ভুক্ত করেছেন (চিকিত্সা দলের মধ্যে দিনের প্রভাবটি পরিবর্তিত হওয়ার অনুমতি দেওয়া হয়)। অংশগ্রহণকারীদের মধ্যে সময়ের সাথে পরিবর্তনের অনুমতি দেওয়ার জন্য (অর্থাত্ সময়ের সাথে পরিবর্তনের ক্ষেত্রে স্বতন্ত্র পার্থক্যকে মডেল করার জন্য) আপনাকেও দিবসের প্রভাব এলোমেলোভাবে করার অনুমতি দিতে হবে । এটি করার জন্য, আপনি উল্লেখ করবেন:

m2 <- lmer(Obs ~ Day + Treatment + Day:Treatment + (Day | Subject), mydata)

এই মডেলটিতে:

  • দিন = 0 এ চিকিত্সা রেফারেন্স বিভাগের জন্য পূর্বাভাসিত স্কোর যদি বাধা দেয়
  • দিনের জন্য সহগ হ'ল চিকিত্সার রেফারেন্স বিভাগের জন্য প্রতিটি 1-ইউনিট বৃদ্ধির জন্য সময়ের সাথে সাথে ভবিষ্যদ্বাণী করা পরিবর্তন
  • চিকিত্সা গোষ্ঠীগুলির জন্য দুটি ডামি কোডের সহগগুলি (স্বয়ংক্রিয়ভাবে আরআর দ্বারা নির্মিত) হ'ল প্রতিটি বাকী চিকিত্সা গ্রুপ এবং রেফারেন্স বিভাগের মধ্যে দিন = 0 এর মধ্যে পূর্বাভাসের পার্থক্য
  • দুটি ইন্টারঅ্যাকশন শর্তের সহগগুলি হ'ল রেফারেন্স বিভাগ এবং বাকী চিকিত্সার গোষ্ঠীর মধ্যে পূর্বাভাসযোগ্য স্কোরগুলির সময় (দিন) এর প্রভাবের পার্থক্য।

স্কোর-এ ডে-এর ইন্টারসেপ্ট এবং প্রভাব উভয়ই এলোমেলো (প্রতিটি বিষয়ের ক্ষেত্রে দিবস = 0 এ আলাদা আলাদা পূর্বাভাস প্রাপ্ত স্কোর এবং সময়ের সাথে সাথে একটি পৃথক রৈখিক পরিবর্তন অনুমোদিত)। ইন্টারসেপ্ট এবং opালুগুলির মধ্যে প্রচ্ছন্নতাও মডেল করা হচ্ছে (তাদেরকে কোভারি করার অনুমতি দেওয়া হয়েছে)।

আপনি দেখতে পাচ্ছেন, দুটি ডামি ভেরিয়েবলের সহগের ব্যাখ্যা দিন = 0 এ শর্তযুক্ত। তারা আপনাকে বলবে যে রেফারেন্স বিভাগের জন্য দিন = 0 এ পূর্বাভাসের স্কোরটি বাকি দুটি চিকিত্সা দলের থেকে উল্লেখযোগ্যভাবে পৃথক কিনা। অতএব, আপনি যেখানে আপনার দিন পরিবর্তনশীলটিকে কেন্দ্র করে রাখবেন তা গুরুত্বপূর্ণ। আপনি যদি ১ ম দিনে কেন্দ্রীভূত হন, তবে সহগগুলি আপনাকে বলবে যে 1 তম রেফারেন্স বিভাগের জন্য ভবিষ্যদ্বাণী করা স্কোরটি বাকী দুটি গ্রুপের পূর্বাভাসিত স্কোর থেকে উল্লেখযোগ্যভাবে পৃথক কিনা। এইভাবে, আপনি দেখতে পাচ্ছেন যে গ্রুপগুলির মধ্যে পূর্ব-বিদ্যমান পার্থক্য রয়েছে কিনা । আপনি যদি ৩ য় দিনে কেন্দ্রীভূত হন, তবে সহগগুলি আপনাকে ৩ য় দিনে রেফারেন্স বিভাগের জন্য পূর্বাভাসযোগ্য স্কোর কিনা তা বলে দেয়বাকি দুটি গ্রুপের পূর্বাভাসিত স্কোর থেকে উল্লেখযোগ্যভাবে পৃথক। এইভাবে, আপনি দেখতে পাচ্ছেন যে হস্তক্ষেপের শেষে গ্রুপগুলির মধ্যে পার্থক্য রয়েছে কিনা

পরিশেষে, নোট করুন সাবজেক্টগুলি চিকিত্সার মধ্যে বাসা বাঁধে না । আপনার তিনটি চিকিত্সা এমন কোনও স্তরের জনসংখ্যার এলোমেলো স্তরের নয় যা আপনি আপনার ফলাফলগুলিকে সাধারণীকরণ করতে চান - বরং আপনি যেমন উল্লেখ করেছেন যে আপনার স্তরগুলি স্থির রয়েছে, এবং আপনি কেবলমাত্র এই স্তরগুলিতে আপনার ফলাফলকে সাধারণীকরণ করতে চান। (উল্লেখ করার মতো নয়, আপনার যদি কেবল তিনটি উচ্চ-স্তরের ইউনিট থাকে তবে আপনি মাল্টিলেভেল মডেলিং ব্যবহার করবেন না; দেখুন ম্যাস অ্যান্ড হক্স, 2005 দেখুন)) পরিবর্তে, চিকিত্সাটি একটি স্তর -২ ভবিষ্যদ্বাণী, অর্থাত্ ভবিষ্যদ্বাণী যা পুরো দিনগুলিতে একক মান নেয় (স্তর -1 ইউনিট) প্রতিটি বিষয়। অতএব, এটি কেবল আপনার মডেলটিতে ভবিষ্যদ্বাণী হিসাবে অন্তর্ভুক্ত রয়েছে।

তথ্যসূত্র:
মাআস, সিজেএম, এবং হক্স, জেজে (2005)। মাল্টিলেভেল মডেলিংয়ের জন্য পর্যাপ্ত নমুনা আকার। পদ্ধতি: আচরণ ও সামাজিক বিজ্ঞানের জন্য ইউরোপীয় জার্নাল গবেষণা পদ্ধতি , 1 , 86-92।


1
এটি লিমার দ্বারা অনুমানযোগ্য নয় কারণ obs সংখ্যা <= সংখ্যার এলোমেলো প্রভাব এবং অবশিষ্টাংশগুলি সম্ভবত অজানা।
শুগাং

উত্তরের সূত্র গঠনটি সঠিক is @ শুগাং দ্বারা উল্লিখিত ত্রুটিটি ওভাররাইড করার জন্য, আপনাকে যুক্ত করতে হবে ...,control=lmerControl(check.nobs.vs.nRE="ignore")। বেন বলকারের আরও ব্যাখ্যার জন্য এই লিঙ্কটি দেখুন ।
নিুবিবাং

সুন্দর ব্যাখ্যা। আপনি দয়া করে আরও কিছুটা ব্যাখ্যা করতে পারেন কেন "সাবজেক্টগুলি চিকিত্সার মধ্যে নেস্ট করা হয় না" এবং আপনি কেন + (চিকিত্সা | বিষয়) ত্রুটি শব্দটি তৈরি করেন না এবং কেন কেবল (1 | বিষয়) বা এমনকি (1 | চিকিত্সা * দিন) করেন না )?
স্ক্যান

টেকনিক্যালি আপনি পারে চিকিত্সা মধ্যে নীড় বিষয়, তবে যদি predictor এক যে কোন ব্যাপার আপনি কতবার পরীক্ষা দৌড়ে একই হবে, এটা একটি নির্দিষ্ট (একটি র্যান্ডম নয়) প্রভাব থাকা উচিত। পরীক্ষাগুলি চালানোর সময় যে বিষয়গুলি আলাদা হবে যেমন বিষয়গুলির স্বতন্ত্র বৈশিষ্ট্যগুলি যেমন - তাদের শুরুর মান বা সময়ের সাথে চিকিত্সার পরিবর্তনের প্রতি তাদের অভিব্যক্তিপূর্ণ প্রতিক্রিয়া - এলোমেলো প্রভাব। (1 + Day|Subject)মানে একটি এলোমেলো slালু মডেল, যা প্রতিটি বিষয়ের প্রাথমিক মান (ইন্টারসেপ্ট) এবং ফলাফলের পরিবর্তনের হারকে আলাদা হতে দেয়।
llewmills
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.