মিশ্র প্রভাবগুলির মডেল: একটি গ্রুপিং ভেরিয়েবলের স্তর জুড়ে র্যান্ডম ভেরিয়েন্স উপাদানটির তুলনা করুন


14

আমি ধরুন অংশগ্রহণকারী, প্রতি যাদের একটি প্রতিক্রিয়া দেয় 20 বার, 10 তবে এক শর্তে এবং অন্য 10। আমি প্রতিটি শর্তে তুলনা করে একটি রৈখিক মিশ্র প্রভাবগুলির মডেল ফিট করি । প্যাকেজটি ব্যবহার করে এই পরিস্থিতি অনুকরণ করে এমন একটি পুনরায় উত্পাদনযোগ্য উদাহরণ এখানে রয়েছে :NYওয়াইlme4R

library(lme4)
fml <- "~ condition + (condition | participant_id)"
d <- expand.grid(participant_id=1:40, trial_num=1:10)
d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental"))

set.seed(23432)
d <- cbind(d, simulate(formula(fml), 
                       newparams=list(beta=c(0, .5), 
                                      theta=c(.5, 0, 0), 
                                      sigma=1), 
                       family=gaussian, 
                       newdata=d))

m <- lmer(paste("sim_1 ", fml), data=d)
summary(m)

মডেলটি mদুটি স্থির প্রতিক্রিয়া (শর্তের জন্য একটি ইন্টারসেপ্ট এবং opeাল) এবং তিনটি এলোমেলো প্রভাব (একটি বাই-অংশগ্রহণকারী এলোমেলো ইন্টারসেপ্ট, শর্তের জন্য একটি বাই-অংশগ্রহণকারী এলোমেলো ,াল, এবং একটি ইন্টারসেপ্ট-opeাল সম্পর্ক) লাভ করে।

আমি পরিসংখ্যানগতভাবে সংজ্ঞায়িত গোষ্ঠীগুলিতে উপ-অংশগ্রহণকারী র্যান্ডম ইন্টারসেপ্ট প্রকরণের আকারের তুলনা করতে চাই condition(যেমন, নিয়ন্ত্রণে এবং পরীক্ষামূলক অবস্থার মধ্যে পৃথকভাবে লাল বর্ণিত হ'ল ভেরিয়েন্স উপাদানটি গণনা করুন , তারপরে পরীক্ষা করুন যে উপাদানগুলির আকারের পার্থক্য রয়েছে কিনা? শূন্য নয়)। আমি কীভাবে এটি করব (অগ্রাধিকারত আর)?

এখানে চিত্র বর্ণনা লিখুন


বোনাস

আসুন ধরা যাক মডেলটি আরও জটিল: অংশগ্রহনকারীরা প্রত্যেকে 20 বার 10 বার উদ্দীপনা, একটি শর্তে 10 এবং অন্যরকম 10 টি অনুভব করে। সুতরাং, ক্রস করা এলোমেলো প্রভাবগুলির দুটি সেট রয়েছে: অংশগ্রহণকারীদের জন্য এলোমেলো প্রভাব এবং উদ্দীপকের জন্য এলোমেলো প্রভাব। এখানে একটি পুনরুত্পাদনযোগ্য উদাহরণ:

library(lme4)
fml <- "~ condition + (condition | participant_id) + (condition | stimulus_id)"
d <- expand.grid(participant_id=1:40, stimulus_id=1:10, trial_num=1:10)
d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental"))

set.seed(23432)
d <- cbind(d, simulate(formula(fml), 
                       newparams=list(beta=c(0, .5), 
                                      theta=c(.5, 0, 0, .5, 0, 0), 
                                      sigma=1), 
                       family=gaussian, 
                       newdata=d))

m <- lmer(paste("sim_1 ", fml), data=d)
summary(m)

আমি পরিসংখ্যানগতভাবে সংজ্ঞায়িত গ্রুপগুলি জুড়ে এলোমেলো বাই-অংশগ্রহণকারী ইন্টারসেপ্ট ভেরিয়েন্সের মাত্রা তুলনা করতে চাই condition। আমি কীভাবে এটি করব এবং উপরে বর্ণিত পরিস্থিতিতে প্রক্রিয়াটি কি আলাদা?


সম্পাদনা

আমি যা খুঁজছি সে সম্পর্কে কিছুটা সুনির্দিষ্ট হওয়ার জন্য, আমি জানতে চাই:

  1. প্রশ্নটি কি "প্রতিটি শর্তের মধ্যে শর্তসাপেক্ষ মানে প্রতিক্রিয়াগুলি (যেমন, প্রতিটি শর্তে র্যান্ডম ইন্টারসেপ্ট মানগুলি) একে অপরের থেকে যথেষ্ট পৃথক, নমুনা ত্রুটির কারণে আমরা যা প্রত্যাশা করব তার বাইরে" একটি সুনির্দিষ্ট সংজ্ঞায়িত প্রশ্ন (যেমন, এই প্রশ্নটি কি? এমনকি তাত্ত্বিকভাবে উত্তরযোগ্য)? তা না হলে কেন?
  2. প্রশ্নের উত্তর (1) যদি হ্যাঁ হয় তবে আমি কীভাবে এর উত্তর দেব? আমি একটি Rবাস্তবায়ন পছন্দ করি , তবে আমি lme4প্যাকেজটির সাথে আবদ্ধ নই - উদাহরণস্বরূপ, মনে হচ্ছে OpenMxপ্যাকেজটিতে মাল্টি-গ্রুপ এবং মাল্টি-লেভেল বিশ্লেষণ ( https: //openmx.ssri.psu) সমন্বিত করার ক্ষমতা রয়েছে। ইডু / ওপেনএমএক্স-বৈশিষ্ট্যগুলি ), এবং এটি এমন একটি প্রশ্নের মতো মনে হয় যা একটি এসইএম কাঠামোতে জবাবদিহি করা উচিত।

1
@ মার্কওয়াইট, আমি আপনার মন্তব্যের জবাবে প্রশ্নটি আপডেট করেছি। আমি বলতে চাইছি যে আমি যখন অংশগ্রহণকারীদের নিয়ন্ত্রণ পরীক্ষার ক্ষেত্রে বনাম পরীক্ষামূলকভাবে প্রতিক্রিয়া জানায় তখন সেগুলির মধ্যে প্রমিত বিচ্যুতিগুলির সাথে তুলনা করতে চাই compare আমি এই পরিসংখ্যানগতভাবে করতে চাই, অর্থাত্, যদি ইন্টারসেপ্টগুলির মানক বিচ্যুতির পার্থক্য 0 থেকে আলাদা হয় তবে
প্যাট্রিক এস ফোর্সার

2
আমি একটি উত্তর লিখেছিলাম, তবে এটিতে ঘুমাব কারণ এটি নিশ্চিত নয় যে এটি খুব দরকারী। প্রশ্নটি নেমে আসে যে আমি মনে করি না আপনি যা জিজ্ঞাসা করছেন কেউ তা করতে পারে। ইন্টারসেপ্টের এলোমেলো প্রভাব হ'ল অংশগ্রহণকারীদের যখন তারা নিয়ন্ত্রণ অবস্থায় থাকে তখন তারতম্য। সুতরাং পরীক্ষামূলক অবস্থায় পর্যবেক্ষণের জন্য এর পরিবর্তনের দিকে নজর দেওয়া যায় না। বাধাগুলি ব্যক্তি-স্তরে সংজ্ঞায়িত করা হয়, এবং শর্তটি পর্যবেক্ষণ স্তরে। আপনি যদি শর্তগুলির মধ্যে রূপগুলি তুলনা করার চেষ্টা করছেন তবে আমি শর্তাধীন হেটেরোসেসটাস্টিক মডেলগুলি সম্পর্কে ভাবব।
মার্ক হোয়াইট

2
আমি একটি কাগজটির জন্য একটি সংশোধন ও পুনরায় জমা দেওয়ার বিষয়ে কাজ করছি যেখানে আমার অংশগ্রহণকারীরা রয়েছে যারা উত্তেজনার সেটগুলিতে প্রতিক্রিয়া জানায়। প্রতিটি অংশগ্রহণকারী একাধিক অবস্থার সংস্পর্শে আসে এবং প্রতিটি উদ্দীপনা একাধিক শর্তে একটি প্রতিক্রিয়া পায় - অন্য কথায়, আমার অধ্যয়নটি আমার "বোনাস" বর্ণনায় আমি যে সেটআপটি বর্ণনা করি তা অনুকরণ করে। আমার গ্রাফগুলির মধ্যে একটিতে এটি প্রদর্শিত হয় যে গড় অংশগ্রহণকারীদের প্রতিক্রিয়া অন্য শর্তগুলির তুলনায় এক শর্তে বেশি পরিবর্তনশীলতা রয়েছে। একজন পর্যালোচক আমাকে এটি সত্য কিনা তা পরীক্ষা করতে বলেছিলেন।
প্যাট্রিক এস ফোর্সার

2
গ্রুপিং ভেরিয়েবলের প্রতিটি স্তরের জন্য বিভিন্ন ভেরিয়েন্স প্যারামিটার সহ একটি lme4 মডেল কীভাবে সেটআপ করতে হয় তার জন্য দয়া করে এখানে stats.stackexchange.com/questions/322213 দেখুন । আমি নিশ্চিত না যে কীভাবে দুটি ভেরিয়েন্স প্যারামিটার সমান কিনা তা নিয়ে হাইপোথিসিস পরীক্ষা করা যায়; ব্যক্তিগতভাবে, আমি সবসময় সাবজেক্টের উপর বুটস্ট্র্যাপ পছন্দ করি এবং আত্মবিশ্বাসের ব্যবধান পেতে উদ্দীপনা জাগিয়ে তুলতে পারি, বা সম্ভবত কোনওরকম ক্রম-বিধানের মতো (পুনর্নির্মাণ ভিত্তিক) হাইপোথিসিস পরীক্ষা সেটআপ করতে পারি।
অ্যামিবা

3
আমি @ মার্কউইট'র মন্তব্যের সাথে একমত যে প্রশ্নটি "এলোমেলো ইন্টারসেপ্ট রূপগুলি একে অপরের থেকে যথেষ্ট পৃথক ..." সর্বোত্তম অস্পষ্ট এবং সবচেয়ে খারাপ সংজ্ঞাবহ, কারণ এই বিরতি অবশ্যই একটি নির্দিষ্ট গ্রুপে ওয়াই-মানকে বোঝায় ( গোষ্ঠী 0 এর মান নির্ধারিত করে, তাই কঠোরভাবে বলা গোষ্ঠীগুলির মধ্যে "ইন্টারসেপ্ট" তুলনা করা অর্থপূর্ণ নয়। আমি মনে করি আপনার প্রশ্নটির পুনঃব্যবহারের আরও ভাল উপায়, যেমনটি আমি এটি বুঝতে পারি এরকম কিছু হবে: "শর্তাবলীর বি বনাম শর্ত বি অসম্পূর্ণ শর্তে অংশগ্রহণকারীদের শর্তাধীন গড় প্রতিক্রিয়াগুলি কি বৈকল্পিক?"
জেক ওয়েস্টফল

উত্তর:


6

এই অনুমানটি পরীক্ষা করার একাধিক উপায় রয়েছে। উদাহরণস্বরূপ, @amoeba দ্বারা বর্ণিত পদ্ধতিতে কাজ করা উচিত। তবে আমার কাছে মনে হয় এটির সহজ পরীক্ষা করার সবচেয়ে সহজ উপায় দুটি নেস্টেড মডেলের তুলনা করে একটি ভাল পুরানো সম্ভাবনা অনুপাতের পরীক্ষাটি ব্যবহার করা হচ্ছে। এই পদ্ধতির একমাত্র সম্ভাব্য কৌশলগত অংশটি কীভাবে মডেলগুলির জুটি সেট আপ করতে হবে তা জানার জন্য যাতে কোনও একক প্যারামিটার বাদ দেওয়া অসম বৈকল্পের কাঙ্ক্ষিত অনুমানকে পরিষ্কারভাবে পরীক্ষা করতে পারে। এটি কীভাবে করবেন তা নীচে আমি ব্যাখ্যা করছি।

সংক্ষিপ্ত উত্তর

আপনার স্বাধীন পরিবর্তনশীলটির জন্য কোডিং এর বিপরীতে (শূন্যের সমষ্টি) স্যুইচ করুন এবং তারপরে সম্ভাবনা অনুপাতের পরীক্ষাটি আপনার সম্পূর্ণ মডেলটির সাথে এমন মডেলের তুলনা করুন যা এলোমেলো slালু এবং এলোমেলো ইন্টারসেপ্টের মধ্যে পারস্পরিক সম্পর্ককে 0 হতে বাধ্য করে:

# switch to numeric (not factor) contrast codes
d$contrast <- 2*(d$condition == 'experimental') - 1

# reduced model without correlation parameter
mod1 <- lmer(sim_1 ~ contrast + (contrast || participant_id), data=d)

# full model with correlation parameter
mod2 <- lmer(sim_1 ~ contrast + (contrast | participant_id), data=d)

# likelihood ratio test
anova(mod1, mod2)

ভিজ্যুয়াল ব্যাখ্যা / অন্তর্দৃষ্টি

এই উত্তরটি বোঝার জন্য যাতে আপনার সাথে সম্পর্কিত সম্পর্কের প্যারামিটারের বিভিন্ন মান পর্যবেক্ষণ করা তথ্যের জন্য বোঝায় সে সম্পর্কে একটি স্বজ্ঞাত জ্ঞান থাকা দরকার। (এলোমেলোভাবে পরিবর্তিত) বিষয়-ভিত্তিক রিগ্রেশন লাইনগুলি বিবেচনা করুন। মূলত, পারস্পরিক সম্পর্কের প্যারামিটারটি নিয়ন্ত্রণ করে যে অংশগ্রহনকারী রিগ্রেশন লাইনগুলি "ডানদিকে ফ্যান আউট" (ধনাত্মক সম্পর্ক) বা "ফ্যান আউট বাম" (নেগেটিভ পারস্পরিক সম্পর্ক) বিন্দুটি , যেখানে এক্স আপনার বিপরীতে কোডযুক্ত স্বতন্ত্র পরিবর্তনশীল। অংশগ্রহণকারীদের শর্তাধীন গড় প্রতিক্রিয়াগুলিতে এই উভয়ই অসম বৈকল্পিক। এটি নীচে চিত্রিত:এক্স=0

এলোমেলো সম্পর্ক

এই চক্রান্তে, আমরা প্রতিটি শর্তে প্রতিটি বিষয়ের জন্য আমাদের একাধিক পর্যবেক্ষণ উপেক্ষা করে এবং পরিবর্তে কেবল প্রতিটি বিষয়ের দুটি এলোমেলো উপায়ে প্লট করি, যার সাথে একটি লাইন যুক্ত হয়, যা বিষয়টির এলোমেলো slাল উপস্থাপন করে। (এটি ওপিতে পোস্ট করা ডেটা নয়, 10 টি অনুমানীয় বিষয় থেকে ডেটা তৈরি করা হয়েছে))

বামদিকে কলামে, যেখানে শক্তিশালী নেতিবাচক opeাল-বিরতি সম্পর্কিত সম্পর্ক রয়েছে, পয়েন্টের তুলনায় রিগ্রেশন লাইনগুলি বাম দিকে ফ্যান আউট করে । আপনি চিত্র পরিষ্কারভাবে দেখতে পারেন, অবস্থায় প্রজা 'র্যান্ডম মানে অধিক ভ্যারিয়েন্স এই বিশালাকার অবস্থায় চেয়েএক্স=0এক্স = - 1 এক্স = 1এক্স=-1এক্স=1

ডানদিকে কলামটি এই প্যাটার্নটির বিপরীত, আয়না চিত্রটি দেখায়। এক্ষেত্রে শর্তের চেয়ে শর্তাবলী ক্ষেত্রে বিষয়গুলির র্যান্ডমের ক্ষেত্রে আরও বেশি পার্থক্য রয়েছে ।এক্স=1এক্স=-1

মাঝের কলামটি এলোমেলো slালু এবং এলোমেলো ইন্টারসেপ্টগুলি অসংযুক্ত না হলে কী ঘটে তা দেখায়। এর অর্থ হ'ল রেগ্রেশন লাইনগুলি ডানদিকে যতটা ডানদিকে ফ্যান আউট করে ঠিক ঠিক তেমন বিন্দু তুলনা করে । এটি বোঝায় যে দুটি শর্তে বিষয়গুলির অর্থের বৈচিত্রগুলি সমান।এক্স=0

এটা তোলে গুরুত্বপূর্ণ এখানে যে আমরা একটি সমষ্টি-টু-শূন্য বিপরীতে কোডিং স্কিম ব্যবহার করেছি না ডামি কোড (যে, এ গ্রুপ সেটিং না বনাম )। এটি কেবলমাত্র বৈসাদৃশ্য কোডিং স্কিমের আওতায় রয়েছে যার সাথে আমাদের এই সম্পর্ক রয়েছে যেখানে বৈকল্পিকগুলি সমান হয় এবং কেবল theাল-আটকানো পারস্পরিক সম্পর্ক যদি 0 হয় তবে নীচের চিত্রটি এই স্বজ্ঞাততাটি তৈরি করার চেষ্টা করে:এক্স=0এক্স=1

এখানে চিত্র বর্ণনা লিখুন

এই চিত্রটি যা দেখায় তা হ'ল উভয় কলামে একই ডেটাসেট, তবে স্বতন্ত্র ভেরিয়েবলের সাথে কোডেড দুটি ভিন্ন উপায়ে। বাম দিকের কলামে আমরা বিপরীতে কোডগুলি ব্যবহার করি - প্রথম চিত্র থেকে ঠিক একই অবস্থা। ডানদিকে কলামে আমরা ডামি কোড ব্যবহার করি। এটি ইন্টারসেপ্টগুলির অর্থকে পরিবর্তিত করে - এখন ইন্টারসেপ্টগুলি নিয়ন্ত্রণ গ্রুপে বিষয়গুলির পূর্বাভাসিত প্রতিক্রিয়াগুলি উপস্থাপন করে। নীচের প্যানেলটি এই পরিবর্তনের পরিণামটি দেখায়, যথা, opeাল-আটকানো পারস্পরিক সম্পর্কটি আর কোথাও 0 এর কাছাকাছি নেই, যদিও ডেটা গভীর অর্থে একই এবং শর্তসাপেক্ষ রূপগুলি উভয় ক্ষেত্রেই সমান। যদি এখনও এটি খুব একটা বোধগম্য মনে হয় না, আমার পূর্ববর্তী উত্তরটি অধ্যয়ন করা যেখানে আমি এই প্রপঞ্চটি সম্পর্কে আরও বেশি কথা বলব তাতে সহায়তা হতে পারে।

প্রমাণ

যাক হতে তম প্রতিক্রিয়া অবস্থার অধীনে তম বিষয় । (আমাদের এখানে দুটি মাত্র শর্ত রয়েছে, সুতরাং মাত্র 1 বা 2 হয়)) তারপরে মিশ্র মডেলটি যেখানে বিষয়গুলির র্যান্ডম ইন্টারসেপ্টগুলি লেখা যেতে পারে এবং ভেরিয়েন্সটি রয়েছে , বিষয়গুলির এলোমেলো এবং তারতম্য রয়েছে , পর্যবেক্ষণ-স্তরের ত্রুটি শব্দ এবং ।Yআমিআমি

Yআমি=αআমি+ +βআমিএক্স+ +আমি,
αআমিσα2βআমিσβ2আমিcov(αআমি,βআমি)=σαβ

আমরা to

Var(αআমি+ +βআমিএক্স1)=Var(αআমি+ +βআমিএক্স2)σαβ=0।

এই বাম পাশ দিয়ে

Var(αআমি+ +βআমিএক্স1)=Var(αআমি+ +βআমিএক্স2)σα2+ +এক্স12σβ2+ +2এক্স1σαβ=σα2+ +এক্স22σβ2+ +2এক্স2σαβσβ2(এক্স12-এক্স22)+ +2σαβ(এক্স1-এক্স2)=0।

সম-থেকে-শূন্যের বিপরীতে কোডগুলি বোঝায় যে এবং । তারপরে আমরা উপরের শেষ লাইনটিকে আরও কমিয়ে যা আমরা প্রমাণ করতে চেয়েছিলাম। (অন্তর্ভুক্তির অন্য দিকটি প্রতিষ্ঠিত করতে আমরা কেবল একই ধাপগুলি বিপরীতে অনুসরণ করতে পারি))এক্স1+ +এক্স2=0এক্স12=এক্স22=এক্স2

σβ2(এক্স2-এক্স2)+ +2σαβ(এক্স1+ +এক্স1)=0σαβ=0,

পুনরাবৃত্তি করা, এ থেকে জানা যায় যদি স্বাধীন পরিবর্তনশীল এর বিপরীতে (শূন্য থেকে সমষ্টি) কোডেড হয় , তারপর প্রতিটি অবস্থায় প্রজা 'র্যান্ডম উপায়ে ভেরিয়ানস সমান যদি এবং কেবল যদি র্যান্ডম ঢালে এবং র্যান্ডম বিবৃতি মধ্যে পারস্পরিক 0. কী এগুলি থেকে গ্রহণযোগ্য পয়েন্টটি হ'ল নাল অনুমানের পরীক্ষা করা ওপি দ্বারা বর্ণিত সমান পরিবর্তনের নাল অনুমানকে পরীক্ষা করবে testσαβ=0

স্বতন্ত্র ভেরিয়েবলটি যদি ডামি কোডড হয় তবে এটি কাজ করে না। বিশেষত, আমরা যদি উপরের সমীকরণগুলিতে এবং মানগুলিকে প্লাগ করি তবে আমরা দেখতে পাই যে এক্স1=0এক্স2=1

Var(αআমি)=Var(αআমি+ +βআমি)σαβ=-σβ22


এটি ইতিমধ্যে একটি ভয়ঙ্কর উত্তর, আপনাকে ধন্যবাদ! আমি মনে করি এটি আমার প্রশ্নের উত্তর দেওয়ার সবচেয়ে কাছাকাছি এসে গেছে, তাই আমি এটি গ্রহণ করছি এবং আপনাকে অনুগ্রহ দিচ্ছি (এটি সমাপ্ত হতে চলেছে) তবে আমি যদি আপনার কাছে সময় এবং শক্তি থাকে তবে আমি একটি বীজগণিতীয় ন্যায়সঙ্গততা দেখতে পছন্দ করব।
প্যাট্রিক এস ফার্সচার

1
@ প্যাট্রিকস.ফোরচার আমি কেবল একটি প্রমাণ যুক্ত করেছি
জেক ওয়েস্টফল

1
@ জ্যাকওয়েস্টফল আমার খেলনা উদাহরণে বিষয়গুলি দুটি শর্তে সাড়া ফেলেছে। একটি বিষয় প্রতিক্রিয়া থাকে শর্ত একটি এবং শর্ত বি, তাহলে কি এই বিষয় জন্য র্যান্ডম পথিমধ্যে এর BLUP মান হতে যখন আমরা ব্যবহার করেন মডেল? আমি মনে করি এটি কেবলমাত্র 0 হতে পারে all সমস্ত বিষয়ে যদি শূন্যের সমান BLUPs থাকে তবে এলোমেলো ইন্টারসেপ্টের বৈকল্পিকটিও শূন্য। সুতরাং এই মডেলটি এই খেলনা উদাহরণটি মোটেও ফিট করতে পারে না। বিপরীতে, উপরে বর্ণিত মডেলটির প্রতিটি বিষয়ের জন্য দুটি বিএলইউপি থাকবে এবং সেগুলি সহজেই এবং হতে পারে । আমি কি এখানে কিছু মিস করছি? - a a - aএকটি-একটি(1 | subject)dummyএকটি-একটি
অ্যামিবা বলছেন মনিকাকে

1
আমি এখন দেখতে পাচ্ছি যে আপনি ঠিক অ্যামিবা, ব্যাখ্যা করার জন্য ধন্যবাদ। আমি আমার উত্তর অনুসারে সম্পাদনা করব।
জ্যাক ওয়েস্টফল

1
@ অ্যামিবা আপনি ঠিক বলেছেন যে মডেলটিতে কোনও সম্পর্কযুক্ত পরামিতি ছাড়াই বিএলইউপিএসও পারস্পরিক সম্পর্কযুক্ত হয়ে আসতে পারে। তবে আমি বিশ্বাস করি যে পরীক্ষার উদ্দেশ্যে প্রক্রিয়াটি এখনও লক্ষ্য হিসাবে কাজ করে (উদাহরণস্বরূপ, এটির নামমাত্র টাইপ 1 ত্রুটির হার রয়েছে) কারণ কেবলমাত্র পারস্পরিক সম্পর্কযুক্ত পরামিতিই সম্ভাবনা ফাংশনটিতে এটি অন্তর্ভুক্ত করতে সক্ষম হয় এবং এর জন্য "creditণ গ্রহণ" করতে সক্ষম হয় । এটি হ'ল, এমনকি যদি বিএলইপিগুলি সহজ মডেলটির সাথে সম্পর্কিত হয়, তবে এটি এখনও মনে হয় যে প্রভাবগুলি যতটা সম্ভব সম্ভাবনার সাথে সম্পর্কযুক্ত নয়, তাই এলআর পরীক্ষা কার্যকর হবে। আমি মনে করি :)
জেক ওয়েস্টফল

6

আপনি lme4 প্যাকেজটির কার্যকারিতা অনুমান করা আত্মবিশ্বাসের অন্তরগুলির সাহায্যে মডেল পরামিতিগুলির তাত্পর্য পরীক্ষা করতে পারেন confint.merMod

বুটস্ট্র্যাপিং (উদাহরণস্বরূপ বুটস্ট্র্যাপ থেকে আত্মবিশ্বাসের অন্তর দেখুন )

> confint(m, method="boot", nsim=500, oldNames= FALSE)
Computing bootstrap confidence intervals ...
                                                           2.5 %     97.5 %
sd_(Intercept)|participant_id                         0.32764600 0.64763277
cor_conditionexperimental.(Intercept)|participant_id -1.00000000 1.00000000
sd_conditionexperimental|participant_id               0.02249989 0.46871800
sigma                                                 0.97933979 1.08314696
(Intercept)                                          -0.29669088 0.06169473
conditionexperimental                                 0.26539992 0.60940435 

সম্ভাবনা প্রোফাইল (উদাহরণস্বরূপ দেখুন প্রোফাইল সম্ভাবনা এবং আত্মবিশ্বাসের অন্তরগুলির মধ্যে সম্পর্ক কী? )

> confint(m, method="profile", oldNames= FALSE)
Computing profile confidence intervals ...
                                                          2.5 %     97.5 %
sd_(Intercept)|participant_id                         0.3490878 0.66714551
cor_conditionexperimental.(Intercept)|participant_id -1.0000000 1.00000000
sd_conditionexperimental|participant_id               0.0000000 0.49076950
sigma                                                 0.9759407 1.08217870
(Intercept)                                          -0.2999380 0.07194055
conditionexperimental                                 0.2707319 0.60727448

  • একটি পদ্ধতি আছে 'Wald'তবে এটি কেবল স্থির প্রভাবের জন্য প্রয়োগ করা হয়।

  • প্যাকেজে lmerTestনাম প্রকাশিত এক ধরণের আনোভা (সম্ভাবনা অনুপাত) প্রকাশের এক ধরণের উপস্থিতিও রয়েছে ranova। তবে আমি এটিকে বোঝার মতো মনে করি না। লগলাইকেন্সিতে পার্থক্যগুলির বিতরণ, যখন নাল অনুমান (এলোমেলো প্রভাবের জন্য শূন্য প্রকরণ) সত্য হয় তা চি-বর্গ বিতরণ করা হয় না (সম্ভবত যখন অংশগ্রহণকারী এবং পরীক্ষার সংখ্যা বেশি থাকে সম্ভাবনা অনুপাতের পরীক্ষাটি বোঝা যায়)।


নির্দিষ্ট গ্রুপে বৈকল্পিকতা

নির্দিষ্ট গ্রুপগুলিতে পরিবর্তনের জন্য ফলাফলগুলি পুনর্নির্মাণ করতে পারেন me

# different model with alternative parameterization (and also correlation taken out) 
fml1 <- "~ condition + (0 + control + experimental || participant_id) "

যেখানে আমরা ডেটা-ফ্রেমে দুটি কলাম যুক্ত করেছি (এটি কেবল তখনই প্রয়োজন যদি আপনি অ-সম্পর্কযুক্ত 'নিয়ন্ত্রণ' এবং 'পরীক্ষামূলক' ফাংশনটি (0 + condition || participant_id)মূল্যায়ন করতে চান তবে অ-সম্পর্কযুক্ত হিসাবে শর্তে বিভিন্ন কারণের মূল্যায়ন করতে না পারে)

#adding extra columns for control and experimental
d <- cbind(d,as.numeric(d$condition=='control'))
d <- cbind(d,1-as.numeric(d$condition=='control'))
names(d)[c(4,5)] <- c("control","experimental")

এখন lmerবিভিন্ন গ্রুপের জন্য বৈচিত্র্য দেবে

> m <- lmer(paste("sim_1 ", fml1), data=d)
> m
Linear mixed model fit by REML ['lmerModLmerTest']
Formula: paste("sim_1 ", fml1)
   Data: d
REML criterion at convergence: 2408.186
Random effects:
 Groups           Name         Std.Dev.
 participant_id   control      0.4963  
 participant_id.1 experimental 0.4554  
 Residual                      1.0268  
Number of obs: 800, groups:  participant_id, 40
Fixed Effects:
          (Intercept)  conditionexperimental  
               -0.114                  0.439 

এবং আপনি এগুলিতে প্রোফাইল পদ্ধতি প্রয়োগ করতে পারেন। উদাহরণস্বরূপ এখন সীমাবদ্ধতা নিয়ন্ত্রণ এবং বহির্মুখী বৈকল্পিকতার জন্য আত্মবিশ্বাসের অন্তর দেয়।

> confint(m, method="profile", oldNames= FALSE)
Computing profile confidence intervals ...
                                    2.5 %     97.5 %
sd_control|participant_id       0.3490873 0.66714568
sd_experimental|participant_id  0.3106425 0.61975534
sigma                           0.9759407 1.08217872
(Intercept)                    -0.2999382 0.07194076
conditionexperimental           0.1865125 0.69149396

সরলতা

আপনি আরও উন্নত তুলনা পেতে সম্ভাবনা ফাংশনটি ব্যবহার করতে পারেন, তবে রাস্তাটি বরাবর আনুমানিকতা তৈরি করার অনেকগুলি উপায় রয়েছে (যেমন আপনি একটি রক্ষণশীল অ্যানোভা / এলআরটি-পরীক্ষা করতে পারেন, তবে এটি কি আপনি চান?)।

এই মুহুর্তে এটি আমাকে বিস্মিত করে তোলে প্রকৃতপক্ষে বৈকল্পিকগুলির মধ্যে এটির (এত সাধারণ নয়) তুলনা করার বিষয়টি আসলে কী। আমি ভাবছি এটি খুব পরিশীলিত হতে শুরু করে কিনা। কেন পার্থক্য পরিবর্তে ভেরিয়ানস মধ্যে অনুপাত ভেরিয়ানস মধ্যে (যা শাস্ত্রীয় এফ বন্টন সম্পর্কিত)? কেন শুধু আত্মবিশ্বাসের বিরতি রিপোর্ট করবেন না? আমাদের একটি পদক্ষেপ ফিরে নেওয়া উচিত, এবং পরিসংখ্যানগত বিষয় এবং পরিসংখ্যানগত বিবেচনার সাথে প্রকৃতপক্ষে মূল বিষয় হ'ল অতিমাত্রায় এবং আলগা স্পর্শ হতে পারে এমন উন্নত পথগুলিতে যাওয়ার আগে আমাদের যে ডেটা এবং গল্পটি বলার কথা রয়েছে তা স্পষ্ট করা দরকার।

আমি আশ্চর্য হয়েছি যে কেবল আত্মবিশ্বাসের ব্যবস্থাগুলি বর্ণনা করা (যা আসলে অনুমানের পরীক্ষার চেয়ে আসলে আরও অনেক কিছু বলতে পারে, তার চেয়ে বেশি কিছু করা উচিত কিনা। হাইপোথিসিস টেস্টটি হ্যাঁর কোনও উত্তর দেয় না তবে জনসংখ্যার প্রকৃত বিস্তার সম্পর্কে কোনও তথ্য দেয় না enough পর্যাপ্ত তথ্য আপনি দিতে পারেন উল্লেখযোগ্য পার্থক্য হিসাবে প্রতিবেদন করতে যে কোনও সামান্য পার্থক্য তৈরি করুন)। এই বিষয়ে আরও গভীরভাবে যেতে (যে কোনও উদ্দেশ্যেই) প্রয়োজন, আমি বিশ্বাস করি, গাণিতিক যন্ত্রপাতিটিকে যথাযথ সরলীকরণের জন্য গাইড করার জন্য একটি আরও সুনির্দিষ্ট (সংক্ষিপ্তভাবে সংজ্ঞায়িত) গবেষণা প্রশ্ন (এমনকি যখন একটি সঠিক গণনা সম্ভব হয় বা কখন হতে পারে) এটি সিমুলেশন / বুটস্ট্র্যাপিং দ্বারা প্রায় অনুমান করা যায়, তারপরেও কিছু সেটিংসে এটি এখনও কিছু উপযুক্ত ব্যাখ্যার প্রয়োজন হয়)। কোনও (বিশেষত) প্রশ্ন (কন্টিনজেন্সি টেবিলগুলি সম্পর্কে) সমাধান করার জন্য ফিশারের সঠিক পরীক্ষার সাথে তুলনা করুন,

সহজ উদাহরণ

যে সরলতার সম্ভব তা উদাহরণ দেওয়ার জন্য আমি পৃথক গড় প্রতিক্রিয়াগুলির সাথে বৈকল্পিকের তুলনা করে এফ-টেস্টের ভিত্তিতে দুটি গ্রুপের পার্থক্যের মধ্যে একটি সাধারণ মূল্যায়নের সাথে তুলনা (সিমুলেশন দ্বারা) নীচে দেখাই মিশ্র মডেল থেকে প্রাপ্ত বৈকল্পিক।

এফ-পরীক্ষার জন্য আমরা দুটি গ্রুপের ব্যক্তির মানগুলির (অর্থ) পরিবর্তনের তুলনা করি। এই উপায়গুলি শর্ত হিসাবে বিতরণ করা হয়:j

Y^i,jN(μj,σj2+σϵ210)

যদি পরিমাপের ত্রুটিটির বৈকল্পিকতা সকল ব্যক্তি এবং শর্তের জন্য সমান হয় এবং যদি দুটি conditions ( ) এর বৈকল্পিক সমান হয় তবে জন্য অনুপাতটি 1 শর্তে 40 টির জন্য এবং 2 শর্তে 40 টির অর্থের জন্য বৈকল্পিকটি এফ-ডিস্ট্রিবিউশন অনুসারে বিতরণ করা হয় ডিগ্রি এবং ডিনোমিনেটরের জন্য 39 এবং 39 এর ডিগ্রি সহ স্বাধীনতা ডিগ্রি সহ।σ = { 1 , 2 }σεσ={1,2}

আপনি এটি নীচের গ্রাফের সিমুলেশনটিতে দেখতে পারেন যেখানে নমুনার উপর ভিত্তি করে এফ-স্কোরের একদিকে অর্থ একটি মডেল থেকে পূর্বাভাসিত রূপগুলি (বা স্কোয়ার ত্রুটির পরিমাণ) এর ভিত্তিতে একটি এফ-স্কোর গণনা করা হয়।

নির্ভুলতার মধ্যে উদাহরণ পার্থক্য

চিত্রটি 000 এবং ব্যবহার করে 10 000 পুনরাবৃত্তির সাথে চিত্রটি মডেল করা হয়েছে ।σ ϵ = 1σ=1=σ=2=0.5σε=1

আপনি কিছু পার্থক্য আছে দেখতে পারেন। এই পার্থক্যটি এই কারণে হতে পারে যে মিশ্র প্রভাবগুলি লিনিয়ার মডেলটি স্কোয়ারড ত্রুটির পরিমাণটি (এলোমেলো প্রভাবের জন্য) অন্যভাবে অর্জন করছে। এবং এই স্কোয়ার ত্রুটির শর্তগুলি (আর) ভালভাবে সরল চি-স্কোয়ার ডিস্ট্রিবিউশন হিসাবে ভালভাবে প্রকাশিত হয় না, তবে এখনও তারা নিবিড়ভাবে সম্পর্কিত এবং সেগুলি প্রায় অনুমান করা যায়।

নাল-অনুমানটি সত্য হলে (ছোট) পার্থক্যটি বাদ দিয়ে নাল অনুমানটি সত্য না হলে আরও আকর্ষণীয় বিষয়টি ঘটে। বিশেষ করে শর্ত যখন । মানে বিতরণের না শুধুমাত্র ঐ উপর নির্ভরশীল কিন্তু পরিমাপ ত্রুটি । মিশ্র প্রভাবগুলির মডেলের ক্ষেত্রে এই পরবর্তী ত্রুটিটি 'ফিল্টার আউট' হয় এবং এটি প্রত্যাশা করা হয় যে এলোমেলো প্রভাবগুলির মডেল বৈকল্পিকগুলির উপর ভিত্তি করে এফ-স্কোরের উচ্চতর শক্তি রয়েছে।ওয়াই আমি , σ σ εσ=1σ=2ওয়াই^আমি,σσε

ক্ষমতা মধ্যে উদাহরণ পার্থক্য

চিত্রটি 000 , এবং ব্যবহার করে 10 000 পুনরাবৃত্তির সাথে চিত্রটি মডেল করা হয়েছে ।σ জে = 2 = 0.25 σ ϵ = 1σ=1=0.5σ=2=0.25σε=1

সুতরাং উপায় উপর ভিত্তি করে মডেল খুব নির্ভুল। তবে এটি কম শক্তিশালী। এটি দেখায় যে সঠিক কৌশলটি আপনি যা চান / প্রয়োজন তার উপর নির্ভর করে।

উপরের উদাহরণে যখন আপনি ডান লেজের সীমানাটি ২.১ এবং ৩.১ এ সেট করেন আপনি সমান বৈচিত্র্যের ক্ষেত্রে জনসংখ্যার প্রায় 1% পান (10 000 মামলার ক্ষেত্রে 103 এবং 104) তবে অসম বৈষম্যের ক্ষেত্রে এই সীমানা পৃথক হয় অনেক (5334 এবং 6716 কেস দেওয়া)

কোড:

set.seed(23432)

# different model with alternative parameterization (and also correlation taken out)
fml1 <- "~ condition + (0 + control + experimental || participant_id) "
fml <- "~ condition + (condition | participant_id)"

n <- 10000

theta_m <- matrix(rep(0,n*2),n)
theta_f <- matrix(rep(0,n*2),n)

# initial data frame later changed into d by adding a sixth sim_1 column
ds <- expand.grid(participant_id=1:40, trial_num=1:10)
ds <- rbind(cbind(ds, condition="control"), cbind(ds, condition="experimental"))
  #adding extra columns for control and experimental
  ds <- cbind(ds,as.numeric(ds$condition=='control'))
  ds <- cbind(ds,1-as.numeric(ds$condition=='control'))
  names(ds)[c(4,5)] <- c("control","experimental")

# defining variances for the population of individual means
stdevs <- c(0.5,0.5) # c(control,experimental)

pb <- txtProgressBar(title = "progress bar", min = 0,
                    max = n, style=3)
for (i in 1:n) {

  indv_means <- c(rep(0,40)+rnorm(40,0,stdevs[1]),rep(0.5,40)+rnorm(40,0,stdevs[2]))
  fill <- indv_means[d[,1]+d[,5]*40]+rnorm(80*10,0,sqrt(1)) #using a different way to make the data because the simulate is not creating independent data in the two groups 
  #fill <- suppressMessages(simulate(formula(fml), 
  #                     newparams=list(beta=c(0, .5), 
  #                                    theta=c(.5, 0, 0), 
  #                                    sigma=1), 
  #                     family=gaussian, 
  #                     newdata=ds))
  d <- cbind(ds, fill)
  names(d)[6] <- c("sim_1")


  m <- lmer(paste("sim_1 ", fml1), data=d)
  m
  theta_m[i,] <- m@theta^2

  imeans <- aggregate(d[, 6], list(d[,c(1)],d[,c(3)]), mean)
  theta_f[i,1] <- var(imeans[c(1:40),3])
  theta_f[i,2] <- var(imeans[c(41:80),3])

  setTxtProgressBar(pb, i)
}
close(pb)

p1 <- hist(theta_f[,1]/theta_f[,2], breaks = seq(0,6,0.06))       
fr <- theta_m[,1]/theta_m[,2]
fr <- fr[which(fr<30)]
p2 <- hist(fr, breaks = seq(0,30,0.06))



plot(-100,-100, xlim=c(0,6), ylim=c(0,800), 
     xlab="F-score", ylab = "counts [n out of 10 000]")
plot( p1, col=rgb(0,0,1,1/4), xlim=c(0,6), ylim=c(0,800), add=T)  # means based F-score
plot( p2, col=rgb(1,0,0,1/4), xlim=c(0,6), ylim=c(0,800), add=T)  # model based F-score
fr <- seq(0, 4, 0.01)
lines(fr,df(fr,39,39)*n*0.06,col=1)
legend(2, 800, c("means based F-score","mixed regression based F-score"), 
       fill=c(rgb(0,0,1,1/4),rgb(1,0,0,1/4)),box.col =NA, bg = NA)
legend(2, 760, c("F(39,39) distribution"), 
       lty=c(1),box.col = NA,bg = NA)
title(expression(paste(sigma[1]==0.5, " , ", sigma[2]==0.5, " and ", sigma[epsilon]==1)))

এটি দরকারী তবে দুটি অবস্থার মধ্যে কীভাবে বৈকল্পিকগুলি তুলনা করা যায় সে সম্পর্কে প্রশ্নটির দিকে লক্ষ্য করা যাচ্ছে না।
অ্যামিবা

@ অ্যামিবা আমি দেখতে পেলাম যে এই উত্তরটি সমস্যার মূল বিষয়টি দেয় (এলোমেলো ভেরিয়েন্স উপাদানগুলির পরীক্ষার বিষয়ে)। ওপি স্পষ্টভাবে যা চায় তা পুরো পাঠ্যে পড়া কঠিন। "র্যান্ডম ইন্টারসেপ্ট রূপগুলি" কী বোঝায়? (ইন্টারসেপ্টের ক্ষেত্রে বহুবচন আমাকে বিভ্রান্ত করে) একটি সম্ভাব্য কেস হতে পারে যে মডেলটি sim_1 ~ condition + (0 + condition | participant_id)"আপনি পরামিতিটি দুটি প্যারামিটারে (প্রতিটি গ্রুপের জন্য একটি) পেয়েছেন তার পরিবর্তে ইন্টারসেপ্টের জন্য দুটি পরামিতি এবং একটি প্রভাবের জন্য (যা একটি) গ্রুপগুলির জন্য সম্মিলিত হওয়া দরকার)।
সেক্সটাস এম্পেরিকাস

প্রতিটি বিষয়ের ক শর্তে কিছু গড় প্রতিক্রিয়া রয়েছে এবং কিছু শর্তে বিগত প্রতিক্রিয়া রয়েছে। এ প্রশ্নে এ-এর বিষয়গুলির পার্থক্যগুলি বি-তে বিভিন্ন বিষয়গুলির চেয়ে পৃথক কিনা
অ্যামিবা বলেছেন

এটি "একটি গ্রুপিং ভেরিয়েবলের স্তর জুড়ে এলোমেলো ভেরিয়েন্স উপাদানটির তুলনা করুন" শিরোনামে করা কার্যটি সম্পূর্ণ করে না। আমি লক্ষ্য করেছি যে প্রশ্নটির শরীরে একটি বিভ্রান্তিকর টাইপো ছিল, যা আমি স্থির করেছি। আমি প্রশ্নের শব্দটি আরও স্পষ্ট করার চেষ্টা করেছি।
প্যাট্রিক এস ফার্সচার

car::linearHypothesisTest( Math.furman.edu/~dcs/courses/math47/R/library/car/html/… ) ব্যবহার করে প্রশ্নের উত্তর দেওয়া সম্ভব হতে পারে , যা ব্যবহারকারীকে একটি উপযুক্ত মডেল দিয়ে স্বেচ্ছাসেবী হাইপোথেসিগুলি পরীক্ষা করতে দেয়। তবে একই মডেল লাগানো মডেলটিতে উভয় এলোমেলো ইন্টারসেপ্ট পেতে আমাকে @ অ্যামিবার পদ্ধতি ব্যবহার করতে হবে যাতে তাদের এই ফাংশনের সাথে তুলনা করা যায়। পদ্ধতির বৈধতা সম্পর্কে আমিও কিছুটা অনিশ্চিত।
প্যাট্রিক এস ফার্সচার

5

অপেক্ষাকৃত সরল-এগিয়ে যাওয়ার উপায় হ'ল FAQ এanova বর্ণিত হিসাবে সম্ভাবনা-অনুপাতের পরীক্ষা ব্যবহার করা ।lme4

আমরা একটি সম্পূর্ণ মডেল দিয়ে শুরু করি যেখানে বৈকল্পিকগুলি নিয়ন্ত্রণহীন (অর্থাত্ দুটি পৃথক রূপের অনুমতি দেওয়া হয়) এবং তারপরে একটি সীমাবদ্ধ মডেল ফিট করে যেখানে দুটি রূপ সমান বলে ধরে নেওয়া হয়। আমরা কেবল তাদের সাথে তুলনা anova()(নোট আমি সেট REML = FALSEযদিও REML = TRUEসঙ্গে anova(..., refit = FALSE)সম্পূর্ণরূপে সম্ভবপর হয় )।

m_full <- lmer(sim_1 ~ condition + (condition | participant_id), data=d, REML = FALSE)
summary(m_full)$varcor
 # Groups         Name                  Std.Dev. Corr  
 # participant_id (Intercept)           0.48741        
 #                conditionexperimental 0.26468  -0.419
 # Residual                             1.02677     

m_red <- lmer(sim_1 ~ condition + (1 | participant_id), data=d, REML = FALSE)
summary(m_red)$varcor
 # Groups         Name        Std.Dev.
 # participant_id (Intercept) 0.44734 
 # Residual                   1.03571 

anova(m_full, m_red)
# Data: d
# Models:
# m_red: sim_1 ~ condition + (1 | participant_id)
# m_full: sim_1 ~ condition + (condition | participant_id)
#        Df    AIC    BIC  logLik deviance  Chisq Chi Df Pr(>Chisq)
# m_red   4 2396.6 2415.3 -1194.3   2388.6                         
# m_full  6 2398.7 2426.8 -1193.3   2386.7 1.9037      2      0.386

তবে এই পরীক্ষাটি সম্ভবত রক্ষণশীল । উদাহরণস্বরূপ, প্রায়শই জিজ্ঞাসিত প্রশ্নগুলি বলে:

মনে রাখবেন যে নাল মান (যেমন σ2 = 0) সম্ভাব্য স্থানের সীমানায় থাকে তখন এলআরটি-ভিত্তিক নাল অনুমান পরীক্ষাগুলি রক্ষণশীল হয়; সাধারণ ক্ষেত্রে (একক র‌্যান্ডম এফেক্ট ভেরিয়েন্স), পি-মানটি তার তুলনায় দ্বিগুণ হয়ে থাকে (পিনহেরো এবং বেটস 2000)।

বিভিন্ন বিকল্প রয়েছে:

  1. χ2

  2. সঠিক RLRsimজিজ্ঞাসা (FAQ তে বর্ণিত) ব্যবহার করে অনুকরণ করুন ।

আমি নিম্নলিখিত বিকল্পটি দ্বিতীয়টি প্রদর্শন করব:

library("RLRsim")
## reparametrize model so we can get one parameter that we want to be zero:
afex::set_sum_contrasts() ## warning, changes contrasts globally
d <- cbind(d, difference = model.matrix(~condition, d)[,"condition1"])

m_full2 <- lmer(sim_1 ~ condition + (difference | participant_id), data=d, REML = FALSE)
all.equal(deviance(m_full), deviance(m_full2))  ## both full models are identical

## however, we need the full model without correlation!
m_full2b <- lmer(sim_1 ~ condition + (1| participant_id) + 
                   (0 + difference | participant_id), data=d, REML = FALSE)
summary(m_full2b)$varcor
 # Groups           Name        Std.Dev.
 # participant_id   (Intercept) 0.44837 
 # participant_id.1 difference  0.13234 
 # Residual                     1.02677 

## model that only has random effect to be tested
m_red <- update(m_full2b,  . ~ . - (1 | participant_id), data=d, REML = FALSE)
summary(m_red)$varcor
 # Groups         Name       Std.Dev.
 # participant_id difference 0.083262
 # Residual                  1.125116

## Null model 
m_null <- update(m_full2b,  . ~ . - (0 + difference | participant_id), data=d, REML = FALSE)
summary(m_null)$varcor
 # Groups         Name        Std.Dev.
 # participant_id (Intercept) 0.44734 
 # Residual                   1.03571 

exactRLRT(m_red, m_full2b, m_null)
# Using restricted likelihood evaluated at ML estimators.
# Refit with method="REML" for exact results.
# 
#   simulated finite sample distribution of RLRT.
#   
#   (p-value based on 10000 simulated values)
# 
# data:  
# RLRT = 1.9698, p-value = 0.0719

আমরা দেখতে পাচ্ছি, আউটপুট প্রস্তাব দেয় যে এর সাথে REML = TRUEআমরা সঠিক ফলাফল অর্জন করতে পারতাম। তবে এটি পাঠকের অনুশীলন হিসাবে ছেড়ে গেছে।

বোনাস সম্পর্কে, আমি নিশ্চিত নই যে RLRsimএকাধিক উপাদানগুলির একযোগে পরীক্ষার অনুমতি দেয়, তবে যদি তা হয় তবে এটি একইভাবে করা যেতে পারে।


মন্তব্য প্রতিক্রিয়া:

θএক্সθ0এক্স

আমি নিশ্চিত নই যে এই প্রশ্নটি যুক্তিসঙ্গত উত্তর পেতে পারে।

  • একটি এলোমেলো ইন্টারসেপ্ট গ্রুপিং ফ্যাক্টরের প্রতিটি স্তরের সামগ্রিক স্তরে আইডিসিঙ্ক্র্যাটিক পার্থক্যকে মঞ্জুরি দেয়। উদাহরণস্বরূপ, নির্ভরশীল পরিবর্তনশীল যদি প্রতিক্রিয়ার সময় হয় তবে কিছু অংশগ্রহণকারী দ্রুত এবং কিছুটা ধীর হয়।
  • একটি এলোমেলো slাল দলবদ্ধকরণের প্রতিটি স্তরের ফ্যাক্টরের একটি আইডিসিঙ্ক্র্যাটিক প্রভাবের অনুমতি দেয় যার জন্য এলোমেলো slালু অনুমান করা হয়। উদাহরণস্বরূপ, যদি ফ্যাক্টরটি একত্রিত হয়, তবে কিছু অংশগ্রহীতা অন্যের তুলনায় উচ্চতর একত্রিত হতে পারে।

সুতরাং এলোমেলো-opালু এলোমেলো-বিরতি প্রভাবিত করে? কিছুটা অর্থে এটি বোধগম্য হতে পারে, কারণ তারা গ্রুপিং ফ্যাক্টরের প্রতিটি স্তরকে প্রতিটি শর্তের জন্য সম্পূর্ণ আইডিসিঙ্ক্র্যাটিক প্রভাব দেয়। শেষ পর্যন্ত, আমরা দুটি শর্তের জন্য দুটি আইডিসিঙ্ক্র্যাটিক পরামিতি অনুমান করি। তবে আমি মনে করি যে ইন্টারসেপ্ট দ্বারা ক্যাপচার হওয়া সামগ্রিক স্তরের এবং এলোমেলো slালু দ্বারা কন্ডিশন শর্ত নির্দিষ্ট প্রভাবের মধ্যে পার্থক্যটি একটি গুরুত্বপূর্ণ এবং তারপরে এলোমেলো slাল সত্যই এলোমেলো ইন্টারসেপ্টকে প্রভাবিত করতে পারে না। তবে এটি এখনও গ্রুপিং ফ্যাক্টরের প্রতিটি স্তরের শর্তের প্রতিটি স্তরের জন্য পৃথকভাবে একটি আইডিসিঙ্ক্র্যাটিককে মঞ্জুরি দেয়।

তবুও, আমার পরীক্ষা এখনও মূল প্রশ্নটি যা চায় তা করে। এটি দুটি অবস্থার মধ্যে বৈকল্পিকের পার্থক্য শূন্য কিনা তা পরীক্ষা করে। যদি এটি শূন্য হয় তবে উভয় অবস্থার বৈকল্পিক সমান। অন্য কথায়, কেবল যদি এলোমেলো-opeালের প্রয়োজন না হয় তবে উভয় শর্তের ক্ষেত্রেই বৈচিত্র রয়েছে। আমি আশা করি যে এটি উপলব্ধি করে।


1
আপনি চিকিত্সা বিপরীতে ব্যবহার করেন ( contr.treatment) যার জন্য নিয়ন্ত্রণ শর্তটি হল রেফারেন্স (যেমন, এলোমেলো ইন্টারসেপ্ট গণনা করা হয়)। আমি যে প্যারামিট্রাইজেশনটির প্রস্তাব দিচ্ছি আমি যোগ বিপরীতে (অর্থাত্ contr.sum) ব্যবহার করি এবং ইন্টারসেপ্ট হ'ল গ্র্যান্ড মেনেজ। আমি মনে করি এটি নিয়ন্ত্রণের শর্তের পরিবর্তে ইন্টারসেপ্টটি গ্র্যান্ড মাইজ হওয়ার পরে পার্থক্যটি শূন্য কিনা তা পরীক্ষা করার জন্য এটি আরও বুদ্ধিমান হয়ে উঠেছে (তবে এটি লেখার মাধ্যমে বোঝা যায় এটি তুলনামূলকভাবে অপ্রয়োজনীয় হতে পারে)। আপনি পিপি 24 থেকে 26 পড়তে চাইতে পারেন: singmann.org/download/publications/…
হেনরিক

1
ধন্যবাদ! আমার প্রশ্নগুলি কিছুটা পৃথক, যদিও: (১) আপনার উত্তর থেকে বোঝা যাচ্ছে যে আমার প্রশ্নটি "শর্তের জন্য এলোমেলো slাল 0" থেকে কমেছে to এটা কি সত্য? (২) যদি (1) এর উত্তর "হ্যাঁ" হয় তবে conditionএটি এর জন্য এলোমেলো .ালের আরও একটি ব্যাখ্যা প্রস্তাব করে : এটি এলোমেলো ইন্টারসেপ্টের স্তরের স্তরে পৃথক হতে দেয় condition। এটা কি সত্য?
প্যাট্রিক এস ফার্সচার

2
আমার 2 ¢: @ হেনরিকের প্রস্তাবিত পদ্ধতির কাছে অ্যামিবার জবাবদিহিটি সঠিক। হেনরিক প্রায় সঠিক, তবে তিনি মডেলগুলির ভুল জুটির তুলনা করেছেন। উত্তরটির প্যাট্রিকের প্রশ্নের যে মডেল তুলনা তা হেনরিককে m_fullবনাম বলে মডেলগুলির মধ্যে তুলনা m_full2b। এটি হ'ল: এ বনাম বিতে অংশগ্রহণকারীদের শর্তসাপেক্ষ গড় প্রতিক্রিয়াগুলি অসম তবে যদি র্যান্ডম ইন্টারসেপ্ট-স্লোপ পারস্পরিক সম্পর্ক ননজারো হয় --- গুরুত্বপূর্ণভাবে, যোগফল থেকে শূন্যের বিপরীতে কোডিং প্যারামিটারাইজেশন হয় । এলোমেলো slাল বৈকল্পিক পরীক্ষা করা প্রয়োজন হয় না। কীভাবে এই সংলগ্নভাবে ব্যাখ্যা করবেন তা ভাবার চেষ্টা করছি ...
জ্যাক ওয়েস্টফল

2
এটি সত্যিই যথাযথ ব্যাখ্যা নয়, তবে এখানে আমার উত্তর অধ্যয়ন করা বিষয়টি সম্পর্কে কিছুটা আলোকপাত করতে পারে। মূলত, সম্পর্কের প্যারামিটারটি অংশগ্রহণকারী রিগ্রেশন লাইনগুলি "ডানদিকে ফ্যান আউট" (পজিটিভ কর্নার) বা "বাম দিকে ফ্যান আউট" (নেতিবাচক কর্নার) নিয়ন্ত্রণ করে। অংশগ্রহণকারীদের শর্তাধীন গড় প্রতিক্রিয়াগুলির মধ্যে এই স্পষ্টত অসম বৈকল্পিকতা। সম-থেকে শূন্য কোডিং নিশ্চিত করে যে আমরা এক্স এর ডান পয়েন্টে পারস্পরিক সম্পর্ক খুঁজছি
জ্যাক ওয়েস্টফল

2
আমি যদি সময় পাই তবে আমি ছবি সহ উত্তর পোস্ট করার বিষয়টি বিবেচনা করব ...
জ্যাক ওয়েস্টফল

5

আপনার মডেল

m = lmer(sim_1 ~ condition + (condition | participant_id), data=d)

নিয়ন্ত্রণ শর্তে ইতিমধ্যে প্রচ্ছদ-বিষয় বৈকল্পিককে পরীক্ষামূলক অবস্থার ওপার-বিষয় বৈকল্পিক থেকে পৃথক করার অনুমতি দেয়। এটি একটি সমতুল্য পুনঃ পরামিতি দ্বারা আরও স্পষ্ট করা যেতে পারে:

m = lmer(sim_1 ~ 0 + condition + (0 + condition | participant_id), data=d)

এলোমেলো কোভারিয়েন্স ম্যাট্রিক্সের এখন একটি সহজ ব্যাখ্যা রয়েছে:

Random effects:
 Groups         Name                  Variance Std.Dev. Corr
 participant_id conditioncontrol      0.2464   0.4963       
                conditionexperimental 0.2074   0.4554   0.83

এখানে দুটি ভেরিয়ানস হয় অবিকল দুই ভেরিয়ানস আপনি আগ্রহী: [জুড়ে-বিষয়] নিয়ন্ত্রণ অবস্থায় শর্তসাপেক্ষ গড় প্রতিক্রিয়া ভ্যারিয়েন্স ও পরীক্ষামূলক অবস্থায় একই। আপনার সিমুলেটেড ডেটাসেটে সেগুলি 0.25 এবং 0.21। পার্থক্য দ্বারা দেওয়া হয়

delta = as.data.frame(VarCorr(m))[1,4] - as.data.frame(VarCorr(m))[2,4]

এবং 0.039 এর সমান। আপনি পরীক্ষা করতে চান এটি শূন্য থেকে উল্লেখযোগ্যভাবে পৃথক কিনা।

সম্পাদনা: আমি বুঝতে পেরেছি যে নীচে আমি যে পরিবাহের পরীক্ষাটি বর্ণনা করছি তা ভুল; নিয়ন্ত্রণ / পরীক্ষামূলক অবস্থার উপায়গুলি যদি একই না হয় তবে এটি উদ্দেশ্য হিসাবে কাজ করবে না (কারণ তাহলে নালগুলির নীচে পর্যবেক্ষণগুলি বিনিময়যোগ্য নয়)। বিষয়গুলি (বা বিষয় / বোনাস ক্ষেত্রে আইটেম) বুটস্ট্র্যাপ করা এবং এর জন্য আস্থার ব্যবধান অর্জন করা আরও ভাল ধারণা হতে পারে delta

আমি এটি করার জন্য নীচের কোডটি ঠিক করার চেষ্টা করব।


মূল ক্রিয়ুটেশন-ভিত্তিক পরামর্শ (ভুল)

আমি প্রায়শই দেখতে পাই যে একজন ক্রমশক্তি পরীক্ষা করে নিজেকে অনেক ঝামেলা বাঁচাতে পারে। আসলে, এই ক্ষেত্রে এটি সেট আপ করা খুব সহজ। আসুন প্রতিটি বিষয়ের জন্য নিয়ন্ত্রণ / পরীক্ষামূলক শর্তগুলি পৃথকভাবে অনুমতি দিন; তারপরে কোনও প্রকারের পার্থক্য দূর করা উচিত। এটি বহুবার পুনরাবৃত্তি করলে পার্থক্যের জন্য নাল বিতরণ হবে।

(আমি আর তে প্রোগ্রাম করি না; প্রত্যেকে নিখরচায় আরও ভাল আর স্টাইলে নতুন করে লিখতে অনুগ্রহ করে)

set.seed(42)
nrep = 100
v = matrix(nrow=nrep, ncol=1)
for (i in 1:nrep)
{
   dp = d
   for (s in unique(d$participant_id)){             
     if (rbinom(1,1,.5)==1){
       dp[p$participant_id==s & d$condition=='control',]$condition = 'experimental'
       dp[p$participant_id==s & d$condition=='experimental',]$condition = 'control'
     }
   }
  m <- lmer(sim_1 ~ 0 + condition + (0 + condition | participant_id), data=dp)
  v[i,] = as.data.frame(VarCorr(m))[1,4] - as.data.frame(VarCorr(m))[2,4]
}
pvalue = sum(abs(v) >= abs(delta)) / nrep

পি=0.7nrep

ঠিক একই যুক্তি আপনার বোনাস ক্ষেত্রে প্রয়োগ করা যেতে পারে।


সুপার আকর্ষণীয়, আপনাকে ধন্যবাদ! আপনার পুনঃনির্মাণ কেন কাজ করে সে সম্পর্কে আমাকে আরও চিন্তা করতে হবে কারণ এটি এই উত্তরের মূল অন্তর্দৃষ্টি বলে মনে হয়।
প্যাট্রিক এস ফার্সচার

আশ্চর্যের বিষয় হল, আপনার উত্তরে প্রতি-গ্রুপ ইন্টারসেপ্ট মানগুলি @ মার্তিজন ওয়েটারিংসের উত্তরগুলির থেকে পৃথক বলে মনে হচ্ছে।
প্যাট্রিক এস ফার্সচার

@ প্যাট্রিকএস.ফোরচার কারণ এটি, আমার মনে হয়, তিনি আলাদা একটি ডেটাसेट তৈরি করেন। আমি sim_1 ~ 0 + condition + (0 + dummy(condition, "control") + dummy(condition, "experimental") | participant_id)সূত্রটি ব্যবহার করতে এবং আমার উত্তরের মতো একই ফলাফল পেতে পারি।
অ্যামিবা

1
@ প্যাট্রিকস.ফোরচার নং, আমি আপনার কোড দ্বারা উত্পন্ন ডেটা ব্যবহার করেছি (আপনার বীজ সহ)। কেবলমাত্র আদেশের পরীক্ষা করার সময় আমি বীজকে 42 এ সেট করি। এটি মার্টিজন যিনি ডেটাসেট পরিবর্তন করেছিলেন, আমাকে নয়।
অ্যামিবা বলছেন মনিকা পুনরায় ইনস্টল করুন

1
এই প্রস্তাব অবশ্যই কার্যকর। আমি যেমন মনে করি আপনি ইতিমধ্যে অভিজ্ঞ হয়ে গেছেন, মাল্টিলেভাল ডেটার জন্য ক্রমশক্তি পরীক্ষা স্থাপন সম্পূর্ণ সোজা নয়। একটি অনুরূপ পদ্ধতির প্রয়োগ করা যা কিছুটা সহজ হবে তা হ'ল প্যারামেট্রিক বুটস্ট্র্যাপিং, যা লাগানো লেমার অবজেক্টগুলির সিমুলেট () পদ্ধতি ব্যবহার করে lme4 করা খুব সহজ, যেমন, বুটস্ট্র্যাপটি তৈরি করতে বহুবার সিমুলেট (এম) কল করুন বন্টন। সাথে চারদিকে খেলতে কেবল একটি ধারণা।
জেক ওয়েস্টফল 20'18

0

Yআমি=μ+ +α+ +আমি+ +আমি,আমি~এন(0,Σ),আমি~এন(0,σ2)
αআমি=(আমি1,...,আমিজে)আমি
Yআমি1Yআমি2একজনবিআমি

Σ=[σএকজন2σএকজনবিσএকজনবিσবি2]

σএকজন2σবি2

Σ

ইন্টারসেপ্টের বৈকল্পিকতা, যা গ্র্যান্ড অর্থের সাথে মিলে যায় is

σ12: =ভার (গ্র্যান্ড মানে)=var(12(একজন+ +বি))=14(var(একজন)+ +var(বি)+ +2Cov(একজন,বি))

বৈসাদৃশ্যটির বৈকল্পিকতা

σ22: =Yvelines (বিপরীতে)=var(12(একজন-বি))=14(var(একজন)+ +var(বি)-2Cov(একজন,বি))

এবং বিরতি এবং বৈপরীত্য মধ্যে covariance হয়

σ12: =Cov(গ্র্যান্ড মানে, বিপরীতে)=Cov(12(একজন+ +বি),12(একজন-বি))=14(var(একজন)-var(বি))

Σ

Σ=[σ12+ +σ22+ +2σ12σ12-σ22σ12-σ22σ12+ +σ22-2σ12]=[σএকজন2σএকজনবিσএকজনবিσবি2]

Σ

Σ=[σ12σ12σ12σ12]+ +[σ22-σ22-σ22σ22]+ +2[σ1200-σ12]

σ12

Σ=[σ12σ12σ12σ12]+ +[σ22-σ22-σ22σ22]=[σ12+ +σ22σ12-σ22σ12-σ22σ12+ +σ22]

যা যেমন @Jake Westfall সামান্য ভিন্নভাবে উদ্ভূত, সমান ভেরিয়ানস অনুমান পরীক্ষা যখন আমরা একটি মডেল যেখানে সহভেদাংক পরামিতি এখনো অন্তর্ভুক্ত করা হয় / শুন্যতে সেট না এই সহভেদাংক পরামিতি ছাড়া একটি মডেল তুলনা করুন।

উল্লেখযোগ্যভাবে, অন্য ক্রস করা এলোমেলো গ্রুপিং ফ্যাক্টর (যেমন উদ্দীপনা) প্রবর্তন করা হয়েছে এমন মডেল তুলনা পরিবর্তন করে না, অর্থাৎ anova(mod1, mod2)( refit = FALSEআপনি যখন আরইএমএল অনুমান ব্যবহার করবেন তখন বিকল্পের সাথে ) যেখানে mod1এবং mod2জ্যাক ওয়েস্টফল যেমন করেছেন তার সংজ্ঞা দেওয়া হয়েছে।

σ12σ22

Σ=[σ12σ12σ12σ12]

যা এই হাইপোথিসিসটি পরীক্ষা করে যে দুটি অবস্থার রূপগুলি সমান এবং তারা উভয় অবস্থার মধ্যে (ধনাত্মক) সমবায় সমান।


যখন আমাদের দুটি শর্ত থাকে, একটি মডেল যা কোভারিয়েন্স ম্যাট্রিক্সের সাথে (ধনাত্মক) যৌগিক প্রতিসম কাঠামোর দুটি পরামিতি ফিট করে, সে হিসাবে এটিও লেখা যেতে পারে

# code snippet from Jake Westfall
d$contrast <- 2*(d$condition == 'experimental') - 1

# new model
mod3 <- lmer(sim_1 ~ contrast + (1 | participant_id) + (1 | contrast:participant_id), 
             data = d, REML = FALSE) 

বা (শ্রেণীবদ্ধ ভেরিয়েবল / ফ্যাক্টর ব্যবহার করে condition)

mod4 <- lmer(sim_1 ~ condition + (1 | participant_id) + (1 | condition:participant_id), 
             data = d, REML = FALSE)

সঙ্গে

Σ=[σ12+ +σ22σ12σ12σ12+ +σ22]=[σ12σ12σ12σ12]+ +[σ2200σ22]

σ12σ22Σ

নীচে আমরা দেখতে mod1, mod3এবং mod4সমতুল্য তড়কা ফলন:

# code snippet from Jake Westfall
d$contrast <- 2*(d$condition == 'experimental') - 1

mod1 <- lmer(sim_1 ~ contrast + (contrast || participant_id),
             data = d, REML = FALSE)

mod2 <- lmer(sim_1 ~ contrast + (contrast | participant_id),
             data = d, REML = FALSE)

# new models 
mod3 <- lmer(sim_1 ~ contrast + (1 | participant_id) + (1 | contrast:participant_id), 
             data = d, REML = FALSE) 

mod4 <- lmer(sim_1 ~ condition + (1 | participant_id) + (1 | condition:participant_id), 
             data = d, REML = FALSE)

anova(mod3, mod1)
# Data: d
# Models:
# mod3: sim_1 ~ contrast + (1 | participant_id) + (1 | contrast:participant_id)
# mod1: sim_1 ~ contrast + ((1 | participant_id) + (0 + contrast | participant_id))
#      Df    AIC    BIC  logLik deviance Chisq Chi Df Pr(>Chisq)
# mod3  5 2396.9 2420.3 -1193.5   2386.9                        
# mod1  5 2396.9 2420.3 -1193.5   2386.9     0      0          1

anova(mod4, mod3)
# Data: d
# Models:
# mod4: sim_1 ~ condition + (1 | participant_id) + (1 | condition:participant_id)
# mod3: sim_1 ~ contrast + (1 | participant_id) + (1 | contrast:participant_id)
#      Df    AIC    BIC  logLik deviance Chisq Chi Df Pr(>Chisq)
# mod4  5 2396.9 2420.3 -1193.5   2386.9                        
# mod3  5 2396.9 2420.3 -1193.5   2386.9     0      0          1

Σ

Σ=[σ12σ12+ +σ12σ12+ +σ12σ12+ +σ22+ +2σ12]=[σ12σ12σ12σ12]+ +[000σ22]+ +[0σ12σ122σ12]

σ12একজনσ22একজন-বিσ12

σ12σ22

mod4Σ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.