আর-এ পুনরাবৃত্তিমূলক বহু ফলস্বরূপ ফলাফলগুলি কীভাবে অনুকরণ করা যায়?


9

@ শুভর এক সময়ের জন্য কীভাবে বহুবিধ ফলাফলগুলি ( , y_2 , এবং y_3 ) অনুকরণ করতে হবে তা প্রদর্শন করেছে ।y1y2y3

যেমনটি আমরা জানি, অনুদৈর্ঘ্য তথ্য প্রায়শই চিকিত্সা স্টাডিতে ঘটে। আমার প্রশ্নটি কীভাবে আর-এ পুনরাবৃত্তিমূলক ফলাফলগুলি বহুবিধ ফলাফলের অনুকরণ করা যায়? উদাহরণস্বরূপ, আমরা দুটি পৃথক চিকিত্সার গোষ্ঠীর জন্য 5 টি বিভিন্ন সময় পয়েন্টে বারবার y1 , y2 , এবং y_3 পরিমাপ করিy3

উত্তর:


2

একটি নির্দিষ্ট পারস্পরিক কাঠামোর সাহায্যে মাল্টিভারিয়েট স্বাভাবিক তথ্য তৈরি করতে আপনাকে cholফাংশনটি ব্যবহার করে ভেরিয়েন্স কোভারিয়েন্স ম্যাট্রিক্সটি তৈরি করতে হবে এবং এর কোলেস্কি পচন গণনা করতে হবে। পছন্দসই vcov ম্যাট্রিক্স এবং পর্যবেক্ষণগুলির স্বতন্ত্র এলোমেলো স্বাভাবিক ভেক্টরগুলির Cholesky পচন এর পণ্যটি তারতম্য কোভারিয়েন্স ম্যাট্রিক্সের সাথে এলোমেলোভাবে সাধারণ ডেটা দেবে।

v <- matrix(c(2,.3,.3,2), 2)
cv <- chol(v)

o <- replicate(1000, {
  y <- cv %*% matrix(rnorm(100),2)

  v1 <- var(y[1,])
  v2 <- var(y[2,])
  v3 <- cov(y[1,], y[2,])

  return(c(v1,v2,v3))
})

## MCMC means should estimate components of v
rowMeans(o)

2

Rmvnorm () ফাংশনটি ব্যবহার করুন, এতে 3 টি আর্গুমেন্ট লাগে: ভেরিয়েন্স কোভারিয়েন্স ম্যাট্রিক্স, উপায় এবং সারিগুলির সংখ্যা।

সিগমাতে 3 * 5 = 15 টি সারি এবং কলাম থাকবে। প্রতিটি পরিবর্তনশীল প্রতিটি পর্যবেক্ষণ জন্য একটি। এই 15 ^ 2 প্যারামিটারগুলি সেট করার অনেকগুলি উপায় রয়েছে (আর, দ্বিপক্ষীয় প্রতিসাম্য, আনস্ট্রাকচার্ড ...)। তবে আপনি এই ম্যাট্রিক্স পূরণ করে অনুমানগুলি সম্পর্কে সচেতন হন, বিশেষত যখন আপনি শূন্যের সাথে কোনও সম্পর্ক / সমবায় সেটআপ করেন, বা আপনি যখন দুটি বৈকল্পিক সমান হতে চান তখন। একটি সূচনা পয়েন্টের জন্য একটি সিগমা ম্যাট্রিক্স কিছু দেখতে পারে:

 sigma=matrix(c(
    #y1             y2             y3 
    3 ,.5, 0, 0, 0, 0, 0, 0, 0, 0,.5,.2, 0, 0, 0,
    .5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2, 0, 0,
    0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2, 0,
    0 , 0,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2,
    0 , 0, 0,.5, 3, 0, 0, 0, 0, 0, 0, 0, 0,.2,.5,
    0 ,0 ,0 ,0 , 0, 3,.5, 0, 0, 0, 0, 0, 0, 0, 0,
    0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,
    0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0,
    0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0,
    0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3, 0, 0, 0, 0, 0,
    .5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 , 0, 3,.5, 0, 0, 0,
    .2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0,
    0 ,.2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0,
    0 ,0 ,.2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5,
    0 ,0 ,0 ,.2,.5,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3

    ),15,15)

সুতরাং সিগমা [1,12] ২। 2 এবং এর অর্থ হ'ল Y1 এর প্রথম পর্যবেক্ষণ এবং Y3 এর 2 য় পর্যবেক্ষণের মধ্যে সমবায়তা অন্যান্য সমস্ত 13 ভেরিয়েবলের শর্তসাপেক্ষ। তির্যক সারিগুলি একই সংখ্যার হতে হবে না: এটি আমি তৈরি করা একটি সরল ধারণা। কখনও কখনও এটি বোঝায়, কখনও কখনও এটি না। সাধারণভাবে এর অর্থ তৃতীয় পর্যবেক্ষণ এবং চতুর্থ পর্যবেক্ষণের মধ্যে পারস্পরিক সম্পর্ক 1 ম এবং দ্বিতীয়টির মধ্যে পারস্পরিক সম্পর্ক as

আপনারও দরকার উপায়। এটি হিসাবে সহজ হতে পারে

 meanTreat=c(1:5,51:55,101:105)
 meanControl=c(1,1,1,1,1,50,50,50,50,50,100,100,100,100,100)

এখানে প্রথম 5 টি ওয়াই 1 এর 5 টি পর্যবেক্ষণের উপায়, ..., শেষ 5 টি ওয়াই 3 এর পর্যবেক্ষণ

তারপরে আপনার ডেটা নিয়ে 2000 টি পর্যবেক্ষণ পান:

sampleT=rmvnorm(1000,meanTreat,sigma)
sampleC=rmvnorm(1000,meanControl,sigma)
 sample=data.frame(cbind(sampleT,sampleC) )
  sample$group=c(rep("Treat",1000),rep("Control",1000) )

colnames(sample)=c("Y11","Y12","Y13","Y14","Y15",
                   "Y21","Y22","Y23","Y24","Y25",
                   "Y31","Y32","Y33","Y34","Y35")

যেখানে ওয়াই 11 হ'ল ওয়াই 1 এর প্রথম পর্যবেক্ষণ, ..., ওয়াই 15 হ'ল ওয়াই 1 এর 5 তম ...


1
প্রথম উদাহরণ হিসাবে ম্যাট্রিক্স তৈরি করতে হলে, শেঠ, এই চেষ্টা করে দেখুন: n <- 3*5; sigma <- diag(1, nrow=n, ncol=n); sigma[rbind(cbind(1:n-1,1:n),cbind(1:n,1:n-1))] <- 1/2। একটি অনুরূপ পদ্ধতির দ্বিতীয় উদাহরণ উত্পন্ন করা হবে। তবে, তাদের একটি সাধারণ সমস্যা রয়েছে: আপনি প্রতিটি সময়কালে মধ্যে সমবায় হারিয়ে ফেলেছেন - এই ম্যাট্রিকগুলি পুনরাবৃত্তি ব্যবস্থা কাঠামোর প্রতিফলন করে না। y
হোবার

@ যেটি আপনার সিনট্যাক্সটি সহায়ক, তবে আমি যা লিখেছি তার থেকে আলাদা। আমি মনে করি পার্থক্যটি কিছুটা গুরুত্বপূর্ণ। আমি এআর (1) হিসাবে যা লিখেছিলাম সে সম্পর্কে আমি ভাবি এবং একটি ভেরিয়েবলের শেষ পর্যবেক্ষণ এবং পরবর্তী ভেরিয়েবলের প্রথম পর্যবেক্ষণের মধ্যে ক্রস পারস্পরিক সম্পর্কের মধ্যে আপনার প্রবেশ রয়েছে। অন্য কথায় আমি সিগমা [5,6] 0 হওয়া উচিত বলে মনে করি
শেঠ

আহ, এখন আমি যা দেখছি তা আপনি: প্রথম উদাহরণে আপনি তিনটি এআর (1) সিরিজ তৈরি করছেন। আমি এটিকে মিস করেছি কারণ আমি বিশ্বাস করি যে ওপি সিরিজের মধ্যে পারস্পরিক সম্পর্ক নিয়েও উদ্বিগ্ন : এটাই "বহুবিধ ফলাফল" দ্বারা বোঝানো হয়েছে। দেখুন যে বিন্দু থেকে মনে হয় তোমার মত হচ্ছে এই পারস্পরিক সম্পর্ক ম্যাট্রিক্স দেখতে ইচ্ছুক দ্বারা প্রতিটি প্রবেশ ব্লক ম্যাট্রিক্স একটি দ্বারা ম্যাট্রিক্স, বরং একটি হিসাবে চেয়ে দ্বারা ব্লক ম্যাট্রিক্স দ্বারা ব্লক। 55333355
whuber

আমি ভেবেছিলাম আমার দ্বিতীয় সিগমা হ'ল Y1 এবং Y3 এর মধ্যে বৈকল্পিকটিকে ইতিবাচক হতে দেওয়ার এক সাধারণ উদাহরণ। আমি উত্তরটি কিছুটা এডিট করে আরও পরিষ্কার করে দিতে পারি যে ডেটা উত্পন্ন করার প্রক্রিয়ার উপর নির্ভর করে ম্যাট্রিক্সটি কনফিগার করা আছে। এই বিড়ালটির ত্বকের অবশ্যই বিভিন্ন উপায় রয়েছে।
শেঠ

যথেষ্ট উপযুক্ত, তবে আপনার পদ্ধতি অসুবিধা তৈরি করে, কারণ মধ্যে একটি এআর মডেলের সাথে মাল্টিভারিয়েট পারস্পরিক সম্পর্ককে সংযুক্ত করা তুচ্ছ নয় । উদাহরণস্বরূপ, আপনি কি জানেন যে দ্বিতীয় ম্যাট্রিক্স ব্যর্থতা সুনিশ্চিত হতে ব্যর্থ হয়েছে? (গ (-102, 177, -204, 177, -102, 0, 0, 0, 0, 0, 102, -177, 204, -177 এর "ভ্যারিয়েন্স", 102) নেতিবাচক।)yi
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.