এই দুটি রিগ্রেশন মডেলের মধ্যে মৌলিক পার্থক্য কী?


10

ধরা যাক, উল্লেখযোগ্য পারস্পরিক সম্পর্কের সাথে আমার দ্বিভাগীয় প্রতিক্রিয়া রয়েছে। আমি এই ফলাফলগুলি মডেল করার জন্য দুটি উপায়ের সাথে তুলনা করার চেষ্টা করছি। একটি উপায় হ'ল দুটি ফলাফলের মধ্যে পার্থক্যকে মডেল করা: অন্য ব্যবহার বা মডেল করা:

(yi2yi1=β0+Xβ)
glsgee
(yij=β0+time+Xβ)

এখানে একটি নিখুঁত উদাহরণ:

#create foo data frame

require(mvtnorm)
require(reshape)
set.seed(123456)
sigma <- matrix(c(4,2,2,3), ncol=2)
y <- rmvnorm(n=500, mean=c(1,2), sigma=sigma)
cor(y)
x1<-rnorm(500)
x2<-rbinom(500,1,0.4)
df.wide<-data.frame(id=seq(1,500,1),y1=y[,1],y2=y[,2],x1,x2)
df.long<-reshape(df.wide,idvar="id",varying=list(2:3),v.names="y",direction="long")
df.long<-df.long[order(df.long$id),]
    df.wide$diff_y<-df.wide$y2-df.wide$y1


#regressions
fit1<-lm(diff_y~x1+x2,data=df.wide)
fit2<-lm(y~time+x1+x2,data=df.long)
fit3<-gls(y~time+x1+x2,data=df.long, correlation = corAR1(form = ~ 1 | time))

মধ্যে মৌলিক পার্থক্য কি fit1এবং fit2? আর মধ্যে fit2এবং fit3দেওয়া তারা এত কাছে রয়েছে মূল্যবোধ ও অনুমান?p


7
ফিট 1 এবং ফিট 3 এর মধ্যে পার্থক্যটিকে কখনও কখনও লর্ডসের প্যারাডক্স হিসাবে উল্লেখ করা হয়। কিছু আলোচনার জন্য এখানে (মডেলগুলির মধ্যে কেন অনুমানগুলি পরিবর্তিত হয় না) এবং পল অ্যালিসন নিবন্ধ, stats.stackexchange.com/a/15759/1036 এর একটি উল্লেখের জন্য এখানে দেখুন । আরেকটি রেফারেন্সটি হলHolland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.
অ্যান্ডি ডাব্লু

উত্তর:


1

প্রথমত, আমি আমার উত্তরে আলোচনার জন্য চতুর্থ মডেলটি প্রবর্তন করব:

ফিট 1.5 <- এলএম (y_2 ~ x_1 + x_2 + y_1)

পার্ট 0
ফিট 1 এবং ফিট 1.5 এর মধ্যে পার্থক্যটি সর্বোত্তম সংক্ষিপ্তসার হিসাবে একটি সীমাবদ্ধ পার্থক্য বনাম একটি অনুকূল পার্থক্য হিসাবে সংক্ষিপ্তসারিত হয়।

উপরের সরবরাহকারীর তুলনায় এটি ব্যাখ্যা করার জন্য আমি একটি সহজ উদাহরণ ব্যবহার করতে যাচ্ছি। ফিট 1.5 দিয়ে শুরু করা যাক। মডেলের একটি সহজ সংস্করণ হবে অবশ্যই, যখন আমরা কোনও ওএলএস অনুমান করি তখন এটি জন্য "অনুকূল" পছন্দটি খুঁজে । এবং, যদিও এটি লিখতে অদ্ভুত বলে মনে হয়, আমরা সূত্রটি হিসাবে লিখতে পারি, আমরা দুটি ভেরিয়েবলের মধ্যে "অনুকূল" পার্থক্য হিসাবে ভাবতে পারি ।

y2=b0+b1·x+b2·y1
b2
y2b2·y1=b0+b1·x
y

এখন, আমরা যদি কে সীমাবদ্ধ করার সিদ্ধান্ত , তবে সূত্র / মডেলটি যা কেবলমাত্র (সীমাবদ্ধ) পার্থক্য।b2=1

y2y1=b0+b1·x

নোট, উপরে বিক্ষোভের, আপনি দিন যদি একটি dichotomous পরিবর্তনশীল হতে, এবং একটি প্রি-পরীক্ষা এবং হতে একটি পোস্ট পরীক্ষার স্কোর পেয়ারিং, তারপর সবাধ পার্থক্য মডেল মাত্র স্বাধীন নমুনার হবে স্কোর লাভের জন্য -test অন্যদিকে, অনুকূল পার্থক্য মডেলটি আনকোভা পরীক্ষা হবে প্রাক-পরীক্ষার স্কোরগুলি সহকারী হিসাবে ব্যবহৃত হচ্ছে।xy1y2t

পার্ট 1 ফিট 2-
এর মডেলটি উপরে ব্যবহৃত পার্থক্য পদ্ধতির অনুরূপ ফ্যাশনে সবচেয়ে ভালভাবে চিন্তা করা যেতে পারে। যদিও একটি অতিসরলীকরণ (যেমন আমি উদ্দেশ্যপূর্ণ ত্রুটি পদ আউট যাব), মডেল হিসেবে উপস্থাপন করা যেতে পারে যেখানে জন্য মূল্যবোধ ও জন্য মান । এখানে ... এটি আসুন আমরা লিখি another অন্যভাবে লিখিত, । যদিও মডেল ফিট 1.5 এর বিশ্লেষণের জন্য সর্বোত্তম পার্থক্যের মান হিসাবে , এখানে

y=b0+b1·x+b2·t
t=0y1t=1y2
y1=b0+b1·xy2=b0+b1·x+b2
y2y1=b2b2b2মূলত মানগুলির মধ্যে অন্যান্য পার্থক্যগুলি (অন্যান্য সংস্থাগুলির জন্য নিয়ন্ত্রণের পরে)।y

পার্ট 2
সুতরাং মডেল ফিট 2 এবং ফিট 3 এর মধ্যে পার্থক্য কী ... আসলে, খুব কম। ফিট 3 মডেল ত্রুটির শর্তাবলী সম্পর্কিত হতে পারে, তবে এটি কেবল অনুমানের প্রক্রিয়া পরিবর্তন করে এবং এইভাবে দুটি মডেলের আউটপুটগুলির মধ্যে পার্থক্যগুলি ন্যূনতম হবে (ফিট 3 অটোরিগ্রেসিভ ফ্যাক্টরের অনুমানের বাইরেও)।

অংশ 2.5
এবং আমি এই আলোচনায় আরও একটি মডেল অন্তর্ভুক্ত করব

ফিট 4 <- lmer (y ~ সময় + x1 + x2 + (1 | আইডি), তথ্য = df.long)

এই মিশ্র-প্রভাবগুলির মডেলটি অটোরিগ্রেসিভ পদ্ধতির কিছুটা আলাদা সংস্করণ করে। যদি আমরা এলোমেলো প্রভাবগুলিতে সময় সহগকে অন্তর্ভুক্ত করি তবে এটি প্রতিটি বিষয়ের জন্য এর পার্থক্য গণনা করার সাথে তুলনীয় । (তবে, এটি কাজ করবে না ... এবং মডেলটি চলবে না))y

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.