সেরা লিনিয়ার আনবিসিড প্রেডিকটর (বিএলইউপি) থেকে প্রাপ্ত আনুমানিক মানগুলি কেন একটি সেরা লিনিয়ার আনবিসিড এস্টিমেটার (বিএলইউ) থেকে পৃথক হয়?


20

আমি বুঝতে পারি যে তাদের মধ্যে পার্থক্যটি মডেলটির গ্রুপিং ভেরিয়েবল একটি স্থির বা এলোমেলো প্রভাব হিসাবে অনুমান করা হয় কিনা এর সাথে সম্পর্কিত, তবে কেন তারা একই নয় (যদি তারা একই না হয়) তবে এটি আমার কাছে স্পষ্ট নয়।

ছোট ক্ষেত্রের প্রাক্কলনটি ব্যবহার করার সময় এটি কীভাবে কাজ করে সে সম্পর্কে আমি বিশেষভাবে আগ্রহী, যদি তা প্রাসঙ্গিক হয় তবে আমার সন্দেহ হয় যে প্রশ্নটি স্থির এবং এলোমেলো প্রভাবগুলির কোনও প্রয়োগের জন্যই প্রাসঙ্গিক।

উত্তর:


26

আপনি বিএলইউপিগুলি থেকে যে মানগুলি পান তা নির্ধারিত প্রভাবগুলির ব্লু অনুমান হিসাবে একইভাবে অনুমান করা হয় না; কনভেনশন দ্বারা বিএলইউপিগুলিকে পূর্বাভাস হিসাবে উল্লেখ করা হয় । আপনি যখন একটি মিশ্র প্রভাবগুলির মডেল ফিট করেন, প্রাথমিকভাবে যা অনুমান করা হয় তা এলোমেলো প্রভাবগুলির গড় এবং প্রকরণ (এবং সম্ভবত সমবর্তক) are প্রদত্ত স্টাডি ইউনিটের জন্য এলোমেলো প্রভাব (একজন শিক্ষার্থী বলুন) পরবর্তীকালে অনুমানের গড় এবং ভেরিয়েন্স এবং ডেটা থেকে গণনা করা হয়। একটি সাধারণ রৈখিক মডেলে, গড়টি অনুমান করা হয় (যেমনটি অবশিষ্ট অবধি) তবে পর্যবেক্ষণ করা স্কোরগুলি ত্রুটি এবং ত্রুটি উভয়ই সমন্বিত বলে বিবেচিত হয় যা এলোমেলো পরিবর্তনশীল। মিশ্র প্রভাবগুলির মডেলটিতে, প্রদত্ত ইউনিটের জন্য প্রভাব একইভাবে একটি এলোমেলো পরিবর্তনশীল (যদিও কিছুটা অর্থে এটি ইতিমধ্যে উপলব্ধি হয়ে গেছে)।

আপনি যদি পছন্দ করেন তবে এগুলি ইউনিটকে স্থির প্রভাব হিসাবেও আচরণ করতে পারেন। সেক্ষেত্রে সেই ইউনিটের পরামিতিগুলি যথারীতি অনুমান করা হয়। তবে এরকম ক্ষেত্রে, যে ইউনিটগুলি থেকে ইউনিটগুলি আঁকা হয়েছিল তার গড় (উদাহরণস্বরূপ) অনুমান করা হয় না।

তদুপরি, এলোমেলো প্রভাবগুলির পিছনে অনুমানটি হ'ল এগুলি কিছু জনসংখ্যার থেকে এলোমেলোভাবে নমুনা দেওয়া হয়েছিল এবং এটি সেই জনসংখ্যা যা আপনার যত্ন নেয়। অন্তর্নিহিত স্থির প্রভাবগুলির অনুমানটি হ'ল আপনি সেই ইউনিটগুলি উদ্দেশ্যমূলকভাবে নির্বাচন করেছেন কারণ সেগুলি কেবলমাত্র আপনারাই যত্নশীল।

আপনি যদি ঘুরে দেখেন এবং একটি মিশ্র প্রভাবগুলির মডেল ফিট করে এবং সেই একই প্রভাবগুলির পূর্বাভাস দেন তবে তারা তাদের স্থির প্রভাবের অনুমানের তুলনায় জনসংখ্যার দিকে 'সঙ্কুচিত' হতে থাকে। আপনি এটিকে কোনও বায়েশিয়ান বিশ্লেষণের সমতুল্য হিসাবে ভাবতে পারেন যেখানে আনুমানিক গড় এবং প্রকরণটি একটি প্রাকৃতিক পূর্ব নির্ধারণ করে এবং বিএলইপি উত্তরোত্তর গড়ের মতো যা পূর্বের সাথে উপাত্তকে সর্বোত্তমভাবে সংমিশ্রিত করে।

সংকোচনের পরিমাণ বিভিন্ন কারণের ভিত্তিতে পরিবর্তিত হয়। স্থিরপ্রতিক্রিয়া অনুমানের থেকে এলোমেলো প্রভাবগুলির পূর্বাভাসগুলি কতটা দূরে থাকবে তার একটি গুরুত্বপূর্ণ নির্ধারণ হ'ল ত্রুটি বৈকল্পের সাথে এলোমেলো প্রভাবগুলির প্রকরণের অনুপাত। Rএকমাত্র উপায় (ইন্টারসেপ্ট) ফিটের সাথে 5 'লেভেল 2' ইউনিট সহ সাধারণ মামলার জন্য এখানে একটি দ্রুত ডেমো রয়েছে। (আপনি ক্লাসের মধ্যে শিক্ষার্থীদের জন্য পরীক্ষার স্কোর হিসাবে এটি ভাবতে পারেন))

library(lme4)   # we'll need to use this package
set.seed(1673)  # this makes the example exactly reproducible
nj = 5;    ni = 5;    g = as.factor(rep(c(1:nj), each=ni))

##### model 1
pop.mean = 16;    sigma.g = 1;    sigma.e = 5
r.eff1   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff1, each=ni) + error

re.mod1  = lmer(y~(1|g))
fe.mod1  = lm(y~0+g)
df1      = data.frame(fe1=coef(fe.mod1), re1=coef(re.mod1)$g)

##### model 2
pop.mean = 16;    sigma.g = 5;    sigma.e = 5
r.eff2   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff2, each=ni) + error

re.mod2  = lmer(y~(1|g))
fe.mod2  = lm(y~0+g)
df2      = data.frame(fe2=coef(fe.mod2), re2=coef(re.mod2)$g)

##### model 3
pop.mean = 16;    sigma.g = 5;    sigma.e = 1
r.eff3   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff3, each=ni) + error

re.mod3  = lmer(y~(1|g))
fe.mod3  = lm(y~0+g)
df3      = data.frame(fe3=coef(fe.mod3), re3=coef(re.mod3)$g)

সুতরাং ত্রুটি বৈকল্পিকের এলোমেলো প্রভাবগুলির বৈকল্পিকতার অনুপাতটি 1/5 এর জন্য model 1, 5/5 model 2এবং 5/1 এর জন্য model 3। নোট করুন যে আমি স্তরের ব্যবহারের অর্থ স্থির প্রতিক্রিয়াগুলির মডেলগুলির কোডিং। আমরা এখন পরীক্ষা করতে পারি যে কীভাবে আনুমানিক স্থির প্রভাব এবং পূর্বাভাসের এলোমেলো প্রভাবগুলি এই তিনটি পরিস্থিতির জন্য তুলনা করে।

df1
#         fe1     re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897

df2
#          fe2      re2
# g1 10.979130 11.32997
# g2 13.002723 13.14321
# g3 26.118189 24.89537
# g4 12.109896 12.34319
# g5  9.561495 10.05969

df3
#         fe3      re3
# g1 13.08629 13.19965
# g2 16.36932 16.31164
# g3 17.60149 17.47962
# g4 15.51098 15.49802
# g5 13.74309 13.82224

স্থির প্রতিক্রিয়া অনুমানের নিকটে থাকা এলোমেলো প্রভাবগুলির পূর্বাভাস দিয়ে শেষ করার অন্য উপায়টি যখন আপনার আরও ডেটা থাকে। আমরা model 1উপরের থেকে তুলনা করতে পারি , এলোমেলো প্রভাবের তার কম অনুপাতের সাথে ত্রুটি বৈকল্পের model 1bসাথে একই অনুপাত সহ একটি সংস্করণ ( ) এ তুলনা করতে পারি তবে আরও অনেক তথ্য ( ni = 500পরিবর্তে লক্ষ্য করুন ni = 5)।

##### model 1b
nj = 5;    ni = 500;    g = as.factor(rep(c(1:nj), each=ni))
pop.mean = 16;    sigma.g = 1;    sigma.e = 5
r.eff1b  = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff1b, each=ni) + error

re.mod1b = lmer(y~(1|g))
fe.mod1b = lm(y~0+g)
df1b     = data.frame(fe1b=coef(fe.mod1b), re1b=coef(re.mod1b)$g)

এর প্রভাবগুলি এখানে:

df1
#         fe1     re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897

df1b
#        fe1b     re1b
# g1 15.29064 15.29543
# g2 14.05557 14.08403
# g3 13.97053 14.00061
# g4 16.94697 16.92004
# g5 17.44085 17.40445

কিছুটা সম্পর্কিত নোটে, ডগ বেটস (আর প্যাকেজ lme4 এর লেখক) শব্দটি "BLUP" পছন্দ করেন না এবং পরিবর্তে "শর্তসাপেক্ষ মোড" ব্যবহার করেন (তার খসড়া lme4 বইয়ের পিডিএফ 22-23 দেখুন )। বিশেষত, তিনি বিভাগ 1.6-এ উল্লেখ করেছেন যে "BLUP" কেবলমাত্র রৈখিক মিশ্র-প্রভাব মডেলগুলির জন্য অর্থপূর্ণভাবে ব্যবহার করা যেতে পারে ।


3
+1 টি। তবে আমি নিশ্চিত নই যে আমি "ভবিষ্যদ্বাণী করা" এবং "অনুমান" করার মধ্যে পরিভাষাগত পার্থক্যটির সম্পূর্ণ প্রশংসা করি। সুতরাং একটি বিতরণ প্যারামিটারটি "অনুমান" করা হয়, তবে একটি সুপ্ত পরিবর্তনশীল কেবল "পূর্বাভাস" হতে পারে? আমি কি তখন সঠিকভাবে বুঝতে পারি যে ফ্যাক্টর বিশ্লেষণে ফ্যাক্টর লোডিংগুলি "অনুমান" হয় তবে ফ্যাক্টর স্কোরগুলি "পূর্বাভাস" হয়? এগুলি ছাড়াও, আমি এটি লক্ষণীয়ভাবে বিভ্রান্ত দেখতে পেয়েছি যে "সেরা লিনিয়ার নিরপেক্ষ ভবিষ্যদ্বাণী" নামে পরিচিত কিছু আসলে একটি পক্ষপাতদুষ্ট অনুমানকারী (কারণ এটি সঙ্কুচিতকরণ প্রয়োগ করে এবং তাই অবশ্যই পক্ষপাতদুষ্ট হতে হবে) যদি কেউ যদি এটিকে স্থির প্রভাবগুলির "অনুমানক" হিসাবে বিবেচনা করে থাকেন। ..
অ্যামিবা

@ আমেবা, যাইহোক "সেরা" অর্থ কী? সেরা কি? এটি কি ডেটাটির গড়ের সর্বোত্তম অনুমান, বা ডেটাতে থাকা তথ্যের সর্বোত্তম সমন্বয় এবং পূর্ববর্তী? বায়েশিয়ান উপমা কি আপনাকে সাহায্য করে?
গুং - মনিকা পুনরায়

2
"রৈখিক" এর অর্থ কমপক্ষে এটি স্পষ্ট :-) গুরুতরভাবে যদিও, "ভবিষ্যদ্বাণী" এবং "অনুমান" এর মধ্যে টার্মিনোলজিকাল পার্থক্য সম্পর্কে আমি @ শুভ দ্বারা এই খুব সহায়ক উত্তরটি পেয়েছি । আমি মনে করি এটি আমার কাছে পরিভাষাটি স্পষ্ট করে দিয়েছে, তবে এমনকি আমার অনুভূতি আরও দৃced় করেছে যে নামটি সত্ত্বেও বিএলইপি বরং অনুমানক। [অবিরত]
অ্যামিবা বলেছেন মোনিকা ২

2
@ আমেবা, হ্যাঁ সবই যুক্তিযুক্ত। তবে আমি উভয়ের জন্য একই নামটি ব্যবহার করতে চাই না, কারণ আপনি কিছু আলাদা করছেন (অর্থাত সমীকরণগুলি পৃথক) এবং নামগুলি আলাদা করার জন্য এটি দরকারী।
গুং - মনিকা পুনরায়

1
@ আমেবা, আমি এই অনুচ্ছেদে শৃঙ্খলা রক্ষার জন্য প্রথম অনুচ্ছেদে ফ্রেসিংগুলি টুইট করেছি, যাতে "ভবিষ্যদ্বাণী "টিকে সংশোধন না করা, তবে পার্থক্য বজায় রাখতে। আপনি কী ভাবেন যে আমি সুইটি থ্রেড করেছি কিনা তা আরও স্পষ্ট করা উচিত See
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.