আনুমানিক হিসাব


14

আমার কাছে একটি তাত্ত্বিক অর্থনৈতিক মডেল রয়েছে যা নীচে রয়েছে,

y=a+b1x1+b2x2+b3x3+u

সুতরাং তত্ত্বটি বলে যে y অনুমান করার জন্য x1 , x2 এবং x3 কারণ রয়েছে ।y

এখন আমার কাছে আসল ডেটা রয়েছে এবং আমার b1 , b2 , অনুমান করা দরকার b3। সমস্যাটি হ'ল আসল ডেটা সেটে কেবল x1 এবং ডেটা থাকে x2; জন্য কোনও ডেটা নেই x3। সুতরাং আমি যে মডেলটি ফিট করতে পারি তা হ'ল:

y=a+b1x1+b2x2+u
  • এই মডেলটি অনুমান করা কি ঠিক আছে?
  • আমি কি এটি অনুমান করে কিছু হারিয়ে ফেলছি?
  • আমি যদি , বি 2 অনুমান করি তবে 3 এক্স 3 টার্মটি কোথায় যাবে?b1b2b3x3
  • এটি ভুল শব্দটি দ্বারা জন্য দায়ী করা হয় ?u

এবং আমরা ধরে নিতে চাই যে এক্স 1 এবং এক্স 2 এর সাথে সম্পর্কিত নয় ।x3x1x2


আপনি কি আপনার ডেটা সেট সম্পর্কে বিশদ দিতে পারবেন, মানে আপনার নির্ভরশীল ভেরিয়েবল এবং স্বতন্ত্র ভেরিয়েবল x 1 এবং x 2 ? yx1x2
ভারা

নির্দিষ্ট ডেটা সেট ব্যতীত
এটিকে হাইপোথিক্যাল

উত্তর:


20

আপনার যে সমস্যাটি নিয়ে চিন্তিত হতে হবে তাকে অন্তঃসত্ত্বা বলা হয় । আরো নির্দিষ্টভাবে, এটি কিনা উপর নির্ভর করে সঙ্গে জনসংখ্যা হল পারস্পরিক এক্স 1 বা এক্স 2 । যদি এটি হয়, তবে সম্পর্কিত বি এর পক্ষপাতিত্ব করা হবে। এর কারণ হল ওএলএসের রিগ্রেশন পদ্ধতিগুলি অবশিষ্টাংশগুলিকে বাধ্য করে, আপনি i , আপনার covariates এর সাথে সম্পর্কযুক্ত হতে পারেন না, x j s। যাইহোক, আপনার অবশিষ্টাংশ কিছু সরলীকরণযোগ্য যদৃচ্ছতা, দ্বারা গঠিত ε আমি , এবং , অলক্ষিত (কিন্তু প্রাসঙ্গিক) পরিবর্তনশীল x 3 হয়x3x1x2bjuixjεix3 , যা চুক্তি দ্বারা সম্পর্কিত সঙ্গে এবং / অথবা এক্স 2 । অন্যদিকে, যদি x 1 এবং x 2 উভয়ইজনসংখ্যারসাথে এক্স 3 এর সাথে সম্পর্কযুক্ত হয়তবে তাদের গুলি এর দ্বারা পক্ষপাতী হবে না (অবশ্যই তারা অন্য কোনও কারণে পক্ষপাতদুষ্ট হতে পারে)। একনোমেট্রিকরা এই সমস্যাটি মোকাবিলার জন্য একটি উপায় ব্যবহার করে isx1x2 x1x2x3b ইনস্ট্রুমেন্টাল ভেরিয়েবলগুলি

বৃহত্তর স্পষ্টতার স্বার্থে, আমি আর-তে একটি দ্রুত সিমুলেশন লিখেছি যা দেখায় যে এর নমুনা বিতরণ নিরপেক্ষ / নিখরচায় cen 2 এর সত্য মানের উপর কেন্দ্রিক , যখন এটি এক্স 3 এর সাথে সম্পর্কযুক্ত না হয় । দ্বিতীয় রানের ক্ষেত্রে, তবে এটি নোট করুনb2β2x3রানটিতে এক্স 3 এক্স 1 এর সাথে সম্পর্কযুক্তনয়, তবে এক্স 2 নয় । কাকতালীয়ভাবে না,1 পক্ষপাতিত্বহীন, কিন্তু2 হয়পক্ষপাতমূলক। x3x1x2b1b2

library(MASS)                          # you'll need this package below
N     = 100                            # this is how much data we'll use
beta0 = -71                            # these are the true values of the
beta1 = .84                            # parameters
beta2 = .64
beta3 = .34

############## uncorrelated version

b0VectU = vector(length=10000)         # these will store the parameter
b1VectU = vector(length=10000)         # estimates
b2VectU = vector(length=10000)
set.seed(7508)                         # this makes the simulation reproducible

for(i in 1:10000){                     # we'll do this 10k times
  x1 = rnorm(N)
  x2 = rnorm(N)                        # these variables are uncorrelated
  x3 = rnorm(N)
  y  = beta0 + beta1*x1 + beta2*x2 + beta3*x3 + rnorm(100)
  mod = lm(y~x1+x2)                    # note all 3 variables are relevant
                                       # but the model omits x3
  b0VectU[i] = coef(mod)[1]            # here I'm storing the estimates
  b1VectU[i] = coef(mod)[2]
  b2VectU[i] = coef(mod)[3]
}
mean(b0VectU)  # [1] -71.00005         # all 3 of these are centered on the
mean(b1VectU)  # [1] 0.8399306         # the true values / are unbiased
mean(b2VectU)  # [1] 0.6398391         # e.g., .64 = .64

############## correlated version

r23 = .7                               # this will be the correlation in the
b0VectC = vector(length=10000)         # population between x2 & x3
b1VectC = vector(length=10000)
b2VectC = vector(length=10000)
set.seed(2734)

for(i in 1:10000){
  x1 = rnorm(N)
  X  = mvrnorm(N, mu=c(0,0), Sigma=rbind(c(  1, r23),
                                         c(r23,   1)))
  x2 = X[,1]
  x3 = X[,2]                           # x3 is correated w/ x2, but not x1
  y  = beta0 + beta1*x1 + beta2*x2 + beta3*x3 + rnorm(100)
                                       # once again, all 3 variables are relevant
  mod = lm(y~x1+x2)                    # but the model omits x3
  b0VectC[i] = coef(mod)[1]
  b1VectC[i] = coef(mod)[2]            # we store the estimates again
  b2VectC[i] = coef(mod)[3]
}
mean(b0VectC)  # [1] -70.99916         # the 1st 2 are unbiased
mean(b1VectC)  # [1] 0.8409656         # but the sampling dist of x2 is biased
mean(b2VectC)  # [1] 0.8784184         # .88 not equal to .64

সুতরাং, আপনি কি আরও কিছুটা ব্যাখ্যা করতে পারেন - যদি আমরা ধরে নিই যে এক্স 3 $ x_1 এবং x2 দিয়ে সংশ্লেষিত নয় তবে কি হবে? তাহলে আমি যদি y = a + b1x1 + b2x2 + u অনুমান করি তবে কী হবে?
পুনর্নবী

1
উভয় উপায়ে অবশিষ্টাংশে সংহত করা হবে, তবেযদি ifb3x3 এটি জনসংখ্যায় অসম্পৃক্ত হয় তবে আপনার অন্যান্য গুলি এক্স 3 এর অভাবে পক্ষপাতিত্ব করা হবে না , তবে এটি যদি অসংরক্ষিত না হয় তবে তারা হবে। bx3
গুং - মনিকা পুনরায়

এটি আরও স্পষ্টভাবে বর্ণনা করতে: যদি সাথে কোনওটি সম্পর্কযুক্ত না হয়x3 বা x 2 এরআপনি ঠিক আছেন। x1x2
গুং - মনিকা পুনরায়


3

আসুন জ্যামিতিক দিক থেকে এটি চিন্তা করি। একটি "বল", একটি বলের পৃষ্ঠ সম্পর্কে চিন্তা করুন। এটা তোলে হিসেবে অভিহিত করা হয় । এখন যদি আপনার কাছে x 2 , y 2 , z 2 এর মান হয় এবং আপনি r 2 এর পরিমাপ করেন r2=ax2+by2+cz2+ϵx2y2z2r2 তবে আপনি আপনার সহগ "a", "বি" এবং "সি" নির্ধারণ করতে পারেন। (আপনি এটিকে এলিপসয়েড বলতে পারেন, তবে এটিকে বল বলাই সহজ)

আপনার যদি কেবলমাত্র , এবং y 2 পদ থাকে তবে আপনি একটি বৃত্ত তৈরি করতে পারেন। কোনও বলের পৃষ্ঠকে সংজ্ঞায়িত করার পরিবর্তে, আপনি একটি পূর্ণ বৃত্তটি বর্ণনা করবেন। সমীকরণ আপনি যদি এর পরিবর্তে ফিট r 2একটি এক্স 2 + + Y 2 + + εx2y2r2ax2+by2+ϵ

আপনি বৃত্তটির অভিব্যক্তিতে "বল", যা আকারেরই হোক না কেন, প্রজেক্ট করছেন। এটি একটি তির্যক ভিত্তিক "বল" হতে পারে যা সেলাই সূঁচের মতো আরও আকৃতির হয় এবং তাই উপাদানগুলি দুটি অক্ষের অনুমানকে পুরোপুরি নষ্ট করে দেয়। এটি এমন একটি বল হতে পারে যা দেখতে প্রায় চূর্ণবিচূর্ণ এম & এমের মতো লাগে যেখানে মুদ্রার অক্ষগুলি "x" এবং "y" হয় এবং সেখানে শূন্য অভিক্ষেপ থাকে। এটি " জেড " ছাড়া কোনটি আপনি তা জানতে পারবেন নাzz " তথ্য ।

শেষ অনুচ্ছেদে একটি "খাঁটি তথ্য" কেস সম্পর্কে কথা বলা হয়েছিল এবং গোলমালের জন্য দায়বদ্ধ ছিল না। বাস্তব বিশ্বের পরিমাপ শোনার সংকেত রয়েছে। অক্ষগুলির সাথে সামঞ্জস্য করা পেরিমেটার বরাবর গোলমাল আপনার ফিটের উপর আরও শক্তিশালী প্রভাব ফেলতে চলেছে। আপনার কাছে একই সংখ্যার নমুনা থাকলেও, আপনার প্যারামিটারের অনুমানগুলিতে আপনার আরও অনিশ্চয়তা থাকতে চলেছে। যদি এই সাধারণ লিনিয়ার অক্ষ-ভিত্তিক ক্ষেত্রেটির চেয়ে আলাদা সমীকরণ হয় তবে জিনিসগুলি " নাশপাতি আকারে " যেতে পারে । আপনার বর্তমান সমীকরণগুলি সমতল-আকৃতির, সুতরাং একটি গণ্ডি (বলের পৃষ্ঠতল) রাখার পরিবর্তে জেড-ডেটা কেবল সমস্ত মানচিত্রে যেতে পারে - অভিক্ষেপ একটি গুরুতর সমস্যা হতে পারে।

মডেল করা কি ঠিক আছে? এটা রায় রায়। এমন একটি বিশেষজ্ঞ যিনি সমস্যার বিশদটি বোঝেন সেটির উত্তর দিতে পারে। সমস্যা থেকে দূরে থাকলে কেউই ভাল উত্তর দিতে পারে কিনা তা আমি জানি না।

প্যারামিটারের প্রাক্কলনগুলিতে নিশ্চিত হওয়া এবং মডেলটির প্রকৃতি রূপান্তরিত হওয়া সহ আপনি বেশ কয়েকটি ভাল জিনিস হারাবেন।

অনুমানটি এপিসিলনে এবং অন্যান্য পরামিতির অনুমানগুলিতে অদৃশ্য হয়ে যায়। অন্তর্নিহিত সিস্টেমের উপর নির্ভর করে এটি সম্পূর্ণ সমীকরণ দ্বারা উপস্থাপিত হয়।b3



f(x,y,z)

আমি আপনার যুক্তি অনুসরণ করতে অক্ষম কারণ আমি "স্কয়ারে পূর্ণ" এর সাথে মিলে এমন কিছু দেখতে পাচ্ছি না।
whuber

0

অন্য উত্তরগুলি ভুল না হলেও সমস্যাটিকে কিছুটা জটিল করে তুলেছে।

যদি এক্স3 সত্যই সাথে সম্পর্কযুক্ত এক্স1 এবং এক্স2(এবং প্রকৃত সম্পর্কটি নির্দিষ্ট হিসাবে নির্দিষ্ট) তবে আপনি কোনও সমস্যা ছাড়াই আপনার দ্বিতীয় সমীকরণ অনুমান করতে পারেন। আপনি পরামর্শ হিসাবে,β3এক্স3(নতুন) ত্রুটি শব্দ দ্বারা শোষিত হবে। যতক্ষণ না অন্যান্য সমস্ত ওএলএস অনুমান ধরে থাকে ততক্ষণ ওএলএস অনুমানটি পক্ষপাতহীন থাকবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.