ভবিষ্যদ্বাণী ও পূর্বাভাস
হ্যাঁ আপনি সঠিক, আপনি যখন এটিকে ভবিষ্যদ্বাণী করার সমস্যা হিসাবে দেখেন, তখন ওয়াই-অন-এক্স রিগ্রেশন আপনাকে এমন একটি মডেল দেবে যা একটি সরঞ্জাম পরিমাপের পরে আপনি ল্যাব পদ্ধতিটি না করেই সঠিক ল্যাব পরিমাপের একটি নিরপেক্ষ অনুমান করতে পারবেন ।
অন্য কোনও উপায় রাখুন, আপনি যদি কেবলমাত্র প্রতি আগ্রহী হন তবে আপনি ওয়াই অন অন এক্স রিগ্রেশন চান।E[Y|X]
এটি পাল্টা স্বজ্ঞাত বলে মনে হতে পারে কারণ ত্রুটি কাঠামোটি "আসল" নয়। ধরে নিচ্ছি যে ল্যাব পদ্ধতিটি একটি সোনার স্ট্যান্ডার্ড ত্রুটিমুক্ত পদ্ধতি, তবে আমরা "জানি" যে সত্য ডেটা-জেনারেটরি মডেল
Xi=βYi+ϵi
যেখানে এবং স্বতন্ত্রভাবে বিতরণ এবংϵ i E [ ϵ ] = 0YiϵiE[ϵ]=0
আমরা সেরা অনুমান পেতে আগ্রহী । আমাদের স্বাধীনতা অনুমানের কারণে আমরা উপরেরটিকে পুনরায় সাজিয়ে তুলতে পারি:E[Yi|Xi]
Yi=Xi−ϵβ
এখন প্রদত্ত প্রত্যাশা গ্রহণ করা হ'ল বিষয়গুলি লোমশ হয়েXi
E[Yi|Xi]=1βXi−1βE[ϵi|Xi]
সমস্যাটি হল পদ - এটি কি শূন্যের সমান? এটি আসলে কোনও ব্যাপার নয়, কারণ আপনি এটি কখনই দেখতে পাচ্ছেন না এবং আমরা কেবল রৈখিক শর্তগুলি মডেলিং করছি (বা যুক্তিটি আপনি যে মডেলিং করছেন তা শর্ত পর্যন্ত প্রসারিত)। এবং মধ্যে যে কোনও নির্ভরতা কেবল আমাদের যে অনুমানের সাথে ধ্রুবক হয় তার মধ্যে সহজেই শোষিত হতে পারে।E[ϵi|Xi]ϵX
স্পষ্টতই, সাধারণের ক্ষতি ছাড়াই আমরা দিতে পারি
ϵi=γXi+ηi
যেখানে সংজ্ঞা অনুসারে, যাতে এখন আমাদের রয়েছেE[ηi|X]=0
YI=1βXi−γβXi−1βηi
YI=1−γβXi−1βηi
যা সন্তুষ্ট সব OLS ঔজ্জ্বল্যের প্রেক্ষাপটে প্রয়োজনীয়তা, যেহেতু এখন exogenous হয়। এটি সামান্যতম বিবেচ্য নয় যে ত্রুটি শব্দটিতে একটি রয়েছে যেহেতু বা উভয়ই জানা যায় না এবং অবশ্যই অনুমান করা উচিত। অতএব আমরা কেবল সেই ধ্রুবকগুলিকে নতুনগুলির সাথে প্রতিস্থাপন করতে পারি এবং সাধারণ পদ্ধতির ব্যবহার করতে পারিηββσ
YI=αXi+ηi
লক্ষ্য করুন যে আমরা মূলত যে পরিমাণ লিখেছিলাম তা অনুমান করি নি - আমরা ওয়াইয়ের জন্য প্রক্সি হিসাবে এক্স ব্যবহারের জন্য আমাদের সেরা মডেলটি তৈরি করেছি।β
সরঞ্জাম বিশ্লেষণ
যে ব্যক্তি আপনাকে এই প্রশ্নটি স্থাপন করেছে, তারা উপরের উত্তরটি পরিষ্কারভাবে চাচ্ছিল না, কারণ তারা বলে যে এক্স-অন-ওয়াই সঠিক পদ্ধতি, সুতরাং তারা কেন এটি চাইতে পারে? সম্ভবত তারা যন্ত্রটি বোঝার কাজটি বিবেচনা করছিলেন। ভিনসেন্টের উত্তরে আলোচিত হিসাবে, আপনি যদি সেগুলি সম্পর্কে জানতে চান যে তারা যন্ত্রটি কীভাবে আচরণ করে তবে এক্স-অন-ওয়াই হল উপায়।
উপরের প্রথম সমীকরণে ফিরে যাওয়া:
Xi=βYi+ϵi
প্রশ্নটি স্থাপনকারী ব্যক্তিটি ক্রমাঙ্কণের কথা ভাবতে পারে। সত্যিকারের মানের সমান প্রত্যাশা থাকলে ক্রমাঙ্কিত বলা হয় - এটি । স্পষ্টত কে ক্র্যাবরেট করার জন্য আপনাকে এক্স-অন-ওয়াই রিগ্রেশন করতে হবে এমন একটি উপকরণ ক্যালিব্রেট করতে হবে instrument এবং।E[Xi|Yi]=YiXβ
সঙ্কোচন
ক্রমাঙ্কন একটি যন্ত্রের একটি স্বজ্ঞাত জ্ঞানীয় চাহিদা, তবে এটি বিভ্রান্তির কারণও হতে পারে। লক্ষ্য করুন, এমনকি একটি ভাল ক্যালিব্রেটেড যন্ত্র আপনাকে প্রত্যাশিত মানটি দেখায় না ! পেতে আপনি এখনও এমনকি একটি ভাল মডেলটির ক্রমাঙ্ক উপকরণ সঙ্গে, ওয়াই-অন-এক্স রিগ্রেশন করতে হবে। এই অনুমানটি সাধারণত যন্ত্রের মানের সঙ্কুচিত সংস্করণের মতো দেখাবে ( cre শব্দটি যে ক্রিপ্টে প্রবেশ করেছিল তা মনে রাখবেন )। বিশেষত, সত্যিকারের ভাল অনুমানের জন্য আপনার বিতরণ সম্পর্কে আপনার পূর্বের জ্ঞানটি অন্তর্ভুক্ত করা উচিত । এরপরে এটি রিগ্রেশন-টু-দ্য-মিডিয়াল এবং এম্পিরিকাল বেয়েসের মতো ধারণাগুলির দিকে পরিচালিত করে।YE[Y|X]γE[Y|X]Y
আর এর উদাহরণ
এখানে কী চলছে তার অনুভূতি পাওয়ার এক উপায় হ'ল কিছু তথ্য তৈরি করা এবং পদ্ধতিগুলি চেষ্টা করে দেখতে। পূর্বাভাস এবং ক্রমাঙ্কনের জন্য নীচের কোডটি এক্স-অন-ওয়াইয়ের সাথে ওয়াই অন-এক্স এর তুলনা করেছে এবং আপনি দ্রুত দেখতে পারবেন যে এক্স-অন-ওয়াই পূর্বাভাস মডেলের পক্ষে কোনও ভাল নয়, তবে এটি ক্রমাঙ্কণের সঠিক পদ্ধতি।
library(data.table)
library(ggplot2)
N = 100
beta = 0.7
c = 4.4
DT = data.table(Y = rt(N, 5), epsilon = rt(N,8))
DT[, X := 0.7*Y + c + epsilon]
YonX = DT[, lm(Y~X)] # Y = alpha_1 X + alpha_0 + eta
XonY = DT[, lm(X~Y)] # X = beta_1 Y + beta_0 + epsilon
YonX.c = YonX$coef[1] # c = alpha_0
YonX.m = YonX$coef[2] # m = alpha_1
# For X on Y will need to rearrage after the fit.
# Fitting model X = beta_1 Y + beta_0
# Y = X/beta_1 - beta_0/beta_1
XonY.c = -XonY$coef[1]/XonY$coef[2] # c = -beta_0/beta_1
XonY.m = 1.0/XonY$coef[2] # m = 1/ beta_1
ggplot(DT, aes(x = X, y =Y)) + geom_point() + geom_abline(intercept = YonX.c, slope = YonX.m, color = "red") + geom_abline(intercept = XonY.c, slope = XonY.m, color = "blue")
# Generate a fresh sample
DT2 = data.table(Y = rt(N, 5), epsilon = rt(N,8))
DT2[, X := 0.7*Y + c + epsilon]
DT2[, YonX.predict := YonX.c + YonX.m * X]
DT2[, XonY.predict := XonY.c + XonY.m * X]
cat("YonX sum of squares error for prediction: ", DT2[, sum((YonX.predict - Y)^2)])
cat("XonY sum of squares error for prediction: ", DT2[, sum((XonY.predict - Y)^2)])
# Generate lots of samples at the same Y
DT3 = data.table(Y = 4.0, epsilon = rt(N,8))
DT3[, X := 0.7*Y + c + epsilon]
DT3[, YonX.predict := YonX.c + YonX.m * X]
DT3[, XonY.predict := XonY.c + XonY.m * X]
cat("Expected value of X at a given Y (calibrated using YonX) should be close to 4: ", DT3[, mean(YonX.predict)])
cat("Expected value of X at a gievn Y (calibrated using XonY) should be close to 4: ", DT3[, mean(XonY.predict)])
ggplot(DT3) + geom_density(aes(x = YonX.predict), fill = "red", alpha = 0.5) + geom_density(aes(x = XonY.predict), fill = "blue", alpha = 0.5) + geom_vline(x = 4.0, size = 2) + ggtitle("Calibration at 4.0")
দুটি রিগ্রেশন লাইন ডেটা নিয়ে প্লট করা হয়েছে
এবং তারপরে Y এর জন্য স্কোয়ার ত্রুটির যোগফল দুটি নতুন মডেলের জন্য ফিট করে meas
> cat("YonX sum of squares error for prediction: ", DT2[, sum((YonX.predict - Y)^2)])
YonX sum of squares error for prediction: 77.33448
> cat("XonY sum of squares error for prediction: ", DT2[, sum((XonY.predict - Y)^2)])
XonY sum of squares error for prediction: 183.0144
বিকল্পভাবে একটি স্থির ওয়াই (এই ক্ষেত্রে 4) এ একটি নমুনা তৈরি করা যেতে পারে এবং তারপরে নেওয়া অনুমানগুলির গড়। আপনি এখন দেখতে পাচ্ছেন যে ওয়াই-অন-এক্স অনুমানকারীটি ওয়াইয়ের তুলনায় প্রত্যাশিত মানটি ভালভাবে ক্যালিব্রেটেড হয় না X
> cat("Expected value of X at a given Y (calibrated using YonX) should be close to 4: ", DT3[, mean(YonX.predict)])
Expected value of X at a given Y (calibrated using YonX) should be close to 4: 1.305579
> cat("Expected value of X at a gievn Y (calibrated using XonY) should be close to 4: ", DT3[, mean(XonY.predict)])
Expected value of X at a gievn Y (calibrated using XonY) should be close to 4: 3.465205
দুটি পূর্বাভাসের বিতরণ ঘনত্বের প্লটে দেখা যায়।
[self-study]
ট্যাগটি যুক্ত করুন।