আমি কিছু গবেষণার জন্য ত্রুটি ইন ভেরিয়েবল মডেলের জন্য কিছু সিনেট্যাটিক ডেটা নিয়ে কাজ করছি। বর্তমানে আমার একক স্বাধীন ভেরিয়েবল রয়েছে এবং আমি ধরে নিচ্ছি যে নির্ভরশীল ভেরিয়েবলের আসল মানটির জন্য আমি তারতম্যটি জানি।
সুতরাং, এই তথ্যের সাহায্যে আমি নির্ভরশীল ভেরিয়েবলের সহগের জন্য একটি নিরপেক্ষ অনুমানক অর্জন করতে পারি।
মডেলটি:
কোথায়:
igকিছুige_2 \ পাঠ্য {~} N (0,1) এর জন্য
ই 1 ~ এন ( 0 , σ 2 ) σ ই 2 ~ এন ( 0 , 1 )
যেখানে y, il tilde {x the এর মানগুলি প্রতিটি প্রতিটি নমুনার জন্য পরিচিত এবং সেই নমুনার জন্য x এর প্রকৃত মানের মানিক বিচ্যুতিও জানা যায়: ।
আমি ওএলএস ব্যবহার করে পক্ষপাতদুষ্ট ( ) সহগ পেতে এবং তারপরে এটি সমন্বয় করে:
আমি দেখতে পাচ্ছি যে সহগের জন্য আমার নতুন, নিরপেক্ষ অনুমানকটি এই মডেলটির সাথে আরও ভাল (প্রকৃত মানের কাছাকাছি), তবে এমএসই পক্ষপাতদুষ্ট অনুমানক ব্যবহারের চেয়ে খারাপ হচ্ছে।
কি হচ্ছে? আমি পক্ষপাতদুষ্টের চেয়ে আরও ভাল ফলাফলের প্রত্যাশা করেছিলাম একটি পক্ষপাতিত্বকারী অনুমানকারী।
মতলব কোড:
reg_mse_agg = [];
fixed_mse_agg = [];
varMult = 1;
numTests = 60;
for dataNumber=1:8
reg_mses = [];
fixed_mses = [];
X = rand(1000,1);
X(:,1) = X(:,1) * 10;
X(:,1) = X(:,1) + 5;
varX = var(X);
y = 0.5 * X(:,1) -10;
y = y + normrnd(0,1,size(y));
origX = X;
X = X + normrnd(0,dataNumber * varMult ,size(X));
train_size = floor(0.5 * length(y));
for t=1:numTests,
idx = randperm(length(y));
train_idx = idx(1:train_size);
test_idx = idx(train_size+1:end);
Xtrain = X(train_idx,:);
ytrain = y(train_idx);
Xtest = X(test_idx,:);
ytest = y(test_idx);
b = OLS_solver(Xtrain, ytrain);
%first arg of evaluate returns MSE, working correctly.
[ reg_mse, ~ ] = evaluate( b,Xtest,ytest);
reg_mses = [reg_mses ; reg_mse];
varInd = var(Xtrain);
varNoise = varInd - varX;
bFixed = [0 0]';
bFixed(1) = b(1) * varInd / varX;
bFixed(2) = mean(ytrain - bFixed(1)*Xtrain);
[fixed_mse,~ ] = evaluate( bFixed,Xtest,ytest);
fixed_mses = [fixed_mses ; fixed_mse];
dataNumber * varMult
b
bFixed
end
reg_mse_agg = [reg_mse_agg , reg_mses];
fixed_mse_agg = [fixed_mse_agg , fixed_mses];
end
mean(reg_mse_agg)
mean(fixed_mse_agg)
ফলাফল:
পক্ষপাতদুষ্ট অনুমানকারীর এমএসই:
ans =
Columns 1 through 7
1.2171 1.6513 1.9989 2.3914 2.5766 2.6712 2.5997
Column 8
2.8346
নিরপেক্ষ অনুমানক এর এমএসই:
ans =
Columns 1 through 7
1.2308 2.0001 2.9555 4.9727 7.6757 11.3106 14.4283
Column 8
11.5653
তদ্ব্যতীত, b
এবং এর মানগুলি মুদ্রণ করা bFixed
আমি পক্ষপাতদায়ক অনুমানের চেয়ে প্রত্যাশার তুলনায় bFixed
প্রকৃত মূল্যবোধের 0.5,-10
নিকটেই দেখতে পাই ।
পিএস পক্ষপাতদুষ্ট অনুমানকারীের চেয়ে পক্ষপাতহীন হওয়ার ফলাফল পরিসংখ্যানগত তাৎপর্যপূর্ণ - এটির জন্য পরীক্ষাটি কোড থেকে বাদ দেওয়া হয়, কারণ এটি "সম্পূর্ণ সংস্করণ" কোডটির সরলকরণ।
আপডেট: আমি একটি পরীক্ষা যুক্ত করেছি যা cks এবং , এবং পক্ষপাতদুষ্ট অনুমানকটি এই মেট্রিক অনুসারে নিরপেক্ষ পক্ষের তুলনায় প্রকৃতপক্ষে আরও খারাপ (বৃহত্তর মান), যদিও পক্ষপাতদুষ্ট হিসাবরক্ষক (পরীক্ষা-সেট) এর এমএসই উল্লেখযোগ্যভাবে ভাল।
কোথায় নির্ভরশীল পরিবর্তনশীল প্রকৃত সহগ হয়, জন্য পক্ষপাতদুষ্ট মূল্নির্ধারক হয় , এবং জন্য পক্ষপাতিত্বহীন মূল্নির্ধারক হয় । Σ প্রতিটি পরীক্ষার জন্য ( β ' - β ) 2 β = 0.5 β β β ' β
এটি আমার বিশ্বাস বিশ্বাস করে যে ফলাফলের কারণটি নিরপেক্ষ আনুমানিকের উচ্চতর বৈকল্পিকতা নয়, কারণ এটি এখনও প্রকৃত মানের কাছাকাছি।
ক্রেডিট: স্টিভ পিসচের লেকচার নোটগুলি রিসোর্স হিসাবে ব্যবহার করে
b
এবং এর সমস্ত মানের মুদ্রণ যোগ করে নি bFixed
, তবে তারা কী দেখায় তা ব্যাখ্যা করেছে।