এই ধরণের পরিস্থিতি নেস্টেড মডেলগুলির জন্য একটি স্ট্যান্ডার্ড এফ-টেস্ট দ্বারা পরিচালনা করা যেতে পারে । যেহেতু আপনি নির্দিষ্ট পরামিতিগুলির সাথে নাল মডেলের বিপরীতে উভয় পরামিতি পরীক্ষা করতে চান, তাই আপনার অনুমানগুলি হ'ল:
এইচ0: β = [ ০1]এইচএকজন: β ≠ [ 01] ।
এফ-পরীক্ষায় উভয় মডেলকে ফিট করা এবং তাদের অবশিষ্টাংশের স্কোয়ারের তুলনা করা জড়িত, যা হ'ল:
এসএসই0= ∑i = 1এন( y)আমি- এক্সআমি)2এসএসইএকজন= ∑i = 1এন( y)আমি- β^0- β^1এক্সআমি)2
পরীক্ষার পরিসংখ্যান হ'ল:
এফ। চ( y , x ) = n - 22। এসএসই0- এসএসইএকজনএসএসইএকজন।
সংশ্লিষ্ট পি-মানটি হ'ল:
p ≡ p ( y , x ) = ∫এফ( y , x )∞এফ-জেলা ( আর | 2 , এন - 2 ) d দ ।
দ বাস্তবায়ন: ধরুন আপনার ডেটা একটি ডাটা ফ্রেম নামক হয় DATA
ভেরিয়েবল নামক সঙ্গে y
এবং x
। এফ-টেস্টটি নিম্নলিখিত কোড সহ ম্যানুয়ালি সঞ্চালিত হতে পারে। আমি যে সিমুলেটেড মক ডেটা ব্যবহার করেছি তাতে আপনি দেখতে পাচ্ছেন যে অনুমানের সহগগুলি নাল অনুমানের মধ্যে খুব কাছাকাছি রয়েছে এবং পরীক্ষার পি-ভ্যালু নাল অনুমানকে মিথ্যা প্রমাণের জন্য কোনও উল্লেখযোগ্য প্রমাণ দেখায় না যে আসল রিগ্রেশন ফাংশনটি পরিচয় ফাংশন।
#Generate mock data (you can substitute your data if you prefer)
set.seed(12345);
n <- 1000;
x <- rnorm(n, mean = 0, sd = 5);
e <- rnorm(n, mean = 0, sd = 2/sqrt(1+abs(x)));
y <- x + e;
DATA <- data.frame(y = y, x = x);
#Fit initial regression model
MODEL <- lm(y ~ x, data = DATA);
#Calculate test statistic
SSE0 <- sum((DATA$y-DATA$x)^2);
SSEA <- sum(MODEL$residuals^2);
F_STAT <- ((n-2)/2)*((SSE0 - SSEA)/SSEA);
P_VAL <- pf(q = F_STAT, df1 = 2, df2 = n-2, lower.tail = FALSE);
#Plot the data and show test outcome
plot(DATA$x, DATA$y,
main = 'All Residuals',
sub = paste0('(Test against identity function - F-Stat = ',
sprintf("%.4f", F_STAT), ', p-value = ', sprintf("%.4f", P_VAL), ')'),
xlab = 'Dataset #1 Normalized residuals',
ylab = 'Dataset #2 Normalized residuals');
abline(lm(y ~ x, DATA), col = 'red', lty = 2, lwd = 2);
summary
আউটপুট এবং plot
এই মত এই তথ্য চেহারার জন্য:
summary(MODEL);
Call:
lm(formula = y ~ x, data = DATA)
Residuals:
Min 1Q Median 3Q Max
-4.8276 -0.6742 0.0043 0.6703 5.1462
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.02784 0.03552 -0.784 0.433
x 1.00507 0.00711 141.370 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.122 on 998 degrees of freedom
Multiple R-squared: 0.9524, Adjusted R-squared: 0.9524
F-statistic: 1.999e+04 on 1 and 998 DF, p-value: < 2.2e-16
F_STAT;
[1] 0.5370824
P_VAL;
[1] 0.5846198