সহজেই এটি কীভাবে করা যায় তা আমি জানার একমাত্র উপায় হ'ল মডেল থেকে পূর্বাভাসের ব্যাপ্তি sqft
এবং প্লট করা। এর সাথে abline
বা এর মতো কোনও সাধারণ উপায় নেই । আপনি সেগমেন্টযুক্ত প্যাকেজটিও দেখে নিতে পারেন যা এই মডেলগুলির সাথে খাপ খায় এবং আপনার জন্য চক্রান্তের অবকাঠামো সরবরাহ করে।
পূর্বাভাস এবং বেস গ্রাফিক্সের মাধ্যমে এটি করা। প্রথমত, কিছু ডামি ডেটা:
set.seed(1)
sqft <- runif(100)
sqft <- ifelse((tmp <- sqft > mean(sqft)), 1, 0) + rnorm(100, sd = 0.5)
price <- 2 + 2.5 * sqft
price <- ifelse(tmp, price, 0) + rnorm(100, sd = 0.6)
DF <- data.frame(sqft = sqft, price = price,
Ind = ifelse(sqft > mean(sqft), 1, 0))
rm(price, sqft)
plot(price ~ sqft, data = DF)
মডেল ফিট:
mod <- lm(price~sqft+I((sqft-mean(sqft))*Ind), data = DF)
ভবিষ্যদ্বাণী ও ভবিষ্যদ্বাণী করার জন্য কিছু ডেটা তৈরি করুন:
m.sqft <- with(DF, mean(sqft))
pDF <- with(DF, data.frame(sqft = seq(min(sqft), max(sqft), length = 200)))
pDF <- within(pDF, Ind <- ifelse(sqft > m.sqft, 1, 0))
pDF <- within(pDF, price <- predict(mod, newdata = pDF))
রিগ্রেশন লাইন প্লট করুন:
ylim <- range(pDF$price, DF$price)
xlim <- range(pDF$sqft, DF$sqft)
plot(price ~ sqft, data = DF, ylim = ylim, xlim = xlim)
lines(price ~ sqft, data = pDF, subset = Ind > 0, col = "red", lwd = 2)
lines(price ~ sqft, data = pDF, subset = Ind < 1, col = "red", lwd = 2)
আপনি এটি একটি সাধারণ ফাংশনে কোড করতে পারেন - আপনার কেবল দুটি পূর্ববর্তী কোড খণ্ডের পদক্ষেপগুলি দরকার - যা আপনি এর জায়গায় ব্যবহার করতে পারেন abline
:
myabline <- function(model, data, ...) {
m.sqft <- with(data, mean(sqft))
pDF <- with(data, data.frame(sqft = seq(min(sqft), max(sqft),
length = 200)))
pDF <- within(pDF, Ind <- ifelse(sqft > m.sqft, 1, 0))
pDF <- within(pDF, price <- predict(mod, newdata = pDF))
lines(price ~ sqft, data = pDF, subset = Ind > 0, ...)
lines(price ~ sqft, data = pDF, subset = Ind < 1, ...)
invisible(model)
}
তারপর:
ylim <- range(pDF$price, DF$price)
xlim <- range(pDF$sqft, DF$sqft)
plot(price ~ sqft, data = DF, ylim = ylim, xlim = xlim)
myabline(mod, DF, col = "red", lwd = 2)
বিভাগযুক্ত প্যাকেজ মাধ্যমে
require(segmented)
mod2 <- lm(price ~ sqft, data = DF)
mod.s <- segmented(mod2, seg.Z = ~ sqft, psi = 0.5,
control = seg.control(stop.if.error = FALSE))
plot(price ~ sqft, data = DF)
plot(mod.s, add = TRUE)
lines(mod.s, col = "red")
এই ডেটা দিয়ে এটি ব্রেকআপপয়েন্টটি অনুমান করে না mean(sqft)
, তবে সেই প্যাকেজটিতে থাকা পদ্ধতি plot
এবং lines
পদ্ধতিগুলি আপনাকে myabline
উপযুক্ত lm()
মডেল থেকে সরাসরি নির্দেশ দেওয়ার জন্য এই কাজটি করার চেয়ে আরও সাধারণ কিছু প্রয়োগ করতে সহায়তা করতে পারে ।
সম্পাদনা করুন: যদি আপনি ব্রেকপয়েন্টের অবস্থানটি অনুমান করতে বিভাগগুলি চান তবে 'psi'
যুক্তিটি এতে সেট করুন NA
:
mod.s <- segmented(mod2, seg.Z = ~ sqft, psi = NA,
control = seg.control(stop.if.error = FALSE))
তারপরে সেট আপ হওয়ার সাথে এবং কোনটি ডিফল্ট segmented
হবে তার K = 10
পরিমাণের চেষ্টা করবে । আরও জন্য দেখুন।sqft
K
seg.control()
10
?seg.control