মসৃণ স্প্লাইন / লোস রিগ্রেশনটির পি-মান আমি কীভাবে খুঁজে পাব?


10

আমার কিছু পরিবর্তনশীল রয়েছে এবং আমি তাদের মধ্যে অ-লিনিয়ার সম্পর্কগুলি খুঁজে পেতে আগ্রহী। সুতরাং আমি কিছু স্প্লাইন বা লোস ফিট করব এবং দুর্দান্ত প্লটগুলি মুদ্রণ করব (নীচের কোডটি দেখুন)। তবে, আমি এমন কিছু পরিসংখ্যানও রাখতে চাই যা আমাকে ধারণা দেয় যে সম্পর্কটি এলোমেলো বিষয় ... সম্ভবত, আমার কিছু সামগ্রিক পি-মান দরকার যেমন উদাহরণস্বরূপ লিনিয়ার প্রতিরোধের জন্য আমার রয়েছে। অন্য কথায়, আমার লাগানো বক্ররেখা কোনও অর্থবোধ করে কিনা তা আমার জানতে হবে, যেহেতু আমার কোডটি কোনও ডেটাতে একটি বক্ররেখা ফিট করবে।

x <- rnorm(1000)
y <- sin(x) + rnorm(1000, 0, 0.5)

cor.test(x,y)
plot(x, y, xlab = xlab, ylab = ylab)
spl1 <- smooth.spline(x, y, tol = 1e-6, df = 8)
lines(spl1, col = "green", lwd = 2)

spl2 <- loess(y ~ x)
x.pr <- seq(min(x), max(x), length.out = 100)
lines(x.pr, predict(spl2, x.pr), col = "blue", lwd = 2)

উত্তর:


8

স্প্লাইনস লাইব্রেরিতে ফাংশন রয়েছে bsএবং এটি ফাংশনটির nsসাথে ব্যবহারের জন্য স্প্লাইন ভিত্তি তৈরি করবে lm, তারপরে আপনি স্প্লিনস সহ একটি রৈখিক মডেল এবং একটি মডেল ফিট করতে anovaপারেন এবং স্প্লাইন মডেলটি আরও ভাল ফিট করে কিনা তা দেখতে সম্পূর্ণ এবং হ্রাস মডেল পরীক্ষা করতে ফাংশনটি ব্যবহার করতে পারেন রৈখিক মডেল চেয়ে।

এখানে কিছু উদাহরণ কোড দেওয়া হল:

x <- rnorm(1000)
y <- sin(x) + rnorm(1000, 0, 0.5)

library(splines)

fit1 <- lm(y~x)
fit0 <- lm(y~1)
fit2 <- lm(y~bs(x,5))

anova(fit1,fit2)
anova(fit0,fit2)

plot(x,y, pch='.')
abline(fit1, col='red')
xx <- seq(min(x),max(x), length.out=250)
yy <- predict(fit2, data.frame(x=xx))
lines(xx,yy, col='blue')

আপনি polyএকটি বহুবর্ষীয় ফিট করতে ফাংশনটি ব্যবহার করতে পারেন এবং বক্রতার পরীক্ষা হিসাবে অ-রৈখিক শর্তাদি পরীক্ষা করতে পারেন।

লোয়েস ফিটের জন্য এটি কিছুটা জটিল। লোস স্মুথিং প্যারামিটারের জন্য স্বাধীনতার সমতুল্য ডিগ্রির কিছু অনুমান রয়েছে যা রাইনারি এবং লোস মডেলগুলি নির্মাণের জন্য এবং এফ পরীক্ষার জন্য মানগুলির সাথে ব্যবহার করা যেতে পারে । আমি মনে করি বুটস্ট্র্যাপিং এবং ক্রমশক্তি পরীক্ষার উপর ভিত্তি করে পদ্ধতিগুলি আরও স্বজ্ঞাত হতে পারে।R2

লোস ফিটের জন্য একটি আত্মবিশ্বাসের ব্যবধান গণনা করার এবং প্লট করার কৌশল রয়েছে (আমি মনে করি ggplot2 প্যাকেজটিতে একটি অন্তর্নির্মিত উপায় থাকতে পারে), আপনি আত্মবিশ্বাস ব্যান্ডটি প্লট করতে পারেন এবং দেখতে পারেন যে কোনও সরল রেখা ব্যান্ডের মধ্যে ফিট হবে কিনা (এটি একটি পি-মান নয়, তবে এখনও একটি হ্যাঁ / না দেয়।

আপনি একটি রৈখিক মডেল ফিট করতে পারেন এবং অবশিষ্টাংশগুলি নিতে পারেন এবং প্রতিক্রিয়া হিসাবে অবশিষ্টাংশগুলিতে একটি লোস মডেল ফিট করতে পারেন (এবং ভবিষ্যদ্বাণীকারী হিসাবে আগ্রহের পরিবর্তনশীল), যদি সত্য মডেল লিনিয়ার হয় তবে এই ফিটটি সমতল লাইনের কাছাকাছি হওয়া উচিত এবং পয়েন্টগুলি পুনরায় সাজানো উচিত ভবিষ্যদ্বাণীকারীর তুলনায় কোনও পার্থক্য করা উচিত নয়। আপনি এটি পরবর্তন পরীক্ষা তৈরি করতে ব্যবহার করতে পারেন। লোসকে ফিট করুন, 0 থেকে পূর্বাভাসিত মানটি সন্ধান করুন, এখন এলোমেলোভাবে পয়েন্টগুলি সারণি করুন এবং একটি নতুন লসের সাথে ফিট করুন এবং 0 থেকে দূরের পূর্বাভাস পয়েন্টটি সন্ধান করুন, একগুচ্ছ বার পুনরাবৃত্তি করুন, পি-মান হ'ল অনুমোদিত মানগুলির অনুপাত মূল মানের থেকে 0 থেকে

লস ব্যান্ডউইথকে বেছে নেওয়ার পদ্ধতি হিসাবে আপনি ক্রস-বৈধকরণটিও দেখতে চাইতে পারেন। এটি কোনও পি-মান দেয় না, তবে একটি অসীম ব্যান্ডউইথ একটি নিখুঁত রৈখিক মডেলের সাথে মিল রাখে, যদি ক্রস-বৈধকরণটি খুব বড় ব্যান্ডউইদথের প্রস্তাব দেয় তবে প্রস্তাবিত যে লিনিয়ার মডেলটি যুক্তিসঙ্গত হতে পারে, যদি উচ্চতর ব্যান্ডউইথগুলি কিছুটির থেকে পরিষ্কারভাবে নিম্নমানের হয় তারপরে আরও ছোট ব্যান্ডউইদথগুলি সুনির্দিষ্ট বক্রতা এবং লিনিয়ার পর্যাপ্ত নয় বলে প্রস্তাব দেয়।


আপনাকে গ্রেগ ধন্যবাদ! আমি মনে করি যে 1 ম অনুচ্ছেদটি যাওয়ার পথ হিসাবে শোনায়, আমি লিনিয়ার মডেলের সাথে তুলনা করতে আগ্রহী নই, কেবল স্প্লাইনটি ব্যাখ্যা করে কিনা তা দেখার জন্য। আপনি কীভাবে আনোয়ার সাথে স্প্লাইনটি পরীক্ষা করতে পারেন তার জন্য কিছু কোড বা আরও কংক্রিট পয়েন্টার সরবরাহ করতে পারেন? আমি বিএস এবং এনএস ফাংশনগুলি দেখছি তবে আমি নিজে এটি আবিষ্কার করতে সক্ষম হওয়ার মতো পরিসংখ্যানগুলিতে খুব ভাল নই।
কৌতুহল

এবং হ্যাঁ আমি কীভাবে কম loের জন্য গণনা করতে পারি ( fibosworld.wordpress.com/2012/11/04/loess-regression-with-r দেখুন ) তবে কীভাবে কে পি- তে রূপান্তর করতে হবে আমার কোনও ধারণা নেই মান ...আর2আর2
কৌতুহল

anovaস্প্লিংস পদ্ধতির সাথে আমি কয়েকটি উদাহরণ কোড যুক্ত করেছি । থেকে এফ পরীক্ষার জন্য বিবেচনা করুন যে এসএসআর দ্বারা বিভক্ত এসএসআর এবং এসএসটি দ্বারা এসএসটি বিভক্ত, সুতরাং the অনুপাতটি ঠিক এসএসআর এসএসই দ্বারা বিভক্ত (এসএসটি-র দুটি মামলা বাতিল)। স্বাধীনতার ডিগ্রি এবং সামান্য বীজগণিত অন্তর্ভুক্ত করুন এবং সামগ্রিক প্রতিরোধের জন্য আপনার কাছে এফ পরিসংখ্যান রয়েছে। আর2R21-আর2আর21-আর2
গ্রেগ তুষার 21

গ্রেগ, ধন্যবাদ! 1) আপনি কি দয়া করে ব্যাখ্যা করতে পারেন যা lm(y~bs(x,5))করছে এবং কেন হচ্ছে না lm(y~I(bs(x,5)))? আমি এই কলটিতে বেশ বিভ্রান্ত হয়ে পড়েছি কারণ বিএস (এক্স, 5) এর ফলাফলটি পরিবর্তনশীল নয় ... 2) আমি কী এটি সঠিকভাবে বুঝতে পারি যে আমি যে পি-ভ্যালুটির সন্ধান করছি তার ফলাফল anova(fit0,fit2)?
কৌতুহল

1
এটি কেবল লিনিয়ার রিগ্রেশন করছে। বহুবর্ষের উপর ভিত্তি করে বক্ররেখার জন্য আপনি , , এবং সাথে লিনিয়ার রিগ্রেশন করতে পারেন , ফাংশনটি ভেরিয়েবলের রূপান্তর তৈরি করে এবং এটিকে লিনিয়ার রিগ্রেশন করে does এক্সএক্স2এক্স3bsএক্সlm
গ্রেগ তুষার 0
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.