স্প্লাইন / স্মুথ রিগ্রেশন সহ নতুন ডেটা কীভাবে পূর্বাভাস দেওয়া যায়


11

ভবিষ্যদ্বাণীমূলক মডেলটির জন্য মসৃণতা / স্প্লিং ব্যবহার করার সময় কীভাবে নতুন ডেটা-র জন্য ভবিষ্যদ্বাণী করা হয় তার একটি ধারণামূলক ব্যাখ্যা দিতে সহায়তা করতে পারে? উদাহরণস্বরূপ, পি-স্প্লিনস সহ আর- gamboostmboostপ্যাকেজটি ব্যবহার করে তৈরি করা একটি মডেল দেওয়া হলে কীভাবে নতুন ডেটার পূর্বাভাস দেওয়া হয়? প্রশিক্ষণ তথ্য থেকে কি ব্যবহার করা হয়?

বলুন যে এখানে স্বাধীন ভেরিয়েবল এক্সের একটি নতুন মান রয়েছে এবং আমরা y এর পূর্বাভাস দিতে চাই। মডেলটিকে প্রশিক্ষণ দেওয়ার সময় নট বা ডিএফ ব্যবহার করে নট বা ডিএফ ব্যবহার করে কি স্প্লাইন তৈরির জন্য কোনও সূত্র প্রয়োগ করা হয়েছে এবং তারপরে প্রশিক্ষণপ্রাপ্ত মডেলের সহগগুলি পূর্বাভাসের জন্য আউটপুট প্রয়োগ করা হবে?

এখানে আর এর সাথে একটি উদাহরণ দেওয়া হয়েছে, নতুন ডেটা মানে_ডিয়াস = 15.99 এর জন্য 899.4139 আউটপুট দেওয়ার ক্ষেত্রে ধারণাটি কী করবেন?

#take the data wpbc as example
library(mboost)
data(wpbc)

modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)

প্রশ্ন: এটি কি ইন্টারপোলেশন (ডোমেনের অভ্যন্তর) বা এক্সট্রোপোলেশন সম্পর্কে? এগুলি অন্যভাবে পরিচালনা করা হয়। তারা "ভিত্তি" ফাংশনের উপরও খুব নির্ভরশীল। জিএলএম-তে প্রত্যাশার মতো একটি রেডিয়াল বেস ফাংশন কিছুটা উচ্চ (এআর) অর্ডার বহুপুত্র ভিত্তির চেয়ে বিশেষত লেজ ছাড়িয়ে আলাদা আচরণ করতে চলেছে।
এনগ্রু স্টুডেন্ট

EngrStudent, আমি উভয় ক্ষেত্রে কি ঘটবে ধারণাগতভাবে বুঝতে আগ্রহী। আমি ধরে নিয়েছি (সম্ভবত ভুলভাবে) যে উভয় ক্ষেত্রেই প্রক্রিয়া একই ছিল তবে ফলাফলের মানগুলি ব্যবহৃত ভিত্তিক ফাংশনগুলির দ্বারা পৃথক এবং পৃথক হয় (তবে প্রক্রিয়াটি একই ছিল)
B_Miner

বহুবর্ষীয় ঘাঁটিতে কখনও কখনও "গীবস এফেক্ট" নামে পরিচিত একটি ঘটনা ঘটে। আপনি যদি 10 ম আদেশের বহুবর্ষের মতো কোনও মানের সাধারণ বন্টনের সমান নমুনাগুলির সাথে ডেটা মাপসই করেন এবং তারপরে গুণমানের দিকে তাকান আপনি দেখতে পাবেন যে প্রান্তগুলিতে slালু উচ্চ এবং আন্তঃবিভাজন খুব দুর্বল। বহুবর্ষীয় বেসগুলিতে এটি ইন্টারপোল্যান্টের চেয়ে নিম্নতর অর্ডার এক্সপ্লোরেন্ট ব্যবহার করার প্রথাগত। "পদার্থবিজ্ঞান" না জেনে ঘটনাটি সংজ্ঞায়িত করে বহির্মুখীগুলি প্রায়শই লিনিয়ার থাকে। আমি ম্যাটল্যাব ব্যবহার করছি: mathworks.com/help/matlab/ref/interp1.html
এনগ্রিস্টুডেন্ট

উত্তর:


10

ভবিষ্যদ্বাণীটি গণনা করার পদ্ধতিটি এরকম:

আসল ফিট থেকে, mean_radiusআপনার প্রশিক্ষণের ডেটাতে সীমার মধ্যে ছড়িয়ে দেওয়া গিঁটের অবস্থানগুলি রয়েছে । বি-স্প্লাইন ভিত্তির ডিগ্রির সাথে (ডিফল্টরূপে কিউবিক mboost), এই গিঁটের অবস্থানগুলি আপনার বি-স্প্লিন ভিত্তিক ফাংশনগুলির আকারকে সংজ্ঞায়িত করে। ডিফল্টটিতে mboost20 টি অভ্যন্তরীণ নট থাকে, যা 24 ঘনক বি-স্প্লাইন ভিত্তিক কার্যগুলি সংজ্ঞায়িত করে (জিজ্ঞাসা করবেন না ...)। এই ভিত্তি ফাংশনগুলিকে কল করতে দেয় ; = 1 , ... , 24 । আপনার covariate x = `` গড়_radius`` এর প্রভাবটি কেবল f ( x ) = 24 j হিসাবে উপস্থাপিত হয় বি(এক্স);=1,...,24এক্স=

(এক্স)=Σ24বি(এক্স)θ
(এক্স)θবি(এক্স)

θ^বি();=1,...,24এক্সএনW

^(এক্সএনW)=Σ24বি(এক্সএনW)θ^

মিগুলিটিপি1,...,মিগুলিটিপি

bbs(rnorm(100))$dpp(rep(1,100))$predict,

এবং সেখান থেকে অন্বেষণ করুন। উদাহরণ স্বরূপ,

with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), newX)

কল

with(environment(bbs(rnorm(100))$dpp(rep(1,100))$predict), Xfun)

বি()এক্সএনW


এটা অসাধারণ. আমি ভাবছি যদি এই ফাংশনগুলি কী করে আপনার বিস্তৃতভাবে ব্যাখ্যা করতে মন চায়? এটি কি সত্য যে নতুন ডেটা "স্কোর" করার জন্য যা প্রয়োজন তা হ'ল প্রশিক্ষণকালে গিঁটের অবস্থানগুলি এবং স্প্লিংসের সূত্রটি কী? নতুন ডেটা (কোনও কেএনএন মডেলের মতো) স্কোর করার জন্য কি অন্য প্রশিক্ষণের ডেটা দরকার?
বি_মিনার

1
আপনার কোন তথ্যটি প্রয়োজন তা আপনার ব্যবহৃত স্প্লাইন ভিত্তির উপর নির্ভর করে। বি স্প্লিংসের জন্য, আপনাকে যা জানা দরকার তা হ'ল বি-স্প্লাইনের ক্রম (চতুর্ভুজ / ঘনক / ইত্যাদি ..) এবং গিঁটের অবস্থানগুলি। বি-স্প্লাইনের জন্য "সূত্র" হ'ল একটি পুনরাবৃত্তি, কক্স-ডি বুর পুনরাবৃত্তি । আমি আমার উত্তরে একটি অর্ধ বাক্য যুক্ত করেছি।
ভক্তরা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.