অভিযোজিত গ্যামটি এমজিসিভিতে মসৃণ হয়


9

জিএএম তত্ত্ব এবং বাস্তব এবং সিমুলেটেড ডেটাতে মডেল-ফিটিংয়ের বিষয়টি যখন আসে তখন জিএএমএস সম্পর্কিত সায়মন উডের বই এবং তার সম্পর্কিত আর প্যাকেজ এমজিসিভি উভয়ই অত্যন্ত বিশদ এবং তথ্যবহুল।

1 ডি স্মুথের জন্য, চক্রবৃদ্ধি বনাম অভিযোজিত ভিত্তিক ক্রিয়াগুলি বাস্তবায়িত করা উচিত কিনা তা সিদ্ধান্ত নেওয়ার জন্য সত্যই খুব বেশি কিছু নেই , যা ঘনক, পাতলা-প্লেট এবং পি-স্প্লিন স্মুডের তুলনায় খুব আলাদা পূর্বাভাসের ফলাফল দিতে পারে, কারণ অভিযোজিত ক্ষেত্রে, একাধিক জিএএম একটি স্প্লাইন বরাবর বিভিন্ন অঞ্চলে লাগানো হয়। যতদূর আমি বলতে পারি, সময়-সিরিজ মডেলিংয়ে চক্রীয় ঘাঁটিগুলি সাধারণ, যদিও প্রতিক্রিয়াশীল ভেরিয়েবলের সাথে ডেটা অনেকটা পৃথক হয় তখন অভিযোজিত স্মুথগুলি বিবেচনা করা উচিত; তবে অভিযোজিত স্মুথগুলি "স্বল্প ও যত্ন সহকারে" ব্যবহার করা উচিত।

আমি কিছুদিন যাবত জিএএমগুলি তদন্ত করছি এবং আমার গবেষণার প্রশ্নটি দেওয়া হয়েছে, যখন বাস্তবায়নের পক্ষে কোন মসৃণতা আসে তখন আমি নিজেকে অনেকটা বদলে যাচ্ছি। এমজিসিভিতে (আমার গণনা অনুসারে) থেকে 17 টি আলাদা মসৃণ চয়ন করতে পারে। আমি উভয় ঘনক এবং পি-স্প্লাইন মসৃণ বিবেচনা করেছি।

আমার এখন প্রশ্ন : অভিযোজক মসৃণগুলি কখন অ-অভিযোজিত অংশগুলির তুলনায় বিবেচনা করা উচিত, যদি চূড়ান্ত লক্ষ্যটি পূর্বাভাসের উদ্দেশ্যে ফিটযুক্ত জিএএম ব্যবহার করা হয়? আমার উদ্দেশ্যগুলির জন্য, আমি ডিফল্ট জিসিভি মসৃণতার মানদণ্ডের সাথে আঁকছি, যদিও এতে স্বল্প-মসৃণ হওয়ার প্রবণতা রয়েছে।

সাহিত্যের প্রয়োগ বাস্তুসংস্থানীয় জিএএমএসে বৃদ্ধি পাচ্ছে, তবে আমি এখনও এমন একটি গবেষণা সমীক্ষা করতে পারি নি যা একটি অভিযোজিত মসৃণ প্রয়োগ করে।

কোন পরামর্শ প্রশংসা করা হয়।

উত্তর:


20

এমজিসিভি টুলবক্সের বেশিরভাগ অতিরিক্ত মসৃণতা বিশেষজ্ঞের অ্যাপ্লিকেশনগুলির জন্য সত্যই রয়েছে - আপনি সাধারণত সাধারণ জিএএম, বিশেষত অবিচ্ছিন্ন মসৃণদের জন্য এগুলি উপেক্ষা করতে পারেন (আপনার কোনও এলোমেলো প্রভাবের স্প্লাইন, গোলকের একটি স্প্লাইন, মার্কোভ এলোমেলো ক্ষেত্রের প্রয়োজন নেই, বা উদাহরণস্বরূপ আপনার অবিচ্ছিন্ন ডেটা থাকলে একটি সাবান-ফিল্ম স্মুথ))

আপনি যদি সেটআপ ব্যয় সহ্য করতে পারেন তবে পাতলা প্লেট রিগ্রেশন স্প্লাইনস (টিপিআরএস) ব্যবহার করুন।

এই স্প্লিংগুলি একটি এ্যাসিম্পটোটিক এমএসই অর্থে অনুকূল, তবে প্রতি পর্যবেক্ষণে একটি ভিত্তি ফাংশন প্রয়োজন। সাইমন এমজিসিভিতে যা করেন তা হ'ল সম্পূর্ণ টিপিআরএস ভিত্তিক ভিত্তিতে এবং এটি একটি ইজেন্ডেকম্পোজিশনের বিষয়বস্তু করে স্ট্যান্ডার্ড টিপিআরএসের একটি নিম্ন-স্তরের সংস্করণ তৈরি করে। এটি একটি নতুন ভিত্তি তৈরি করে যেখানে kনতুন স্থানের প্রথম ভিত্তি ফাংশনটি মূল ভিত্তিতে বেশিরভাগ সংকেত ধরে রাখে, তবে অনেকগুলি ভিত্তিক ফাংশনে। এইভাবে এমজিসিভি একটি টিপিআরএস পেতে পরিচালনা করে যা প্রতি পর্যবেক্ষণের পরিবর্তে কেবলমাত্র নির্দিষ্ট সংখ্যক ভিত্তিক কার্যাদি ব্যবহার করে। এই ইজেনডিকম্পোজিশনটি ক্লাসিক টিপিআরএস ভিত্তিক অনুকূলতার অনেকগুলি সংরক্ষণ করে, তবে বড় ডেটা সেটগুলির জন্য যথেষ্ট গণনার প্রচেষ্টায়।

আপনি যদি টিপিআরএসের সেটআপ ব্যয়টি বহন করতে না পারেন তবে কিউবিক রিগ্রেশন স্প্লাইনস (সিআরএস) ব্যবহার করুন

এটি উত্পন্ন করার জন্য একটি দ্রুত ভিত্তি এবং তাই প্রচুর ডেটাযুক্ত সমস্যার সাথে উপযুক্ত। এটি যদিও গিঁট-ভিত্তিক, তাই কিছুটা ক্ষেত্রে ব্যবহারকারীকে এখন সেই নটগুলি কোথায় রাখা উচিত তা চয়ন করতে হবে। বেশিরভাগ সমস্যার জন্য ডিফল্ট নট প্লেসমেন্টের বাইরে যাওয়া (উপাত্তের সীমানায় এবং সমানভাবে ফাঁকে ফাঁকে ফাঁকে ফাঁকে ফাঁকে) পেয়ে কিছুটা অর্জন করা উচিত নয়, তবে আপনার যদি কোভারিয়েটের সীমার উপরে বিশেষ করে অসম নমুনা থাকে তবে আপনি গিঁট রাখতে পছন্দ করতে পারেন উদাহরণস্বরূপ, সমতুল্যভাবে কোভারিয়েটের পরিমাণযুক্ত নমুনা কোয়ান্টাইলগুলি।

মাইক্রোসিভিতে অন্য প্রতিটি মসৃণ বিশেষ, আপনি যেখানে আইসোট্রপিক স্মুড বা দু'একটি কোভারিয়েট চান সেখানে ব্যবহার করা হয় বা স্থানিক মসৃণকরণের জন্য হয়, বা সংকোচন, বা এলোমেলো প্রভাব এবং এলোমেলো স্প্লাইনের প্রয়োগ করে, বা কোভেরিয়েটগুলি চক্রযুক্ত হয়, বা উইগগুইটিটি বিভিন্নভাবে পরিবর্তিত হয় একটি covariate পরিসীমা। আপনি শুধুমাত্র আপনি একটি সমস্যা যে বিশেষ হ্যান্ডলিং প্রয়োজন আছে যদি পর্যন্ত মসৃণ টুলবক্স এই venture করতে হবে।

সঙ্কোচন

উভয় TPRS এর সংকোচন সংস্করণ এবং সিআরএস আছে mgcv । এগুলি এমন একটি স্প্লিন প্রয়োগ করে যেখানে ভিত্তির পুরোপুরি মসৃণ অংশটিও মসৃণতা জরিমানার সাপেক্ষে। এটি মসৃণতা নির্বাচন প্রক্রিয়াটি মূলত শূন্যের বাইরে এমনকি কোনও রৈখিক ক্রিয়াকলাপের বাইরে মসৃণ পিছনে সঙ্কুচিত করতে দেয়। এটি মসৃণতা জরিমানা বৈশিষ্ট্য নির্বাচনও সম্পাদন করতে দেয়।

ডুচন স্প্লাইজ, পি স্প্লাইজ এবং বি স্প্লাইজ

এই স্প্লিংগুলি বিশেষজ্ঞ অ্যাপ্লিকেশনগুলির জন্য উপলব্ধ যেখানে আপনাকে পৃথকভাবে ভিত্তিক আদেশ এবং জরিমানার আদেশ নির্দিষ্ট করতে হবে। ডুচন স্প্লাইপস টিপিআরএসকে সাধারণীকরণ করে। আমি এই ধারণাটি পেয়েছি যে অন্যান্য দণ্ডিত সম্ভাবনা-ভিত্তিক পদ্ধতির সাথে তুলনা করার জন্য পি স্প্লিংগুলি এমজিসিভিতে যুক্ত করা হয়েছিল এবং কারণ তারা 1996 এর কাগজে ইলারস এবং মার্কস দ্বারা ব্যবহৃত স্প্লাইজ যা জ্যামগুলিতে পরবর্তী কাজগুলি অনেক উত্সাহিত করেছিল। পি স্প্লিংস অন্যান্য স্প্লাইনের জন্য বেস হিসাবে দরকারী যেমন আকারের সীমাবদ্ধতাগুলির সাথে স্প্লাইনগুলি এবং অভিযোজিত স্প্লাইনগুলি।

বি স্প্লিংস , এমজিসিভিতে প্রয়োগ করা হিসাবে, স্প্লিংসের জন্য জরিমানা এবং গিঁটগুলি স্থাপনের ক্ষেত্রে প্রচুর নমনীয়তার সুযোগ দেয় যা পর্যবেক্ষণ করা তথ্যের পরিধি ছাড়িয়ে কিছু বাড়তি বহির্ভূতকরণের অনুমতি দিতে পারে।

চক্রাকার স্প্লাইজ

যদি কোনও কোভারিয়েটের মানগুলির ব্যাপ্তিটি এমন একটি বৃত্ত হিসাবে বিবেচনা করা যেতে পারে যেখানে পরিসরের শেষ পয়েন্টগুলি আসলে সমতুল্য হওয়া উচিত (বছরের মাস বা দিন, চলনের কোণ, দিক, বাতাসের দিক), তবে এই প্রতিবন্ধকতা চাপিয়ে দেওয়া যেতে পারে ভিত্তি. আপনার যদি এর মতো সমবায় রয়েছে, তবে এই সীমাবদ্ধতা আরোপ করা এটি বোধগম্য।

অভিযোজক স্মুথার

কোভেরিয়েটের বিভাগগুলিতে পৃথক জিএএম ফিট করার পরিবর্তে অভিযোজিত স্প্লাইসগুলিতে একটি ভারযুক্ত পেনাল্টি ম্যাট্রিক্স ব্যবহার করা হয়, যেখানে কোভারিয়েটের পরিসরের তুলনায় ওজনগুলি স্বাচ্ছন্দ্যে পরিবর্তিত হওয়ার অনুমতি দেওয়া হয়। টিপিআরএস এবং সিআরএস স্প্লাইনের জন্য, উদাহরণস্বরূপ, তারা কোভারিয়েটের সীমানা জুড়ে একই ডিগ্রি মসৃণতা ধরে নেয়। যদি আপনার এমন সম্পর্ক থাকে যেখানে এটি না হয় তবে আপনি স্প্লাইনটি উইগলি এবং অ-উইগলি অংশগুলিতে খাপ খাইয়ে নেওয়ার জন্য প্রত্যাশার চেয়ে আরও বেশি ডিগ্রি স্বাধীনতার ব্যবহার করতে পারেন। স্মুথিং সাহিত্যের একটি সর্বোত্তম উদাহরণ হ'ল

library('ggplot2')
theme_set(theme_bw())
library('mgcv')
data(mcycle, package = 'MASS')
pdata <- with(mcycle,
              data.frame(times = seq(min(times), max(times), length = 500)))

ggplot(mcycle, aes(x = times, y = accel)) + geom_point()

এখানে চিত্র বর্ণনা লিখুন

এই ডেটাগুলি বিভিন্ন স্বাচ্ছন্দ্যের সময়কাল স্পষ্টভাবে প্রদর্শন করে - কার্যকরভাবে সিরিজের প্রথম অংশের জন্য শূন্য, প্রভাবের সময় প্রচুর পরিমাণে, তারপরে হ্রাস পায়।

যদি আমরা এই ডেটাগুলিতে একটি মানক GAM ফিট করি,

m1 <- gam(accel ~ s(times, k = 20), data = mcycle, method = 'REML')

আমরা একটি যুক্তিসঙ্গত ফিট পাই তবে শুরুতে এবং অতিরিক্ত পরিসীমাটির শেষে এবং অতিরিক্ত ব্যবহারের জন্য কিছুটা অতিরিক্ত উইগগলিউটি রয়েছে times~ 14 ডিগ্রি স্বাধীনতার

plot(m1, scheme = 1, residuals = TRUE, pch= 16)

এখানে চিত্র বর্ণনা লিখুন

পরিবর্তিত wেউয়ের সাথে সামঞ্জস্য করার জন্য, একটি অভিযোজিত স্প্লাইনটি ভারী পেনাল্টির ম্যাট্রিক্স ব্যবহার করে কোভারিয়েটের সাথে স্বাচ্ছন্দ্যে ওজনের হয়। এখানে আমি একই ভিত্তি মাত্রা (কে = 20) সহ আসল মডেলটিকে রিফাইট করি তবে এখন আমাদের কাছে m = 5মূলটির 1 এর পরিবর্তে 5 টি স্মুথনেস পরামিতি (ডিফল্ট হয় ) রয়েছে।

m2 <- gam(accel ~ s(times, k = 20, bs = 'ad'), data = mcycle, method = 'REML')

লক্ষ্য করুন যে এই মডেলটি স্বাধীনতার অনেক কম ডিগ্রী (~ 8) ব্যবহার করে এবং লাগানো মসৃণটি প্রান্তে খুব কম উইগলি থাকে, যদিও এখনও প্রভাবের সময় মাথার ত্বরণের বড় পরিবর্তনগুলি পর্যাপ্ত পরিমাণে ফিট করতে সক্ষম হয়।

এখানে চিত্র বর্ণনা লিখুন

আসলে এখানে যা চলছে তা হ'ল স্প্লাইনটির মসৃণতার জন্য একটি ভিত্তি এবং জরিমানার জন্য একটি ভিত্তি রয়েছে (ওজনকে কোভেরিয়েটের সাথে স্বচ্ছভাবে আলাদা করতে দেওয়া) allow ডিফল্ট উভয় এগুলোর দ্বারা পি splines, কিন্তু আপনি খুব সিআরএস ভিত্তিতে ধরনের ব্যবহার করতে পারেন ( bsশুধুমাত্র এক হতে পারে 'ps', 'cr', 'cc', 'cs'।)

এখানে চিত্রিত হিসাবে, অভিযোজিত হতে হবে না বাছাই বাছাই করা সমস্যার উপর নির্ভর করে; যদি আপনার এমন কোনও সম্পর্ক থাকে যার জন্য আপনি ধরে নিয়েছেন যে কার্যকরী ফর্মটি মসৃণ, তবে মসৃণতার ডিগ্রি সম্পর্কের মধ্যে কোভারিয়েটের সীমার চেয়ে পৃথক হয় তবে একটি অভিযোজিত স্প্লাইনটি বোঝাতে পারে। যদি আপনার সিরিজের দ্রুত পরিবর্তন হয় এবং পিরিয়ড কম বা আরও ধীরে ধীরে পরিবর্তিত হয় তবে এটি ইঙ্গিত দিতে পারে যে একটি অভিযোজিত মসৃণ প্রয়োজন হতে পারে।


1
ধন্যবাদ গ্যাভিন! এটি সত্যিই একটি দুর্দান্ত উত্তর যা আমি মনে করি অন্যদেরকেও একই উদ্বেগের সাথে সহায়তা করবে।
compbiostats

আমার সমস্যার জন্য, আমি এমন একঘেয়েমি বর্ধনকারী বক্ররেখা ফিট করি যা শেষ পর্যন্ত প্লেটাসকে একটি অনুভূমিক অ্যাসিপোটোটে পরিণত করে। আমার বক্ররেখার শুরুতে, শেষ পর্যন্ত অ্যাসিপোটোটের দিকে ধীর হওয়ার আগে ডেটাগুলি বেশ দ্রুত বৃদ্ধি পায়। কিছু ক্ষেত্রে, পর্যবেক্ষণ করা তথ্যের পরিসীমা ছাড়িয়ে এক্সট্রাপোলেশন (নিকট / দূরে) প্রয়োজনীয়। আমার মডেলগুলি খুব সহজ, তবে আমি বুঝতে পারি যে এখানে ভবিষ্যদ্বাণীগুলি সর্বোত্তমভাবে অনুমানযোগ্য।
কম্পবিস্ট্যাটস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.