সীমাবদ্ধ কিউবিক স্প্লিন এবং দণ্ডিত স্প্লিনগুলি কতটা আলাদা?


11

বিভিন্ন রিগ্রেশন সমস্যায় স্প্লাইজ ব্যবহার করার বিষয়ে আমি প্রচুর পড়ছি। কিছু বই (যেমন হজস রিচলি প্যারামিটারাইজাইজড লিনিয়ার মডেল ) দন্ডিত স্প্লাইনের প্রস্তাব দেয়। অন্যান্য (যেমন হ্যারেল রিগ্রেশন মডেলিং কৌশলগুলি ) সীমাবদ্ধ ঘন স্প্লাইসগুলির পক্ষে নির্বাচন করে।

বাস্তবে এগুলি কতটা আলাদা? আপনি প্রায়শই একটি বা অন্য ব্যবহার থেকে যথেষ্ট আলাদা ফলাফল পাবেন? এক বা অন্যের কি বিশেষ সুবিধা রয়েছে?

উত্তর:


9

আমার পড়া থেকে, আপনি যে দুটি ধারণাগুলি তুলনা করতে আমাদের বলছেন তা বেশ আলাদা জন্তু এবং এর জন্য একটি আপেল এবং কমলা জাতীয় তুলনা প্রয়োজন। এটি আপনার অনেকগুলি প্রশ্নকে কিছুটা মোটা করে তোলে - আদর্শভাবে (অনুমান করে যে কোনও একটি প্রয়োজনীয় আকারে আরসিএস ভিত্তিতে একটি উইগগ্যালিটি পেনাল্টি লিখতে পারে) আপনি একটি দন্ডিত সীমাবদ্ধ কিউবিক রিগ্রেশন মডেল ব্যবহার করবেন model

সীমাবদ্ধ কিউবিক স্প্লিন্স

একটি সীমাবদ্ধ কিউবিক স্প্লাইন (বা প্রাকৃতিক স্প্লাইন) হ'ল একটি স্প্লাইন ভিত্তি যা টুকরোজ ঘন বহুভুজ ফাংশনগুলি থেকে কিছু প্রাক-নির্দিষ্ট স্থানে বা নটগুলিতে সহজেই যোগদান করে from কিউবিক স্প্লাইন থেকে একটি সীমাবদ্ধ কিউবিক স্প্লিনের পার্থক্যটি হ'ল সীমাবদ্ধ সংস্করণে অতিরিক্ত বাধা আরোপ করা হয় যেমন স্প্লাইনটি প্রথম গিটার আগে এবং শেষ গিঁটের পরে লিনিয়ার হয়। এর লেজগুলিতে স্প্লাইনটির কার্যকারিতা উন্নত করতে এটি করা হয় ।এক্স

কোনও আরসিএসের সাথে মডেল নির্বাচন সাধারণত গিঁটের সংখ্যা এবং তাদের অবস্থান নির্বাচন করা জড়িত থাকে, প্রাক্তন পরিচালনা করার ফলে ফলাফলটি স্প্লাইনটি কতটা তীব্র বা জটিল। মডেল ফিট করার সময় আনুমানিক সহগকে নিয়মিত করার জন্য যদি আরও কিছু পদক্ষেপ না থাকে তবে নটগুলির সংখ্যা সরাসরি স্প্লাইন জটিলতা নিয়ন্ত্রণ করে।

এর অর্থ হ'ল এক বা একাধিক আরসিএস শর্তাদি সম্বলিত কোনও মডেল নির্ধারণ করার সময় ব্যবহারকারীর কিছুটা সমস্যা কাটিয়ে উঠতে হবে:

  1. কত গিঁট ব্যবহার করতে হবে ?,
  2. ফাঁকে এই নটগুলি কোথায় রাখবেন ?,এক্স
  3. নট বিভিন্ন নম্বর সঙ্গে মডেল তুলনা কিভাবে?

তাদের নিজস্বভাবে, আরসিএস শর্তাদি এই সমস্যাগুলি সমাধান করার জন্য ব্যবহারকারীর হস্তক্ষেপ প্রয়োজন।

দণ্ডিত স্প্লাইস

শাস্তি রিগ্রেশন splines (sensu Hodges) তাদের নিজস্ব ইস্যু সাজসরঁজাম 3. শুধুমাত্র, কিন্তু তারা সমস্যার জন্য অনুমতি দেয় 1. circumvented হবে। এখানে ধারণাটি হ'ল ভিত্তি সম্প্রসারণ এবং এখনের জন্য ধরে নেওয়া যাক এটি কিউবিক স্প্লাইনের ভিত্তি, আপনি একটি উইগগিউলিটি পেনাল্টি ম্যাট্রিক্সও তৈরি করেন। উইগগোলিটি অনুমিত স্প্লিনের কিছু ডেরাইভেটিভ ব্যবহার করে পরিমাপ করা হয়, সাধারণ ডেরাইভেটিভ ব্যবহৃত হয় দ্বিতীয় ডেরাইভেটিভ, এবং পেনাল্টি নিজেই এর পরিসীমা জুড়ে স্কোয়ার্ড দ্বিতীয় ডেরিভেটিভকে উপস্থাপন করে । এই জরিমানা হিসাবে চতুর্ভুজ আকারে লেখা যেতে পারেএক্সএক্স

βটিএসβ

যেখানে a একটি পেনাল্টি ম্যাট্রিক্স এবং the মডেল সহগ। তারপরে সহগের মানগুলি শাস্তিযুক্ত লগ-সম্ভাবনা ম্যাথক্যাল _ পি সার্টিওশন সর্বাধিক করতে পাওয়া যায়এসβএলপি

এলপি=এল-λβটিএসβ

যেখানে the মডেলটির লগ-সম্ভাবনা এবং হ'ল মসৃণতা পরামিতি, যা স্প্লিনের উইগগুইলিটিটিকে কতটা দৃize়তরভাবে দণ্ডিত করতে পারে তা নিয়ন্ত্রণ করে।এলλ

যেহেতু দণ্ডিত লগ-সম্ভাবনাটি মডেল সহগের দিক দিয়ে মূল্যায়ন করা যায়, এই মডেলটি কার্যকরভাবে ফিটিং করা that জন্য অনুসন্ধানের সময় আপডেট করার সময় জন্য একটি অনুকূল মান সন্ধান করতে সমস্যা হয়ে ।λλ

λ ক্রস বৈধতা, সাধারণ ক্রস বৈধতা (GCV), অথবা প্রান্তিক সম্ভাবনা অথবা সীমিত প্রান্তিক সম্ভাবনা বিচার্য বিষয় ব্যবহার করে নির্বাচন করা যেতে পারে। পরের দুটি কার্যকরভাবে মিশ্র প্রভাবগুলির মডেল হিসাবে স্প্লাইন মডেলটিকে পুনঃস্থাপন করুন (ভিত্তির পুরোপুরি মসৃণ অংশগুলি স্থির প্রভাব হিসাবে পরিণত হয় এবং ভিত্তির বিচূর্ণ অংশগুলি এলোমেলো প্রভাব হয়, এবং মসৃণতা পরামিতি এলোমেলোভাবে এলোমেলো প্রভাবগুলির জন্য বৈকল্পিক শব্দটির সাথে সম্পর্কিত হয়) ) যা হজস তাঁর বইয়ে বিবেচনা করছেন।

এটি কেন কয়টি গিঁট ব্যবহার করবেন তা সমস্যার সমাধান করে? ঠিক আছে, এটি কেবল এক ধরণের করে। এটি প্রতিটি অনন্য ডেটা পয়েন্টে (একটি স্মুথিং স্প্লাইন) কোনও গিঁটের প্রয়োজন না হওয়ার সমস্যাটি সমাধান করে, তবে আপনাকে এখনও কতগুলি নট বা ভিত্তিক ফাংশন ব্যবহার করতে হবে তা চয়ন করতে হবে। তবে, কারণ জরিমানাটি সহগের সংক্ষিপ্তসারকে সঙ্কুচিত করে কারণ আপনি মনে করেন যে সঠিক ফাংশন বা এর নিকটবর্তীকরণের প্রয়োজন রয়েছে এবং তারপরে আপনি জরিমানাটি নিয়ন্ত্রণ করতে দেন যে কীভাবে চূড়ান্তভাবে অনুমান করা যায়? এটি হল অতিরিক্ত সম্ভাব্য উইগগুয়েলিটি ভিত্তিতে উপলব্ধ পেনাল্টি দ্বারা মুছে ফেলা বা নিয়ন্ত্রণ করা।

তুলনা

পেনালাইজড (রিগ্রেশন) স্প্লাইনস এবং আরসিএস হ'ল ভিন্ন ধারণা। চতুর্ভুজ আকারে আপনাকে একটি আরসিএস ভিত্তি এবং সম্পর্কিত জরিমানা তৈরি করা এবং তারপরে শাস্তিযুক্ত রেজিস্ট্রেশন স্প্লাইন মডেল থেকে ধারণাগুলি ব্যবহার করে স্প্লাইন সহগের অনুমানের কিছু নেই।

আরসিএস হ'ল এক ধরণের ভিত্তি যা আপনি একটি স্প্লাইন ভিত্তি তৈরি করতে ব্যবহার করতে পারেন, এবং শাস্তিযুক্ত রিগ্রেশন স্প্লিনগুলি সম্পর্কিত উইগগ্যুইলিটি পেনাল্টির সাথে এক বা একাধিক স্প্লাইনযুক্ত মডেলটি অনুমান করার এক উপায়।

আমরা কি ১, ২, এবং ৩ টি সমস্যা এড়াতে পারি?

হ্যাঁ, কিছুটা পাতলা প্লেট স্প্লাইন (টিপিএস) ভিত্তিতে। একটি টিপিএস ভিত্তিতে অনন্য ডেটা মানগুলির মতো অনেক ভিত্তি ফাংশন রয়েছে । উড (2003) যা দেখিয়েছিল তা হ'ল আপনি একটি পাতলা প্লেট রিগ্রেশন স্প্লাইন তৈরি করতে পারেন (টিপিআরএস) ভিত্তিতে টিপিএস ভিত্তিক ফাংশনগুলির একটি আইজেন্ডেকম্পোজেশন ব্যবহার করা হয়েছে, এবং কেবল প্রথম সবচেয়ে বড় কথাটি ধরে রেখেছেন । আপনাকে এখনও নির্দিষ্ট করতে হবেএক্স, আপনি ব্যবহার করতে চান এমন বেসিক ফাংশনগুলির সংখ্যা, তবে পছন্দটি সাধারণত ফিটযুক্ত ফাংশনটি আপনি কীভাবে প্রত্যাশা করে এবং আপনি কতটা গণনামূলক আঘাত নিতে ইচ্ছুক তার উপর ভিত্তি করে। গিঁটের জায়গাগুলি নির্দিষ্ট করার দরকার নেই, এবং পেনাল্টিটি সহগকে সংকুচিত করে তোলে যাতে মডেল নির্বাচনের সমস্যাটি এড়ানো যায় কারণ আপনার কাছে কেবল একটি পেনালাইযুক্ত মডেল রয়েছে যার সাথে নটের বিবিধ সংখ্যার অনেকগুলি আনপেনালাইজড নেই।

পি-splines

কেবল জিনিসগুলিকে আরও জটিল করার জন্য, এক ধরণের স্প্লাইন ভিত্তি রয়েছে যা পি-স্প্লাইন (আইলারস এবং মার্কস, 1996) নামে পরিচিত, যেখানে প্রায়শই "দণ্ডিত" হিসাবে ব্যাখ্যা হয়। পি-স্প্লাইনগুলি একটি বি-স্প্লিন ভিত্তি যা একটি মডেল সহগের সাথে সরাসরি প্রয়োগ করা হয় difference সাধারণ ব্যবহারে পি-স্প্লাইন জরিমানা সংলগ্ন মডেল সহগের মধ্যে বর্গক্ষেত্রের পার্থক্যকে দন্ড দেয়, যার ফলে ঘৃণ্যতা দন্ডিত হয়। পি-স্প্লাইনগুলি সেট আপ করা খুব সহজ এবং একটি বিরাট পেনাল্টি ম্যাট্রিক্সের ফলস্বরূপ যা তাদের এমসিসিএম ভিত্তিক বায়েশিয়ান মডেলগুলিতে (কাঠ, 2017) স্প্লাইন শর্তগুলির অনুমানের জন্য খুব সাবলীল করে তোলে।পি

তথ্যসূত্র

ইয়েলারস, পিএইচসি, এবং বিডি মার্কস। 1996. -স্প্লাইনেস এবং পেনাল্টি সহ নমনীয় স্মুথিং। তাত্ক্ষণিকবাজার। সী।

কাঠ, এসএন 2003. পাতলা প্লেট রিগ্রেশন স্প্লাইস। জেআর স্ট্যাটাস। SOC। সিরিজ বি স্ট্যাটাস। Methodol। 65: 95–114। ডোই: 10.1111 / 1467-9868.00374

কাঠ, এসএন 2017. সাধারণীকৃত অ্যাডেটিভ মডেলগুলি: আর, দ্বিতীয় সংস্করণ, সিআরসি প্রেসের সাথে একটি পরিচিতি।


4
+6, দুর্দান্ত চিকিত্সা। আমি যদি ভুলে যাই তবে কয়েকদিনের মধ্যে আমাকে স্মরণ করিয়ে দিন এবং আমি এটিতে অনুগ্রহ করে দেব।
গুং - মনিকা পুনরায়

1
এর জন্য ধন্যবাদ!
পিটার Flom

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.