বি-স্প্লিংস ভিএস হাই অর্ডার পলিনোমিয়ালিয়ায় রিগ্রেশন


10

আমার মনে একটি নির্দিষ্ট উদাহরণ বা কাজ নেই। আমি বি-স্প্লাইনগুলি ব্যবহারের ক্ষেত্রে কেবল নতুন এবং আমি রিগ্রেশন প্রসঙ্গে এই ফাংশনটির আরও ভাল ধারণা পেতে চাই।

ধরা যাক আমরা প্রতিক্রিয়ার ভেরিয়েবল এবং কিছু ভবিষ্যদ্বাণী মধ্যে সম্পর্কটি মূল্যায়ন করতে চাই । ভবিষ্যদ্বাণীকারীদের মধ্যে কয়েকটি সংখ্যাসূচক ভেরিয়েবলের পাশাপাশি কিছু শ্রেণীবদ্ধগুলি অন্তর্ভুক্ত থাকে।yx1,x2,...,xp

ধরা যাক যে একটি রিগ্রেশন মডেল ফিট করার পরে, একটি সংখ্যার ভেরিয়েবল যেমন উল্লেখযোগ্য। এর পরে একটি যৌক্তিক পদক্ষেপ হ'ল উচ্চতর অর্ডার বহুত্বগুলি যেমন: এবং প্রয়োজনীয়তা অত্যধিক ফিটনেস ছাড়াই পর্যাপ্তভাবে ব্যাখ্যা করার জন্য প্রয়োজন কিনা তা নির্ধারণ করা ।x1x12x13

আমার প্রশ্নগুলি হ'ল:

  1. আপনি কোন পর্যায়ে বি-স্প্লিংস বা সাধারণ উচ্চতর অর্ডার বহুত্বের মধ্যে বেছে নিয়েছেন। যেমন আর তে:

    y ~ poly(x1,3) + x2 + x3
    

    বনাম

     y ~ bs(x1,3) + x2 + x3
    
  2. প্লটগুলি কীভাবে আপনি এই দুটিয়ের মধ্যে আপনার পছন্দটি জানাতে পারেন এবং যদি প্লটগুলি থেকে সত্যটা পরিষ্কার না হয় তবে কী ঘটে (যেমন: বিশাল পরিমাণে ডেটা পয়েন্টের কারণে)

  3. আপনি কীভাবে মধ্যে দ্বিমুখী ইন্টারঅ্যাকশন শর্তাদি মূল্যায়ন করবেন এবং বলিx2x3

  4. উপরোক্ত বিভিন্ন মডেলের জন্য কীভাবে পরিবর্তন করবেন change

  5. আপনি কি কখনও উচ্চ অর্ডার বহুপদী ব্যবহার এবং সর্বদা ফি-বি-স্প্লিন্ট ব্যবহার এবং উচ্চ নমনীয়তাটিকে দণ্ডিত করার কথা বিবেচনা করবেন না?


9
আমি এখানে এ সম্পর্কে ব্যাপকভাবে লিখেছি: madrury.github.io/jekyll/update/statistics/2017/08/04/…
ম্যাথিউ ড্রিউরি

কতটা উন্নত হয়েছে mgcvতা দেওয়া, কেন (জেনারালাইজড) অ্যাডিটিভ মডেলগুলি ব্যবহার করবেন না। মসৃণতা নির্বাচন স্বয়ংক্রিয়, এবং অনুমানমূলক পদ্ধতিগুলি ভালভাবে বিকাশিত।
জেনেরিক_উজার

উত্তর:


17

আমি সাধারণত বহুবর্ষের চেয়ে স্প্লাইজ বিবেচনা করি। পলিনোমিয়ালগুলি থ্রেশহোল্ডগুলি মডেল করতে পারে না এবং প্রায়শই অনস্বীকার্যভাবে বৈশ্বিক হয়, অর্থাত্ ভবিষ্যদ্বাণীকের একদিকের পর্যবেক্ষণগুলিতে মডেলটি বিভিন্ন পরিসরে কী করে তার উপর দৃ influence় প্রভাব ফেলে ( ম্যাজি, 1998, আমেরিকান স্ট্যাটিস্টিশিয়ান এবং ফ্র্যাঙ্ক হ্যারেলের রেগ্রেশন মডেলিং কৌশল )। এবং অবশ্যই সীমিত স্প্লাইজগুলি যা অতিরিক্ত গিঁটের বাইরে লিনিয়ার থাকে তা এক্সট্রা পোলিশনের জন্য আরও ভাল, এমনকি ভবিষ্যদ্বাণীকারীদের চূড়ান্ত মানগুলিতে ইন্ট্রোপোলেশনও।

আপনার বহু মডেলগুলি বিবেচনা করতে পারে এমন একটি ক্ষেত্রে যখন আপনার মডেলটিকে ননটেকনিক্যাল শ্রোতার কাছে ব্যাখ্যা করা গুরুত্বপূর্ণ is লোকেরা স্প্লাইনের চেয়ে বহুভুজকে আরও ভাল করে বোঝে। (সম্পাদনা করুন: ম্যাথিউ ড্রিউরি উল্লেখ করেছেন যে লোকেরা কেবল ভাবতে পারে যে তারা স্প্লাইনের চেয়ে বহুবচনগুলি আরও ভাল বোঝে I আমি এই প্রশ্নের পক্ষ নেব না))

আনলাইনারিটি নিয়ে কাজ করার বিভিন্ন উপায়ের মধ্যে সিদ্ধান্ত নেওয়ার জন্য প্লটগুলি প্রায়শই খুব কার্যকর হয় না। ক্রস-বৈধকরণ করা আরও ভাল। এটি আপনাকে মিথস্ক্রিয়াগুলি মূল্যায়ন করতে বা একটি ভাল শাস্তি পেতেও সহায়তা করবে।

পরিশেষে, আমার উত্তরটি ধরণের মডেলের সাথে পরিবর্তিত হয় না, কারণ উপরের পয়েন্টগুলি কোনও পরিসংখ্যান বা এমএল মডেলের জন্য বৈধ।


আপনার উত্তরের জন্য অনেক ধন্যবাদ, এটি খুব সহায়ক ছিল। কেবলমাত্র একটি দ্রুত ফলো-আপ প্রশ্ন। গিঁটগুলি খুঁজে পাওয়ার কোনও "স্টেট অফ দ্য আর্ট" আছে? আমার সেরা অনুমানটি হ'ল 1) স্বজ্ঞাততা ব্যবহার করুন উদাহরণস্বরূপ: যদি চলকগুলি মাসের নিরিখে সময় উপস্থাপন করে তবে প্রতি 6 বা 12 নট ব্যবহার করবেন? 2) এমন একটি ক্রম প্রবর্তন করুন যা চলকের পরিসীমাটির মধ্য দিয়ে যায় এবং সর্বোত্তম নটগুলি খুঁজে পেতে ক্রস-বৈধতা ব্যবহার করে?
ভ্যাসিলিস ভ্যাসিলিও

8
লোকেরা মনে করে যে তারা স্প্লাইংয়ের চেয়ে বহুবচনগুলি আরও ভাল বোঝে।
ম্যাথু ড্রুরি

3
গিঁটের স্থান নির্ধারণ সম্পর্কে: ক্রস-বৈধকরণ একটি পদ্ধতির, তবে সত্যি কথা বলতে, আমি মনে করি যে ফলাফলগুলি স্থান নির্ধারণ সম্পর্কে যথেষ্ট সংবেদনশীল হবে, যতক্ষণ না নটগুলি যুক্তিসঙ্গতভাবে স্থাপন করা হয় এবং খুব বেশি একসাথে ক্লাস্টার না করা হয়। ফ্র্যাঙ্ক হ্যারেলের রিগ্রেশন মডেলিং কৌশলগুলিতে ভবিষ্যদ্বাণীকারীর বিতরণের পরিমাণের অংশ হিসাবে হিউরিস্টিক নট প্লেসমেন্ট সহ একটি টেবিল রয়েছে ।
স্টিফান কোলাছা

1
যদিও আপনার উত্তরটি এই প্রসঙ্গে সম্পূর্ণ বৈধ, আপনার বক্তব্যটি খুব দৃ is় বিবেচনা করে বিবেচনা করে যে অনেকগুলি রিয়েল-ওয়ার্ল্ড প্রক্রিয়া বহুবচন দ্বারা আরও ভাল মডেল করা যায়।
কোওলো

6

"স্ট্যাটিস্টিকাল লার্নিং এর উপাদানসমূহ" এর 7.4.5 বিভাগে, বলা হয়েছে যে স্প্লাইজগুলি প্রায়শই বহুবর্ষীয় রিগ্রেশনের চেয়ে উচ্চতর ফলাফল দেয় কারণ:

  • এটি নমনীয় ফিট উত্পাদন করে;
  • আরও স্থিতিশীল অনুমান উত্পাদন করে;
  • পলিনোমিয়ালস সীমানায় অবাঞ্ছিত ফলাফল আনতে পারে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.