কিভাবে এমজিসিভি জিএএম মডেলটিতে স্মুথিং টিউন করবেন


14

আমি কোনও এমজিসিভি: গাম মডেলটিতে স্মুথিং পরামিতিগুলি কীভাবে নিয়ন্ত্রণ করতে পারি তা জানার চেষ্টা করছি।

আমার একটি দ্বিপদী ভেরিয়েবল রয়েছে যা আমি প্রাথমিকভাবে একটি নির্দিষ্ট গ্রিডে এক্স এবং y স্থানাঙ্কের ফাংশন হিসাবে আরও কিছু ক্ষুদ্র প্রভাব সহ আরও কিছু ভেরিয়েবল মডেল করার চেষ্টা করছি। অতীতে আমি প্যাকেজ লোকফিট এবং কেবলমাত্র (x, y) মানগুলি ব্যবহার করে যুক্তিসঙ্গতভাবে ভাল স্থানীয় রিগ্রেশন মডেল তৈরি করেছি।

তবে, আমি অন্যান্য ভেরিয়েবলগুলিকে মডেলটিতে অন্তর্ভুক্ত করার চেষ্টা করতে চাই, এবং এটি সাধারণীকরণযোগ্য অ্যাডিটিভ মডেলগুলির (জিএএম) মতো দেখতে ভাল সম্ভাবনা ছিল। প্যাকেজগুলি গ্যাম এবং এমজিসিভিতে দেখার পরে, উভয়টিরই জিএএম ফাংশন রয়েছে, আমি মেলিং তালিকার থ্রেডে বেশ কয়েকটি মন্তব্য এটির প্রস্তাবনা বলে মনে হচ্ছে বলে আমি পরবর্তীকালের জন্য নির্বাচন করেছি। একটি খারাপ দিক এটি লোস বা লোকফিটের মতো মসৃণ স্থানীয় রিগ্রেশনকে সমর্থন করে বলে মনে হচ্ছে না।

শুরু করার জন্য, আমি কেবলমাত্র (x, y) স্থানাঙ্কগুলি ব্যবহার করে প্রায় আনুমানিক লোকফিট মডেলের প্রতিলিপি তৈরির চেষ্টা করতে চেয়েছিলাম। আমি নিয়মিত এবং টেনসর উভয় পণ্য স্মুথ দিয়ে চেষ্টা করেছি:

my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1)

my.gam.s  <- gam(z ~  s(x, y), family=binomial(logit), data=my.data, scale = -1)

যাইহোক, মডেল থেকে ভবিষ্যদ্বাণীগুলি চক্রান্ত করে, তারা লোকফিট মডেলের তুলনায় অনেক বেশি মসৃণ হয়। সুতরাং আমি মডেল টিউন করার চেষ্টা করেছি যতটা না বেশি mo আমি এসপি এবং কে প্যারামিটারগুলি সামঞ্জস্য করার চেষ্টা করেছি, তবে তারা কীভাবে স্মুথিংয়ে প্রভাব ফেলবে তা আমার কাছে স্পষ্ট নয়। লোকফিটে, এনএন প্যারামিটারটি ব্যবহৃত পাড়ার স্প্যান নিয়ন্ত্রণ করে, ছোট মানগুলি কম স্বাচ্ছন্দ্য এবং আরও "উইগলিং" দেয়, যা গ্রিডের কিছু অঞ্চল ক্যাপচার করতে সহায়তা করে যেখানে দ্বিপদী ফলাফলের সম্ভাবনা দ্রুত পরিবর্তন হয়। আমি গ্যাম মডেলটি কীভাবে এটির মতো আচরণ করতে সক্ষম করতে সেট আপ করব?

উত্তর:


23

kযুক্তি কার্যকরভাবে প্রতিটি শব্দ জন্য মসৃণকরণ ম্যাট্রিক্স মাত্রা স্থাপন করে। gam()সর্বোত্তম পরিমাণে মসৃণতা নির্বাচন করতে একটি সিসিভি বা ইউবিআর স্কোর ব্যবহার করছে তবে এটি কেবল স্মুথিং ম্যাট্রিক্সের মাত্রিকতার মধ্যেই কাজ করতে পারে। ডিফল্টরূপে, te()মসৃণগুলিতে k = 5^22 ডি পৃষ্ঠের জন্য থাকে। আমি ভুলে গেছি এটি কী জন্য s()তাই ডকুমেন্টগুলি পরীক্ষা করুন। এমজিসিভি-র লেখক সাইমন উডের বর্তমান পরামর্শটি হ'ল মডেল দ্বারা নির্বাচিত মসৃণতার ডিগ্রি যদি ব্যবহৃত মান দ্বারা আরোপিত মাত্রিকতার সীমাটির কাছাকাছি বা কাছাকাছি থাকে তবে আপনার মডেলটি kবাড়িয়ে তুলতে হবে kএবং এটি পরীক্ষা করতে হবে কিনা উচ্চতর মাত্রিক স্মুথিং ম্যাট্রিক্স থেকে আরও জটিল মডেল নির্বাচন করা হয়েছে।

তবে আমি জানি না কীভাবে লোকিট কীভাবে কাজ করে তবে আপনার কোনও কিছু খুব জটিল একটি পৃষ্ঠকে (জিসিভি এবং ইউবিআরই, বা (আরই) এমএল ফিটিং করা থেকে বিরত রাখতে হবে তবে আপনি যদি সেগুলি ব্যবহার করতে চান তবে [আপনি যেমন আপনার মতো করতে পারবেন না) সেট scale = -1], কেবল এটি করার চেষ্টা করছে), যা ডেটা দ্বারা সমর্থনযোগ্য নয়। অন্য কথায়, আপনি ডেটার খুব স্থানীয় বৈশিষ্ট্য মাপসই করতে পারেন তবে আপনি যে তথ্য সংগ্রহ করেছেন তার নমুনায় শব্দটি ফিট করছেন বা সম্ভাবনা বন্টনের গড়টি ফিট করছেন? gam() পারে কি আপনি সম্পর্কে কিছু কহন করা করতে পারেন আপনার ডেটা থেকে অনুমান করা অভিমানী যে আপনি খুঁজে ভিত্তি মাত্রা (উপরে) সাজানো গেছেন।

আরেকটি বিষয় লক্ষ্যণীয় হ'ল আপনি বর্তমানে যে স্মুথারগুলি ব্যবহার করছেন তা বিশ্বব্যাপী এই অর্থে যে নির্বাচিত মসৃণতা মসৃণটির পুরো ব্যাপ্তির উপরে প্রয়োগ করা হয়। অভিযোজিত স্মুথাররা সাড়া দ্রুত পরিবর্তন করছে এমন তথ্যের অংশগুলিতে বরাদ্দ করা মসৃণতা "ভাতা" ব্যয় করতে পারে। gam()অভিযোজক স্মুথার ব্যবহারের জন্য ক্ষমতা রয়েছে।

কী ব্যবহার করে লাগানো যায় তা দেখুন ?smooth.termsএবং দেখুন । এই সমস্ত স্মুথারগুলির মধ্যে না হলে সবচেয়ে বেশিকে একত্রিত করা যায় (যেসব দস্তাবেজগুলি টেনসারের পণ্যগুলিতে অন্তর্ভুক্ত করা যায় এবং করা যায় না) তা পরীক্ষা করে নিন যাতে আপনি তথ্যের অংশগুলিতে সূক্ষ্ম স্থানীয় স্কেল ক্যাপচার করার চেষ্টা করতে একটি অভিযোজিত স্মুথ ভিত্তি ব্যবহার করতে পারেন প্রতিক্রিয়া দ্রুত বিভিন্ন হয়।?adaptive.smoothgam()te()

আমার যুক্ত হওয়া উচিত, fx = TRUEআপনি s()এবং যুক্তিটি ব্যবহার করে একটি মসৃণ পদ দ্বারা ব্যবহৃত স্বাধীনতার একটি নির্দিষ্ট সেট সহ একটি মডেল অনুমান করতে পারেন te()। মূলত, কে আপনি কী চান সেট করতে সেট করুন fx = TRUEএবং gam()এটি কেবল কোনও দণ্ডিত রিগ্রেশন স্প্লাইনের পরিবর্তে স্বাধীনতার নির্দিষ্ট ডিগ্রির একটি রিগ্রেশন স্প্লাইনে ফিট করবে।


গ্যাভিন, এই জাতীয় একটি উত্তরের জন্য আপনাকে অনেক ধন্যবাদ। আমি অভিযোজিত স্মুথারকে পুরোপুরি মিস করেছি এবং তাদের চেষ্টা করব। আমি ওভারফিটিংয়ের বিষয়ে উদ্বেগটি বুঝতে পারি, তবে আমি এখন পর্যন্ত গ্যামটি দিয়ে যা করছি তা ডোমেন দক্ষতার মাধ্যমে সেখানে থাকা ডেটাগুলিতে এমন কোনও বৈশিষ্ট্য প্রদর্শন করছে না।
কর্নেল ট্রিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.