আর-তে দুটি গ্ল্যাম মডেল একত্রিত করার কী সহজ উপায় আছে?


9

আমার কাছে তৈরি দুটিতে লজিস্টিক রিগ্রেশন মডেল রয়েছে glm()। তারা উভয়ই একই ভেরিয়েবল ব্যবহার করে তবে ম্যাট্রিক্সের বিভিন্ন সাবসেট ব্যবহার করে তৈরি করা হয়েছিল। কোন গড় মডেল যা সহগের অর্থ দেয় এবং তারপরে পূর্বাভাস () ফাংশনটি দিয়ে এটি ব্যবহার করার কোনও সহজ উপায় আছে?

[দুঃখিত যদি এই ধরণের প্রশ্ন কোনও প্রোগ্রামিং সাইটে পোস্ট করা উচিত তবে আমাকে জানতে দিন এবং আমি এটি সেখানে পোস্ট করব]

ধন্যবাদ


1
সম্পর্কিত থ্রেডে আপনি কিছু দরকারী তথ্য খুঁজে পেতে পারেন stats.stackexchange.com/q/8502/919 এ
whuber

আর-তে, caretপ্যাকেজটিতে মডেলগুলির সংমিশ্রনের জন্য কিছু দুর্দান্ত বৈশিষ্ট্য রয়েছে।
স্কিচওল

উত্তর:


2

আপনি কি ভবিষ্যদ্বাণী করা সম্ভাবনার গড়, বা সহগের গড় নিতে চান? তারা বিভিন্ন ফলাফল দেবে, কারণ একটি লজিস্টিক রিগ্রেশন লিনিয়ার প্রেডিক্টরের একটি অলৈখিক রূপান্তর জড়িত।

হয় একটি ফাংশন হয় কিছু হতে পারে। সেট avgথেকে "prob"সাবেক পেতে বা পরেরটির জন্য অন্য কিছু।

pred_comb <- function(mod1, mod2, dat, avg="prob", ...)
{
    xb1 <- predict(mod1, dat, type="link", ...)
    xb2 <- predict(mod2, dat, type="link", ...)
    if(avg == "prob")
        (plogis(xb1) + plogis(xb2))/2
    else plogis((xb1 + xb2)/2)
}

@ হং ওউই: ধন্যবাদ! এই কোডটি সত্যই দরকারী, এবং কৌশলটি করবে, তবে আমি মূলত যে ফাংশনটির জন্য লক্ষ্য রেখেছিলাম সেটি ছিল একটি নতুন আর মডেল যা আমি তারপরে ওয়ার্কফ্লোতে পূর্বাভাস () রেখেছিলাম। তবে আমি মনে করি আপনার ফাংশনটি বেশ মার্জিত এবং আপনি সম্ভাব্যতা দেওয়ার জন্য এটি সেট করতে পারেন set
অ্যান্ড্রু

@ অ্যান্ড্রু আপনি এর জন্য আর এর অবজেক্ট-ভিত্তিক প্রোগ্রামিংয়ের সুবিধা নিতে পারেন। আপনার দুটি মডেলকে একটি তালিকায় রাখুন এবং এটিকে একটি ক্লাস দিন, বলুন glm_2। উপরের ফাংশনটি কল করুন predict.glm_2এবং তারপরে আপনি predict()প্রয়োজনীয় হিসাবে আপনার অবজেক্টে ব্যবহার করতে পারেন ।
হংক ওওই

2
গুণাগুলির গড় গড় কেন উপযুক্ত? যদি দুটি ডেটাসেটের আকার ভিন্ন হয় তবে অবশ্যই কমপক্ষে কিছুটা ওজন গড়ে গড়ে নেওয়া উচিত।
whuber

@ হংক - ধন্যবাদ, আমি এটি চেষ্টা করে দেখব। @ শুভ - এটি নির্দেশ করার জন্য ধন্যবাদ। যদি আমার দুটি ডেটাসেটগুলি একই আকারের হয় তবে কোনও সমস্যাটিকে ওজন করা হচ্ছে (আমি এটি সম্পর্কে আগে ভাবিনি)। যদি সেগুলি আলাদা হয় তবে আমি কি আকারের অনুপাতের দ্বারা ওজন করব (উদাহরণস্বরূপ, যদি এটির চেয়ে দ্বিগুণ বড় হয়, আমি কি এটির ওজন দ্বিগুণ দেব)?
অ্যান্ড্রু

@ অ্যান্ড্রু কেবলমাত্র পৃথক ভেরিয়েবলের মান উভয় উপধারায় একই হলে ডেটা গণনা অনুসারে ওজন সঠিক। আরও ভাল পদ্ধতির জন্য (যা তাত্ত্বিকভাবে কার্যকরও রয়েছে), আপনার প্রশ্নের একটি মন্তব্যে আমি যে থ্রেডটি উল্লেখ করেছি তা দেখুন।
শুকনো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.