পোইসন রিগ্রেশনের জন্য পরিচয় লিঙ্ক বনাম লগ লিঙ্কের প্রস এবং কনস

আমি আমার মডেলের দুটি ফ্যাক্টরের স্তরের মধ্যে পূর্বাভাসের গড় গণনাগুলির তুলনা (এবং এর পার্থক্য নিয়ে) শেষ লক্ষ্য নিয়ে একটি পয়সন রিগ্রেশন চালিয়ে যাচ্ছি: , ধরে রেখে অন্যান্য মডেল covariates (যা সমস্ত বাইনারি হয়) ধ্রুবক। আমি ভাবছিলাম যে কোনও পরিচয় লিঙ্ক বনাম লগ লিঙ্ক কখন ব্যবহার করতে হবে সে সম্পর্কে কেউ যদি কিছু ব্যবহারিক পরামর্শ দিতে পারে। আমার পার্থক্যের তুলনা করার লক্ষ্য অনুসারে, পয়েসন রিগ্রেশন-এ এই দুটি ভিন্ন লিঙ্ক ফাংশনগুলির পক্ষে কী কী থাকতে পারে? $\hat{\mu}_1-\hat{\mu}_2$

লজিস্টিক / দ্বিপদী রিগ্রেশন (লগইট লিঙ্ক বা একটি পরিচয় লিঙ্ক ব্যবহার করা) দুটি ফ্যাক্টর স্তরের মধ্যে অনুপাতের পার্থক্যের তুলনা করার জন্য এবং একই রকম পরামর্শের প্রয়োজনের জন্যও আমার একই লক্ষ্য। আমি এখানে কিছু পোস্ট পড়েছি যা এই সমস্যাটিতে স্পর্শ করে, তবে কেন কেউ বা কখন অন্যটির উপরে একটি লিঙ্ক বেছে নিতে পারে এবং কী কী উপকার / বিবেচনা তা হতে পারে তা ব্যাখ্যা করার মতো কিছুই মনে হয় না। আপনার সাহায্যের জন্য আগাম ধন্যবাদ!

হালনাগাদ:

আমি আরও বুঝতে পারি যে নির্দিষ্ট লিঙ্ক ফাংশনগুলি ব্যবহারের মূল উদ্দেশ্যটি সম্ভাব্য পূর্বাভাসিত মানগুলির ব্যাপ্তি সীমার মধ্যে প্রতিক্রিয়ার সীমার মধ্যে সীমাবদ্ধ করা (উদাহরণস্বরূপ লজিস্টিকের জন্য, রেঞ্জটি 0 এবং 1 এর মধ্যে এবং লগের জন্য সীমাবদ্ধ থাকে) লিঙ্ক, পূর্বাভাসগুলি ইতিবাচক সংখ্যা হিসাবে সীমাবদ্ধ। সুতরাং, আমি অনুমান করি যে আমি যা জিজ্ঞাসা করছি তা হল যদি আমি কোনও লজিস্টিক / দ্বিপদী রিগ্রেশন বলার জন্য একটি পরিচয় লিঙ্কটি ব্যবহার করি এবং আমার ফলাফলগুলি (0,1) এর মধ্যে থাকে তবে লজিস্টিক লিঙ্ক ফাংশনটি ব্যবহার করার সত্যিই কি দরকার আছে বা আমি কি সহজ চিন্তাকে একটি পরিচয় লিঙ্ক ব্যবহার করতে পারি?

logistic poisson-regression link-function

— StatsStudent
সূত্র

এটি একটি ভাল প্রশ্ন। এটি কীভাবে বর্ণিত হয়েছে তা প্রদত্ত, যদিও এটি জেনে রাখা কার্যকর হতে পারে যে আপনার যখন কেবলমাত্র একটি বাইনারি ফ্যাক্টর এবং অন্য কোনও ভেরিয়েবল নেই তখন আপনি কোন লিঙ্কটি চয়ন করেন তা কোনও তাত্পর্যপূর্ণ করে না।

— হুবুহু

ধন্যবাদ, @ শুভ আমি আমার প্রশ্নটি আপডেট করেছি যাতে এটি পরিষ্কার হয়ে যায় যে এই মডেলটিতে অন্যান্য কোভেরিয়েট রয়েছে। আমি একটি "আপডেট" বিভাগও যুক্ত করেছি যা আমার প্রশ্নটিকে আরও খানিকটা ব্যাখ্যা করে।

— স্ট্যাটাস স্টুডেন্ট

লিঙ্ক ফাংশনগুলির ভূমিকার বিষয়ে ভিন্ন ভিন্ন দৃষ্টিভঙ্গির জন্য, stats.stackexchange.com/questions/63978 এ ঘনিষ্ঠভাবে সম্পর্কিত প্রশ্নের আমার উত্তর দেখুন ।

— whuber

মজার উদাহরণ @ হুবুহু!

— স্ট্যাটাস স্টুডেন্ট

সাধারণত আমি বলব যে লিংক ফাংশনটির পছন্দটি সমস্যা এবং হাতের ডেটা দ্বারা নির্ধারিত হয় - একটি

— নিবিড়

উত্তর:

পইসন রিগ্রেশন সম্পর্কিত ক্ষেত্রে একটি পরিচয়ের লিঙ্কের বিষয়টি হ'ল:

যেমনটি আপনি উল্লেখ করেছেন, এটি সীমার বাইরে পূর্বাভাস তৈরি করতে পারে।
মডেলটি ফিট করার চেষ্টা করার সময় আপনি অদ্ভুত ত্রুটি এবং সতর্কতা পেতে পারেন, কারণ লিঙ্কটি ল্যাম্বডাকে 0 এর চেয়ে কম হতে দেয়, তবে পোয়েসন বিতরণ এই জাতীয় মানগুলির জন্য সংজ্ঞায়িত করা হয়নি।
পোয়েসন রিগ্রেশন যেমন ধরে নিয়েছে যে গড় এবং বৈচিত্র একই, আপনি লিঙ্কটি পরিবর্তন করার সময় আপনি বৈকল্পিক সম্পর্কে অনুমানগুলিও পরিবর্তন করছেন। আমার অভিজ্ঞতা হয়েছে যে এই শেষ পয়েন্টটি সর্বাধিক বলছে।

তবে, শেষ পর্যন্ত এটি একটি অভিজ্ঞতামূলক প্রশ্ন। দুটি মডেলই ফিট করে। আপনি যা যা পরীক্ষা করেন তা সম্পাদন করুন। যদি পরিচয় লিঙ্কটির কম এআইসি থাকে, এবং আপনার অন্যান্য সমস্ত চেক-তে ভাল বা আরও ভাল করে তোলে, তবে পরিচয় লিঙ্কটি দিয়ে চালান।

লিনিট মডেল বনাম লিনিয়ার সম্ভাব্যতা মডেলের ক্ষেত্রে (অর্থাত্ আপনি যেটিকে পরিচয় লিঙ্ক হিসাবে উল্লেখ করেন) পরিস্থিতি অনেক বেশি সরল। ইকোনোমেট্রিক্সে কিছু খুব বহিরাগত ক্ষেত্রে ব্যতীত (যা আপনি অনুসন্ধানের পরে খুঁজে পাবেন) লগইট মডেলটি আরও ভাল: এটি কম অনুমান করে এবং বেশিরভাগ লোকেরা এটি ব্যবহার করেন। লিনিয়ার সম্ভাব্যতা মডেলটিকে তার জায়গায় ব্যবহার করা বিকৃত হওয়ার প্রান্তে থাকবে।

মডেলগুলির ব্যাখ্যার ক্ষেত্রে, আপনি যদি আর ব্যবহার করেন তবে দুটি ভারী উত্তোলন এমন দুটি দুর্দান্ত প্যাকেজ রয়েছে: প্রভাবগুলি , যা ব্যবহার করা অত্যন্ত সহজ এবং জেলিগ , যা ব্যবহার করা শক্ত কিন্তু দুর্দান্ত আপনি যদি ভবিষ্যদ্বাণী করতে চান তবে দুর্দান্ত ।

— টিম
সূত্র

আপনি উল্লেখ করেছেন যে লিনিয়ার সম্ভাব্যতা মডেলগুলি "বহিরাগত" তবে অর্থনীতিবিদদের সাথে আমার আলাপচারিতা থেকে (আমি নিজে একটি পরিসংখ্যানবিদ) মনে হয় দুটি শিবির রয়েছে যার মধ্যে একটি যুক্তি দেয় যে লিনিয়ার সম্ভাবনা ভাল কারণ এটি কম অনুমানের সাথে জড়িত এবং সরাসরি মডেলদের প্রত্যাশা , যা সাধারণভাবে যত্নশীল।

— জিপজ্যাপবোইন

আমি অর্থনীতির বহিরাগত ক্ষেত্রে উল্লেখ করে আমার উত্তরটি দেই। এই কথাটি বলার পরে, লিনিয়ার সম্ভাব্যতা মডেলের সমস্যাটি হ'ল আপনি যদি এটি ওএলএসের মাধ্যমে অনুমান করেন তবে এর অনুমানগুলি সাধারণত লঙ্ঘিত হয়। মডেলটি প্যারামিটারগুলিতে রৈখিক ধারণা অনুমান করা যায় না অনেক ক্ষেত্রে (যেমন, যখন ওএলএস ব্যবহারের অনুমান করা হয় আপনি 0 এবং 1 এর বাইরেও সম্ভাবনা পেতে পারেন)। এবং, অবশিষ্টাংশগুলি রিমোট থেকে স্বাভাবিকের কাছাকাছি থাকতে পারে না, সুতরাং আপনার তখন স্যান্ডউইচ প্রাক্কলনকারী বা কিছু ব্যবহার করতে হবে।

— টিম

— টম Wenseleers

পইসন মডেলগুলির ক্ষেত্রে আমি এও বলব যে অ্যাপ্লিকেশনটি প্রায়শই নির্দেশ দেয় যে আপনার সোভিয়েটগুলি যোগমূলকভাবে কাজ করবে (যা তারপরে একটি পরিচয় লিঙ্ক বোঝায়) বা লিনিয়ার স্কেল (যা তারপরে একটি লগ লিঙ্ককে বোঝায়) তে বহুগুণে কাজ করবে। তবে একটি পরিচয় লিঙ্কযুক্ত পায়সন মডেলগুলি কেবলমাত্র সাধারণভাবে বোধগম্য হয় এবং কেবল কোনও যদি লাগানো সহগের উপর ননএগিয়েটিভিটির সীমাবদ্ধতা চাপায় তবে কেবল স্টেইলে ফিট হতে পারে - nnpoisএটি আর addregপ্যাকেজে nnlmফাংশনটি ব্যবহার করে বা ফাংশনটি ব্যবহার করে করা যেতে পারেNNLMপ্যাকেজ। সুতরাং আমি একমত নই যে কোনও একটি পোইসন মডেলকে একটি পরিচয় এবং লগ লিঙ্ক উভয়ের সাথেই ফিট করা উচিত এবং দেখতে হবে কোনটি সেরা এআইসি থাকা এবং খাঁটি পরিসংখ্যানের ভিত্তিতে সেরা মডেলটি নির্ধারণ করা - বরং বেশিরভাগ ক্ষেত্রেই এটি নির্ধারিত হয় যে সমস্যার সমাধান করার চেষ্টা করে বা ডেটা হাতে থাকে তার অন্তর্নিহিত কাঠামো।

উদাহরণস্বরূপ, ক্রোমাটোগ্রাফিতে (জিসি / এমএস বিশ্লেষণ) প্রায়শই প্রায় বেশ কয়েকটি প্রায় গাউসীয় আকারের শৃঙ্গগুলির সুপারিম্পোজড সংকেত পরিমাপ করা হত এবং এই সুপারিম্পোজড সিগন্যালটি একটি ইলেক্ট্রন গুণক দ্বারা পরিমাপ করা হয়, যার অর্থ পরিমাপ করা সংকেত আয়ন গণনা এবং তাই পোয়েসন বিতরণ করা হয়। যেহেতু প্রতিটি শিখর সংজ্ঞা অনুসারে একটি ইতিবাচক উচ্চতা এবং সংযোজনমূলক পদক্ষেপ নিয়ে থাকে এবং শব্দটি পোইসন, তাই পরিচয়ের লিঙ্কযুক্ত একটি নন-নেগেটিভ পোইসন মডেল এখানে উপযুক্ত হবে এবং লগ লিঙ্ক পোইসন মডেলটি সরল ভুল হবে। ইঞ্জিনিয়ারিংয়ে কুলব্যাক-লেবেলারের ক্ষতি প্রায়শই এই জাতীয় মডেলগুলির জন্য ক্ষতির ফাংশন হিসাবে ব্যবহৃত হয় এবং এই ক্ষয়টি হ্রাস করা একটি নন-অ্যাগিভেটিভ আইডেন্টি-লিংক পোইসন মডেলের সম্ভাবনাটিকে অনুকূল করার সমতুল্য ( আলফা বা বিটা ডাইভারজেন্সের মতো অন্যান্য বিচ্যুতি / ক্ষতির ব্যবস্থাও রয়েছে) একটি বিশেষ ক্ষেত্রে হিসাবে পইসন আছে)।

নীচে একটি সংখ্যাসূচক উদাহরণ রয়েছে যা একটি নিয়মিত অনিয়ন্ত্রিত পরিচয় লিঙ্ক পোইসন জিএলএম ফিট করে না (এই কারণে ননএগিটিভিটি সীমাবদ্ধতার অভাবে) এবং কীভাবে নন-নেগেটিভ পরিচয়-লিংক পোইসন মডেলগুলি ফিট করতে পারে সে সম্পর্কে কিছু বিশদ বিবরণ সহnnpois, এখানে ব্যান্ডযুক্ত কোভারিয়েট ম্যাট্রিক্স ব্যবহার করে ক্রোমাটোগ্রাফিক শিখরগুলির একটি ক্রাইম্যাটোগ্রাফিক শিখরগুলির একটি পরিমাপিত মহাকাশটিকে ডিকনভোলিউটিং করার প্রসঙ্গে যেখানে একক শিখরের পরিমাপক আকারের স্থানান্তরিত অনুলিপিগুলি রয়েছে। ননএগিটিভিটি এখানে বেশ কয়েকটি কারণে গুরুত্বপূর্ণ: (1) এটি কেবলমাত্র ডেটার জন্য বাস্তবসম্মত মডেল (এখানে শিখর নেতিবাচক উচ্চতা থাকতে পারে না), (২) পরিচয়ের লিঙ্কের সাথে পোয়েসন মডেলকে স্থিরভাবে ফিট করার একমাত্র উপায় এটি (যেমন) অন্যথায় পূর্বাভাসগুলি কিছু সংঘবদ্ধ মানগুলি নেতিবাচক হতে পারে, যা কোনও অর্থবোধ করে না এবং যখন সম্ভাবনাটি মূল্যায়নের চেষ্টা করবে তখন সংখ্যাসূচক সমস্যা দেখা দেয়), (3) ননএগিটিভিটি রিগ্রেশন সমস্যাটি নিয়মিত করতে কাজ করে এবং স্থিতিশীল অনুমানগুলি (যেমন উদাহরণস্বরূপ) প্রাপ্তিতে ব্যাপকভাবে সহায়তা করে আপনি সাধারণ অনিয়ন্ত্রিত রিগ্রেশন হিসাবে সাধারণত অত্যধিক সমস্যাগুলি পান না,অ-নেগেইটিভিটি বাধা বিপ্লব অনুমানের ফলস্বরূপ যা প্রায়শই স্থল সত্যের কাছাকাছি থাকে; নীচের ডিকনভোলিউশন সমস্যার জন্য উদাহরণস্বরূপ পারফরম্যান্স লাসো নিয়মিতকরণের মতোই দুর্দান্ত, তবে কোনও নিয়মিতকরণ পরামিতি টিউন করার প্রয়োজন নেই। ( L0-pseudonorm দণ্ডিত রিগ্রেশন এখনও কিছুটা ভাল পারফরম্যান্স করে তবে আরও বেশি গণনা ব্যয় করে )

# we first simulate some data
require(Matrix)
n = 200
x = 1:n
npeaks = 20
set.seed(123)
u = sample(x, npeaks, replace=FALSE) # unkown peak locations
peakhrange = c(10,1E3) # peak height range
h = 10^runif(npeaks, min=log10(min(peakhrange)), max=log10(max(peakhrange))) # unknown peak heights
a = rep(0, n) # locations of spikes of simulated spike train, which are assumed to be unknown here, and which needs to be estimated from the measured total signal
a[u] = h
gauspeak = function(x, u, w, h=1) h*exp(((x-u)^2)/(-2*(w^2))) # peak shape function
bM = do.call(cbind, lapply(1:n, function (u) gauspeak(x, u=u, w=5, h=1) )) # banded matrix with peak shape measured beforehand
y_nonoise = as.vector(bM %*% a) # noiseless simulated signal = linear convolution of spike train with peak shape function
y = rpois(n, y_nonoise) # simulated signal with random poisson noise on it - this is the actual signal as it is recorded
par(mfrow=c(1,1))
plot(y, type="l", ylab="Signal", xlab="x", main="Simulated spike train (red) to be estimated given known blur kernel & with Poisson noise")
lines(a, type="h", col="red")

# let's now deconvolute the measured signal y with the banded covariate matrix containing shifted copied of the known blur kernel/peak shape bM

# first observe that regular OLS regression without nonnegativity constraints would return very bad nonsensical estimates
weights <- 1/(y+1) # let's use 1/variance = 1/(y+eps) observation weights to take into heteroscedasticity caused by Poisson noise
a_ols <- lm.fit(x=bM*sqrt(weights), y=y*sqrt(weights))$coefficients # weighted OLS
plot(x, y, type="l", main="Ground truth (red), unconstrained OLS estimate (blue)", ylab="Peak shape", xlab="x", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_ols, type="h", col="blue", lwd=2)

# now we use weighted nonnegative least squares with 1/variance obs weights as an approximation of nonnegative Poisson regression
# this gives very good estimates & is very fast
library(nnls)
library(microbenchmark)
microbenchmark(a_wnnls <- nnls(A=bM*sqrt(weights),b=y*sqrt(weights))$x) # 7 ms
plot(x, y, type="l", main="Ground truth (red), weighted nnls estimate (blue)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_wnnls, type="h", col="blue", lwd=2)
# note that this weighted least square estimate in almost identical to  the nonnegative Poisson estimate below and that it fits way faster!!!

# an unconstrained identity-link Poisson GLM will not fit:
glmfit = glm.fit(x=as.matrix(bM), y=y, family=poisson(link=identity), intercept=FALSE)
# returns Error: no valid set of coefficients has been found: please supply starting values

# so let's try a nonnegativity constrained identity-link Poisson GLM, fit using bbmle (using port algo, ie Quasi Newton BFGS):
library(bbmle)
XM=as.matrix(bM)
colnames(XM)=paste0("v",as.character(1:n))
yv=as.vector(y)
LL_poisidlink <- function(beta, X=XM, y=yv){ # neg log-likelihood function
  -sum(stats::dpois(y, lambda = X %*% beta, log = TRUE)) # PS regular log-link Poisson would have exp(X %*% beta)
}
parnames(LL_poisidlink) <- colnames(XM)
system.time(fit <- mle2(
  minuslogl = LL_poisidlink ,
  start = setNames(a_wnnls+1E-10, colnames(XM)), # we initialise with weighted nnls estimates, with approx 1/variance obs weights
  lower = rep(0,n),
  vecpar = TRUE,
  optimizer = "nlminb"
)) # very slow though - takes 145s 
summary(fit)
a_nnpoisbbmle = coef(fit)
plot(x, y, type="l", main="Ground truth (red), nonnegative Poisson bbmle ML estimate (blue)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_nnpoisbbmle, type="h", col="blue", lwd=2)

# much faster is to fit nonnegative Poisson regression using nnpois using an accelerated EM algorithm:
library(addreg)
microbenchmark(a_nnpois <- nnpois(y=y,
                                  x=as.matrix(bM),
                                  standard=rep(1,n),
                                  offset=0,
                                  start=a_wnnls+1.1E-4, # we start from weighted nnls estimates 
                                  control = addreg.control(bound.tol = 1e-04, epsilon = 1e-5),
                                  accelerate="squarem")$coefficients) # 100 ms
plot(x, y, type="l", main="Ground truth (red), nonnegative Poisson nnpois estimate (blue)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_nnpois, type="h", col="blue", lwd=2)

# or to fit nonnegative Poisson regression using nnlm with Kullback-Leibler loss using a coordinate descent algorithm:
library(NNLM)
system.time(a_nnpoisnnlm <- nnlm(x=as.matrix(rbind(bM)),
                                 y=as.matrix(y, ncol=1),
                                 loss="mkl", method="scd",
                                 init=as.matrix(a_wnnls, ncol=1),
                                 check.x=FALSE, rel.tol=1E-4)$coefficients) # 3s
plot(x, y, type="l", main="Ground truth (red), nonnegative Poisson nnlm estimate (blue)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_nnpoisnnlm, type="h", col="blue", lwd=2)

— টম ভেনসিলিয়ার্স
সূত্র

আমি অভাবনীয়তার সীমাবদ্ধতার প্রয়োজনীয়তা বা এমনকি বৈধতাও বুঝতে পারি না, যা স্পষ্টতই সমস্ত ফিটযুক্ত সহগকে অ-নেতিবাচক হতে বাধ্য করার উদ্দেশ্যে তৈরি হয়েছিল। সর্বোপরি, যদি আপনি কেবল প্রতিক্রিয়াটির কোডিং ( কে তে রূপান্তর করতে পারেন ) সরিয়ে ফেলা হন তবে সমস্ত সহগকে অবহেলা করা হবে এবং দেখানো হবে যে এগুলির কোনওটির চিহ্নই অর্থহীন। আপনি কি এইরকম প্রতিবন্ধকতা দ্বারা বোঝাতে চেয়েছেন?

Y

$Y$

1 - Y

$1-Y$

— শুক্র

@ যাহা আমি এখন আরও স্পষ্টভাবে আমার বক্তব্যকে আরও দৃ to়তর করার জন্য একটি দৃ !় উদাহরণ যুক্ত করেছি! সত্যিকারের নন-নেগেটিভ পরিচয়-লিংক পোইসন মডেলটির আনুমানিক তুলনায় আমার ওজনযুক্ত নন-নেগেটিভ ন্যূনতম স্কোয়ার ব্যবহার সম্পর্কে কোনও ধারণাও স্বাগত!

— টম Wenseleers

বিটিডব্লিউ - আমি যে وزنযুক্ত এনএনএলগুলি আনুমানিক একটি অলিগনিটিভ পরিচয়-লিংক পোইসন জিএলএম আনুমানিকভাবে ব্যবহার করি তা পুনরাবৃত্তভাবে পুনর্বিবেচিত নন-নেগেটিভ ন্যূনতম নেতিবাচক বর্গগুলির একক পুনরাবৃত্তি ব্যবহারের সাথে সামঞ্জস্য রাখে একটি নন-নেগেটিভ পোইসন জিএলএম ফিট করতে (আর নিজেই 1 / (y + 0.1) ব্যবহার করে

— পোয়েসন