লজিস্টিক ফাংশনের হেসিয়ান


15

আমি উদ্দেশ্য ফাংশন, এর চট আহরণ করা অসুবিধা আছে , লজিস্টিক প্রত্যাবৃত্তি যেখানে হল: l ( θ ) l ( θ ) = m i = 1 [ y আমি লগ ( এইচ θ ( এক্স i ) ) + ( 1 - y i ) লগ ( 1 - এইচ θ ( এক্স i ) ) ]l(θ)l(θ)

l(θ)=i=1m[yilog(hθ(xi))+(1yi)log(1hθ(xi))]

hθ(x) একটি লজিস্টিক ফাংশন। হেসিয়ানটি XTDX । আমি 2l(θ)θiθj এটি আহরণের চেষ্টা করেছি , তবে তারপরে \ frac থেকে ম্যাট্রিক্স নোটেশনটি কীভাবে পাওয়া যায় তা আমার কাছে স্পষ্ট ছিল না {\ আংশিক ^ 2 ঠ (\ থেটা)} {\ আংশিক \ theta_i \ আংশিক \ theta_j}2l(θ)θiθj

কোনও পরিষ্কার এবং সহজ উপায় কি কেউ জানেন ?XTDX


3
আপনি কী ? 2lθiθj
গ্লেন_বি -রিনস্টেট মনিকা

1
এখানে স্লাইডগুলির একটি ভাল সেট যা আপনি খুঁজছেন ঠিক সেই হিসাবটি দেখায়: সাইট. stat.psu.edu/~jiali/course/stat597e/notes2/logit.pdf

আমি একটি দুর্দান্ত ভিডিও পেয়েছি যা হেসিয়ানকে ধাপে ধাপে গণনা করে। লজিস্টিক রিগ্রেশন (বাইনারি) - হেসিয়ান গণনা
নাওমি

উত্তর:


20

m{xi,yi}xiRdyiRhθ

hθ(xi)=σ(ωTxi)=σ(zi)=11+ezi,

ωRdzi=ωTxi

l(ω)=i=1m(yilogσ(zi)+(1yi)log(1σ(zi)))

1σ(z)=11/(1+ez)=ez/(1+ez)=1/(1+ez)=σ(z)

এটিও নোট করুন

zσ(z)=z(1+ez)1=ez(1+ez)2=11+ezez1+ez=σ(z)(1σ(z))

l(ω)2l(ω)zω=xTωω=xTzωT=ωTxωT=x

li(ω)=yilogσ(zi)(1yi)log(1σ(zi))

logσ(zi)ωT=1σ(zi)σ(zi)ωT=1σ(zi)σ(zi)ziziωT=(1σ(zi))xilog(1σ(zi))ωT=11σ(zi)(1σ(zi))ωT=σ(zi)xi

এটা এখন তুচ্ছ দেখানোর জন্য

li(ω)=li(ω)ωT=yixi(1σ(zi))+(1yi)xiσ(zi)=xi(σ(zi)yi)

হালকা

আমাদের শেষ পদক্ষেপ হেসিয়ান গণনা করা

2li(ω)=li(ω)ωωT=xixiTσ(zi)(1σ(zi))

m2l(ω)=i=1mxixiTσ(zi)(1σ(zi)). This is equivalent to concatenating column vectors xiRd into a matrix X of size d×m such that i=1mxixiT=XXT. The scalar terms are combined in a diagonal matrix D such that Dii=σ(zi)(1σ(zi)). Finally, we conclude that

H(ω)=2l(ω)=XDXT

A faster approach can be derived by considering all samples at once from the beginning and instead work with matrix derivatives. As an extra note, with this formulation it's trivial to show that l(ω) is convex. Let δ be any vector such that δRd. Then

δTH(ω)δ=δT2l(ω)δ=δTXDXTδ=δTXD(δTX)T=δTDX20

since D>0 and δTX0. This implies H is positive-semidefinite and therefore l is convex (but not strongly convex).


2
In the last equation, shouldn't it be ||δD1/2X|| since XDX = XD1/2(XD1/2)?
appletree

1
Shouldn't it be XTDX?
Chintan Shah
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.