এই উত্তরের কৃতিত্ব মন্তব্যগুলি থেকে আন্তোনি পারেল্লাদের কাছে যায়, যা আমি মনে করি যে এই পৃষ্ঠায় আরও বিশিষ্ট স্থানের দাবি করা হয়েছে (যখন এটি অন্যান্য অনেক উত্তর উত্তর না দেয় তবে এটি আমাকে সাহায্য করেছিল)। এছাড়াও, এই একটি সম্পূর্ণ আহরণ নয় বরং একটি স্পষ্ট বিবৃতি আরো । (পুরো বিকাশের জন্য, অন্যান্য উত্তরগুলি দেখুন)।∂J(θ)∂θ
∂J(θ)∂θ=1m⋅XT(σ(Xθ)−y)
কোথায়
X∈Rm×nσ(z)θ∈Rny=Training example matrix=11+e−z=sigmoid function=logistic function=weight row vector=class/category/label corresponding to rows in X
এছাড়াও, নতিমাত্রা নিরূপণ অনুপস্থিত তাদের জন্য একটি পাইথন বাস্তবায়ন সম্মান সঙ্গে ।Jθ
import numpy
def sig(z):
return 1/(1+np.e**-(z))
def compute_grad(X, y, w):
"""
Compute gradient of cross entropy function with sigmoidal probabilities
Args:
X (numpy.ndarray): examples. Individuals in rows, features in columns
y (numpy.ndarray): labels. Vector corresponding to rows in X
w (numpy.ndarray): weight vector
Returns:
numpy.ndarray
"""
m = X.shape[0]
Z = w.dot(X.T)
A = sig(Z)
return (-1/ m) * (X.T * (A - y)).sum(axis=1)