লজিস্টিক রিগ্রেশন থেকে কীভাবে ব্যয় হয় তা ব্যয় করা হয়


29

আমি কোর্সেরাতে মেশিন লার্নিং স্ট্যানফোর্ড কোর্স করছি।

লজিস্টিক রিগ্রেশন সম্পর্কিত অধ্যায়ে, ব্যয় কার্যকারিতাটি হ'ল: এখানে চিত্র বর্ণনা লিখুন

তারপরে, এটি এখানে উদ্ভূত: এখানে চিত্র বর্ণনা লিখুন

আমি ব্যয় ফাংশনের ডেরাইভেটিভ পাওয়ার চেষ্টা করেছি তবে আমি সম্পূর্ণ আলাদা কিছু পেয়েছি।

কীভাবে ডেরাইভেটিভ প্রাপ্ত হয়?

মধ্যস্থতাকারী পদক্ষেপগুলি কোনটি?


+1, আমার প্রশ্নের এখানে @ অ্যাডামোর উত্তরটি দেখুন। stats.stackexchange.com/questions/229014/…
দু

আপনি ইতিমধ্যে কী জানেন (সঠিক গ্রেডিয়েন্ট) আপনাকে জানানোর পাশাপাশি আপনার প্রশ্নের উত্তর দেওয়ার জন্য "সম্পূর্ণ আলাদা" সত্যিই যথেষ্ট নয়। এটি আরও কার্যকর হতে চাই যদি আপনি আমাদের গণনাগুলির ফলস্বরূপ আমাদের জানান তবে আপনি যেখানে ভুল করেছেন সেখানে আমরা আপনাকে উপকূলে সহায়তা করতে পারি।
ম্যাথু ড্রুরি

@ ম্যাথেজড্রুরি দুঃখিত, ম্যাট, আপনার মন্তব্য আসার আগেই আমি উত্তরটি সাজিয়েছি। অক্টাভিয়ান, আপনি কি সমস্ত পদক্ষেপ অনুসরণ করেছিলেন? এটির পরে কিছু যুক্ত করার মান আমি সম্পাদনা করব ...
আন্তনি পরেল্লদা

2
আপনি যখন "ডেরিভেটেড" বলছেন তখন কি আপনার অর্থ "ডিফারভেটেড" বা "উত্পন্ন" হয়েছে?
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


41

কোর্সে থাকা নোটগুলি থেকে অভিযোজিত, যা আমি অ্যান্ড্রু এনজির কর্সেরা মেশিন লার্নিং কোর্সের পৃষ্ঠার মধ্যে শিক্ষার্থীদের দ্বারা প্রদত্ত নোটগুলির বাইরে (এই উপজাত সহ) উপলব্ধ নেই ।


এরপরে, সুপারস্ক্রিপ্ট স্বতন্ত্র পরিমাপ বা প্রশিক্ষণকে বোঝায় "উদাহরণ"।(i)

J(θ)θj=θj1mi=1m[y(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i)))]=linearity1mi=1m[y(i)θjlog(hθ(x(i)))+(1y(i))θjlog(1hθ(x(i)))]=chain rule1mi=1m[y(i)θjhθ(x(i))hθ(x(i))+(1y(i))θj(1hθ(x(i)))1hθ(x(i))]=hθ(x)=σ(θx)1mi=1m[y(i)θjσ(θx(i))hθ(x(i))+(1y(i))θj(1σ(θx(i)))1hθ(x(i))]=σ1mi=1m[y(i)σ(θx(i))(1σ(θx(i)))θj(θx(i))hθ(x(i))(1y(i))σ(θx(i))(1σ(θx(i)))θj(θx(i))1hθ(x(i))]=σ(θx)=hθ(x)1mi=1m[y(i)hθ(x(i))(1hθ(x(i)))θj(θx(i))hθ(x(i))(1y(i))hθ(x(i))(1hθ(x(i)))θj(θx(i))1hθ(x(i))]=θj(θx(i))=xj(i)1mi=1m[y(i)(1hθ(x(i)))xj(i)(1yi)hθ(x(i))xj(i)]=distribute1mi=1m[yiyihθ(x(i))hθ(x(i))+y(i)hθ(x(i))]xj(i)=cancel1mi=1m[y(i)hθ(x(i))]xj(i)=1mi=1m[hθ(x(i))y(i)]xj(i)


সিগময়েড ফাংশনের ডেরাইভেটিভ is

ddxσ(x)=ddx(11+ex)=(1+ex)(1+ex)2=ex(1+ex)2=(11+ex)(ex1+ex)=(11+ex)(1+ex1+ex11+ex)=σ(x)(1+ex1+exσ(x))=σ(x)(1σ(x))


1
সমস্ত প্রচেষ্টা জন্য +1 !, ম্যাট্রিক্স স্বরলিপি ব্যবহার করা সহজ হতে পারে?
হাইটাও ডু

আমি কি লিনিয়ার রিগ্রেশন বলতে পারি, উদ্দেশ্যটি হ'ল এবং ডেরিভেটিভ , যেখানে , লজিস্টিক রিগ্রেশন এ এটি একই রকম, ডেরিভেটিভটি যেখানে , এবং ? Axb22ATee=AxbATee=pbp=sigmoid (Ax)
হাইটাও ডু

2
এজন্য আপনার প্রচেষ্টাকে আমি প্রশংসা করি। আপনি আমাদের ওপির ভাষাতে সময় কাটাবেন !!
হাইটাও ডু

1
আমার বোধগম্যতা হ'ল এমন উত্তেজনাপূর্ণ সমস্যা রয়েছে যা স্কয়ার্ড ত্রুটি হ্রাস-অ-রৈখিক ক্রিয়াকলাপের জন্য অবাঞ্ছিত করে তোলে। ম্যাট্রিক্স স্বরলিপিতে এটি হবে । J(θ)θ=1mX(σ(Xθ)y)
আন্তনি পরল্লদা

1
@ মুহম্মদ নুরাল্ডিন ​​আমি শৃঙ্খলা বিধি প্রয়োগ করে পূর্বের লাইনে অঙ্কগুলিতে আংশিক ডেরিভেটিভ নিয়েছি।
আন্তোনি পারেল্লদা

8

বিষয়টি নিয়ে অতিরিক্ত জটিলতার ছাপ এড়ানোর জন্য আসুন আমরা সমাধানের কাঠামোটি দেখি।

সরলকরণ এবং স্বরলিপিটির কিছু অপব্যবহারের সাথে, কে যোগফল হিসাবে একটি শব্দ হিসাবে ধরা হোক এবং এর একটি ফাংশন : G(θ)J(θ)h=1/(1+ez)z(θ)=xθ

G=ylog(h)+(1y)log(1h)

আমরা চেইন বিধি ব্যবহার করতে পারি: এবং একে একে সমাধান করুন এক ( এবং ধ্রুবক)।dGdθ=dGdhdhdzdzdθxy

dGh=yh1y1h=yhh(1h)
জন্য সিগময়েড ধারণ করে, যা পূর্ববর্তী বক্তব্যের কেবল একটি বিভাজন।dhdz=h(1h)

অবশেষে, ।dzdθ=x

সব মিলিয়ে ফলাফলের সংমিশ্রণ চাওয়া-পাওয়া ভাব প্রকাশ করে: আশা যা সাহায্য করে।

dGdθ=(yh)x

0

এই উত্তরের কৃতিত্ব মন্তব্যগুলি থেকে আন্তোনি পারেল্লাদের কাছে যায়, যা আমি মনে করি যে এই পৃষ্ঠায় আরও বিশিষ্ট স্থানের দাবি করা হয়েছে (যখন এটি অন্যান্য অনেক উত্তর উত্তর না দেয় তবে এটি আমাকে সাহায্য করেছিল)। এছাড়াও, এই একটি সম্পূর্ণ আহরণ নয় বরং একটি স্পষ্ট বিবৃতি আরো । (পুরো বিকাশের জন্য, অন্যান্য উত্তরগুলি দেখুন)।J(θ)θ

J(θ)θ=1mXT(σ(Xθ)y)

কোথায়

XRm×n=Training example matrixσ(z)=11+ez=sigmoid function=logistic functionθRn=weight row vectory=class/category/label corresponding to rows in X

এছাড়াও, নতিমাত্রা নিরূপণ অনুপস্থিত তাদের জন্য একটি পাইথন বাস্তবায়ন সম্মান সঙ্গে ।Jθ

import numpy
def sig(z):
return 1/(1+np.e**-(z))


def compute_grad(X, y, w):
    """
    Compute gradient of cross entropy function with sigmoidal probabilities

    Args: 
        X (numpy.ndarray): examples. Individuals in rows, features in columns
        y (numpy.ndarray): labels. Vector corresponding to rows in X
        w (numpy.ndarray): weight vector

    Returns: 
        numpy.ndarray 

    """
    m = X.shape[0]
    Z = w.dot(X.T)
    A = sig(Z)
    return  (-1/ m) * (X.T * (A - y)).sum(axis=1) 

0

আমাদের মধ্যে যারা ক্যালকুলাসে তেমন শক্তিশালী নন, তবে ব্যয় ক্রিয়াকলাপটি সামঞ্জস্য করে খেলতে চান এবং ডেরিভেটিভস গণনা করার উপায় খুঁজে বের করতে চান ... ক্যালকুলাস পুনরায় শেখার একটি শর্ট কাট স্বয়ংক্রিয়ভাবে সরবরাহ করার জন্য এই অনলাইন সরঞ্জাম নিয়মের ধাপে ধাপে ব্যাখ্যা সহ ডাইরিভিশন।

https://www.derivative-calculator.net

লজিস্টিক রিগ্রেশনে সিগময়েড অ্যাক্টিভেশনের ব্যয় ক্রিয়াকলাপের উদাহরণ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.