ওপি ভুল করে বিশ্বাস করে যে এই দুটি ফাংশনের মধ্যে সম্পর্ক নমুনার সংখ্যার কারণে (যেমন একক বনাম সমস্ত)। তবে, আসল পার্থক্যটি হ'ল আমরা কীভাবে আমাদের প্রশিক্ষণ লেবেলগুলি নির্বাচন করি।
বাইনারি শ্রেণিবিন্যাসের ক্ষেত্রে আমরা লেবেলগুলি বা নির্ধারণ করতে পারি ।Y= ± 1Y= 0 , 1
যেমনটি ইতিমধ্যে বলা হয়েছে, লজিস্টিক ফাংশন একটি ভাল পছন্দ কারণ এটির সম্ভাবনার রূপ রয়েছে, যেমন ie এবং যেমন । যদি আমরা লেবেলগুলি চয়ন করি তবে আমরা নির্ধারিত করতে পারি σ( জেড))σ( - জেড)) = 1 - σ( জেড))σ( জেড)) ∈ ( 0 , 1 )z- র→ ± ∞Y= 0 , 1
পি (ওয়াই)= 1 | z- র)পি (ওয়াই)= 0 | z- র)= σ( জেড)) = 11 + ই- জেড= 1 - σ( জেড)) = 11 + ইz- র
যা প্রায়ই কষে লেখা যেতে পারে যেমন ।পি (ওয়াই)| z- র) = σ( জেড))Y( 1 - σ)( জেড)) )1 - y
লগ-সম্ভাবনা সর্বাধিক করা সহজ। লগ-সম্ভাবনা সর্বাধিক করা নেতিবাচক লগ-সম্ভাবনা হ্রাস করার সমান। জন্য নমুনা , স্বাভাবিক লগারিদম এবং কিছু সরলীকরণ করার পর আমরা খুঁজে বের করতে হবে:মি{xi,yi}
ঠ(z) = -log(∏iমিপি (yআমি|zআমি) ) = -∑আমিমিলগ( পি(yআমি|zআমি) ) =∑আমিমি-yআমিz- রআমি+ +log( 1 + ই)z- রআমি)
সম্পূর্ণ ডেরাইভেশন এবং অতিরিক্ত তথ্য এই বৃহত্তর নোটবুকটিতে পাওয়া যাবে । অন্যদিকে, আমরা এর পরিবর্তে লেবেল ব্যবহার করতে পারি । এটি তখন বেশ স্পষ্ট যে আমরা নির্ধারণ করতে পারিy= ± 1
পি (ওয়াই)|z) =σ(yz- র) ।
এটিও স্পষ্ট যে । এই ক্ষেত্রে ক্ষতি ফাংশনটি হ্রাস করার আগে আমাদের একই পদক্ষেপ অনুসরণ করা Followingপি (y= 0 |z) = পি (y=−1|z)=σ(−z)
L(z)=−log(∏jmP(yj|zj))=−∑jmlog(P(yj|zj))=∑jmlog(1+e−yzj)
নেতিবাচক চিহ্ন দ্বারা উত্সাহিত যা পরস্পরকে গ্রহণের পরে যেখানে শেষ পদক্ষেপটি অনুসরণ করবে। যদিও আমাদের এই দুটি রূপকে সমীকরণ করা উচিত নয়, প্রতিটি ফর্মের মধ্যে বিভিন্ন মান গ্রহণ করে তা সত্ত্বেও এই দুটি সমতুল্য:y
−yizi+log(1+ezi)≡log(1+e−yzj)
কেস দেখানোর জন্য তুচ্ছ হয়। যদি , তবে বাম দিকে এবং ডানদিকে ।yi=1yi≠1yi=0yi=−1
যদিও আমাদের দুটি ভিন্ন রূপ রয়েছে তা সম্পর্কে মৌলিক কারণ থাকতে পারে (দেখুন কেন দুটি ভিন্ন লজিস্টিক লোকসান সূচনা / স্বরলিপি রয়েছে? ), প্রাক্তনটিকে বেছে নেওয়ার একটি কারণ ব্যবহারিক বিবেচনার জন্য। পূর্ববর্তী ক্ষেত্রে আমরা তুচ্ছভাবে গণনা করতে এবং করতে পারি , উভয়ই রূপান্তর বিশ্লেষণের জন্য প্রয়োজন (অর্থাত্ হেসিয়ান গণনা করে ক্ষতির কার্যকারিতাটি নির্ধারণ করার জন্য )।∂σ(z)/∂z=σ(z)(1−σ(z))∇l(z)∇2l(z)