সাধারণভাবে ধরে নিন যে আপনি ফর্মের একটি মডেল নেওয়ার সিদ্ধান্ত নিয়েছেন
পি( y)= 1 | এক্স= এক্স ) = এইচ ( এক্স ; Θ )
কিছু প্যারামিটারের জন্য । তারপরে আপনি কেবল এর সম্ভাবনাটি লিখে রাখুন, অর্থাত্Θ
এল ( Θ ) = ∏আমি ∈ { 1 , । । । , এন} , yআমি= 1পি( y)= 1 | x = x ; Θ ) ⋅ ∏আমি ∈ { 1 , । । । , এন} , yআমি= 0পি( y)= 0 | x = x ; Θ )
যা হিসাবে একই
এল ( Θ ) = ∏আমি ∈ { 1 , । । । , এন} , yআমি= 1পি( y)= 1 | x = x ; Θ ) ⋅ ∏আমি ∈ { 1 , । । । , এন} , yআমি= 0( 1 - পি( y)= 1 | x = x ; Θ ) )
এখন আপনি 'অনুমান' (মডেল) করার সিদ্ধান্ত নিয়েছেন
পি( y)= 1 | এক্স= এক্স ) = σ( Θ)0+ + Θ1এক্স )
যেখানে
σ( জেড)) = 1 / ( 1 + ই)- জেড)
সুতরাং আপনি কেবলমাত্র সম্ভাবনার সূত্রটি গণনা করুন এবং , উদাহরণস্বরূপ, নিউটোনস পদ্ধতি বা অন্য কোনও গ্রেডিয়েন্ট ভিত্তিক পদ্ধতিটি সন্ধান করার জন্য অপ্টিমাইজেশন অ্যালগরিদমটি করুন ।argmaxΘএল ( Θ )
কখনও কখনও লক্ষ্য করুন যে, লোকেরা বলে যে তারা যখন লজিস্টিক রিগ্রেশন করছে তখন তারা সম্ভাবনা সর্বাধিক করে না (যেমন আমরা / আপনি উপরে করেছেন) বরং তারা ক্ষতির ফাংশনটি হ্রাস করে
l ( Θ ) = - ∑i = 1এনYআমিলগ( পি( ওয়াইআমি= 1 | এক্স= এক্স ; Θ ) ) + ( 1 - y)আমি) লগ( পি( ওয়াইআমি= 0 | এক্স= এক্স ; Θ ) )
তবে লক্ষ্য করুন ।- লগ( এল ( Θ ) ) = l ( Θ )
এটি মেশিন লার্নিংয়ের একটি সাধারণ প্যাটার্ন: ব্যবহারিক দিক (হিউরিস্টিক মডেলটি কীভাবে 'ভুল' তা মাপার ক্ষতির ফাংশনগুলি হ্রাস করা) আসলে 'তাত্ত্বিক দিকের' সমান ( সিম্বোলের সাথে স্পষ্টভাবে মডেলিং করা , যেমন পরিসংখ্যানের পরিমাণকে সর্বাধিক করে তোলা সম্ভাবনাগুলি) এবং প্রকৃতপক্ষে, অনেকগুলি মডেল যা সম্ভাব্যতাগুলির মতো দেখতে লাগে না (উদাহরণস্বরূপ এসভিএমগুলি) একটি সম্ভাব্য প্রেক্ষাপটে পুনরায় বিবেচনা করা যেতে পারে এবং প্রকৃতপক্ষে সম্ভাবনার সর্বাধিককরণ হয়।পি