আপনি যা করতে চান তা বিদ্যমান নেই কারণ এটি হ'ল আরও ভাল শব্দের অভাবে, গাণিতিকভাবে ত্রুটিযুক্ত।
তবে প্রথমে, আমি চাপ দেবো কেন আমি কেন আপনার প্রশ্নের প্রাঙ্গনটি সুন্দর বলে মনে করি। তারপরে আমি তাদের ব্যাখ্যা থেকে বোঝাবার চেষ্টা করব কেন আপনি যে সিদ্ধান্তগুলি নিয়ে এসেছেন তা লজিস্টিক মডেলের একটি ভুল বোঝাবুঝির উপর নির্ভর করে এবং অবশেষে, আমি বিকল্প পদ্ধতির পরামর্শ দেব suggest
আমি নির্দেশ করবে আপনারএনপর্যবেক্ষণ (সাহসী বর্ণগুলি ভেক্টর বোঝায়) যাপিমাত্রিক জায়গাতে থাকে ( x এর প্রথম প্রবেশ){(xxi,yi)}ni=1nপিপি<এন, ওয়াই আই ∈[0,1]এবং এফ( এক্স ) সহ x আমি 1)এক্সএক্সআমিপি < এনYআমি∈ [ 0 , 1 ]এক্স এর একঘেয়ে কাজচ( এক্সএক্সআমি) = চ( এক্সএক্স'আমিββ) , মত বলতেলজিস্টিক বক্ররেখাফিক্স ধারণা। যুক্তিযুক্ততা জন্য, আমি শুধু অনুমান করবে এন হয়পর্যাপ্ততুলনায় বৃহৎ পি ।এক্সএক্স'আমিββএনপি
আপনি ঠিক বলেছেন যে আপনি যদি লাগানো মডেলটি মূল্যায়ন করার জন্য টিভিডি মানদণ্ড হিসাবে ব্যবহার করতে চান , তবে আপনার ডেটাতে সমস্ত সম্ভাব্য প্রার্থীর মধ্যে একই মানদণ্ডটি অপ্টিমাইজ করার জন্য আপনার ফিটটি আশা করা যুক্তিসঙ্গত। অত: পর
ββ*= তর্কসর্বনিম্নββ। আরপি| | YY- চ( এক্সএক্স'আমিββ) | |1
সমস্যাটি হচ্ছে ত্রুটি শর্ত :
এবং যদি আমরা প্রয়োগ করি (আমরা কেবল আমাদের মডেলটি নিরপেক্ষ হতে চাই ), তারপরে, ps অবশ্যই হতে হবে । এর কারণ মাত্র দুটি মূল্যবোধ, 0 এবং নিতে পারেন 1. অতএব, প্রদত্ত
, একমাত্র দুটি মানের উপর নিতে পারেন: যখন , যা সম্ভাব্যতা , এবং ঘটে যখনই ( ϵ )εআমি= yআমি- চ( এক্সএক্স'আমিββ)ϵ i y i xই( ϵ)ϵ )=0εআমি Yআমিϵ i 1-f( xএক্সএক্সআমিεআমিy i = 1 f ( x1 - চ( এক্সএক্স'আমিββ)Yআমি= 1- চ ( এক্সচ( এক্সএক্স'আমিββ)y i = 1 1 - f ( x)- চ( এক্সএক্স'আমিββ)Yআমি= 1, যা সম্ভাব্যতা সহ ঘটে ।1 - চ( এক্সএক্স'আমিββ)
এই বিবেচনাগুলি একসাথে বোঝায় যে:
var ( ϵϵ )=ই( ϵ)ε2) = ( 1 - চ( এক্সএক্স'ββ) )2চ( এক্সএক্স'ββ) + ( - চ( এক্সএক্স'ββ) )2( 1 - চ)( এক্সএক্স'ββ) )= ( 1 - চ)( এক্সএক্স'ββ))f(xx′ββ)=E(yy|xx)E(1−yy|xx)
অতএব ধ্রুবক নয় তবে অবতল প্যারাবোলা আকারযুক্ত এবং যখন এর মতো তখন সর্বাধিক হয় ।var(ϵϵ) E ( y)xxE(y|xx)≈.5
অবশিষ্টাংশের এই সহজাত বিজাতীয় পরিণতির পরিণতি রয়েছে । এটি অন্যান্য জিনিসের মধ্যে বোঝায় যে ক্ষতির ক্রিয়াকলাপটি ন্যূনতম করার সময় আপনি আপনার নমুনার অংশটিকে অতিমাত্রায় করে । অর্থাৎ, লাগানো কেবলমাত্র ডেটা ফিট করে না তবে কেবলমাত্র তার অংশটি এর মতো জায়গাগুলির মধ্যে ক্লাস্টারযুক্ত যেখানে । বুদ্ধিমান হওয়ার জন্য, এগুলি আপনার নমুনার মধ্যে সর্বনিম্ন তথ্যযুক্ত ডেটা পয়েন্ট : এগুলি সেই পর্যবেক্ষণের সাথে মিলে যায় যার জন্য শব্দের উপাদানটি বৃহত্তম। সুতরাং, আপনার ফিট pulled , যেমন তৈরি।l1ββ∗ ইxxE(yy|xx)≈.5ββ∗=ββ:f( এক্সx'ββ) ≈ .5
উপরের এক্সপোশন থেকে স্পষ্টভাবে একটি সমাধান হ'ল নিরপেক্ষ-নেসের প্রয়োজনীয়তা বাদ দেওয়া। অনুমানকারীকে পক্ষপাতিত্ব করার একটি জনপ্রিয় উপায় (সংক্ষেপে কিছু বায়েশিয়ান ব্যাখ্যা সংযুক্ত) সংকোচন শব্দটি অন্তর্ভুক্ত করে। যদি আমরা প্রতিক্রিয়াটি আবার স্কেল করি:
Y+ +আমি= 2 ( y)আমি- .5 ) , 1 ≤ i ≤ n
এবং, গণনামূলক জন্য, অন্য ফাংশন --it পরিণাম হিসাবে প্যারামিটারের ভেক্টর প্রথম উপাদান বোঝাতে জন্য সুবিধাজনক হতে হবে এবং অবশিষ্ট বেশী এবং (ফর্মের উদাহরণস্বরুপ কোনো সংকোচন শব্দটি অন্তর্ভুক্ত - ), ফলস্বরূপ অপ্টিমাইজেশান সমস্যাটি হয়ে ওঠে:ছচ( এক্সএক্স'ββ)সি পি - 1ছ( এক্সএক্স ,[সি , γγ] ) = এক্সএক্স'[ সি , γγ]গপি - 1|γγ| | γγ| |2
[ গ*, γγ*] = তর্কসর্বনিম্ন[[ সি , γγ] ∈ আরপিΣi = 1এনসর্বোচ্চ ( 0 , 1 - y)+ +আমিএক্সএক্স'আমি[[ সি , γγ] ) + 12| | γγ| |2
নোট এই নতুন (এছাড়াও উত্তল) অপ্টিমাইজেশান সমস্যা, একটি সঠিকভাবে শ্রেণীবদ্ধ পর্যবেক্ষণের জন্য শাস্তি 0 এবং এটির সাথে সুসংগত বৃদ্ধি যে একটি মিস-শ্রেণীবদ্ধ এক --as জন্য ক্ষয়। এই দ্বিতীয় অপ্টিমাইজেশান সমস্যার সমাধান সুপ্রসিদ্ধ রৈখিক svm হয় (সঙ্গে নিখুঁত বিচ্ছেদ) কোফিসিয়েন্টস। এর বিপরীতে -টাইপ পেনাল্টির সাথে ডেটা থেকে এই (পক্ষপাতের কারণে 'টাইপ') । ফলস্বরূপ, এই সমাধানটি ব্যাপকভাবে প্রয়োগ করা হয়। উদাহরণস্বরূপ আর প্যাকেজ LiblineaR দেখুন ।এক্সএক্স'[[ সি ,γ]ঠ1[ গ*, γγ*]ββ*[ গ*, γγ*]