সংক্ষেপে, লজিস্টিক রিগ্রেশনটির সম্ভাব্য ধারণা রয়েছে যা এমএলে শ্রেণিবদ্ধ ব্যবহারের বাইরে চলে যায়। লজিস্টিক রিগ্রেশন সম্পর্কে আমার এখানে কিছু নোট রয়েছে ।
লজিস্টিক রিগ্রেশনে অনুমান একটি রৈখিক মডেলের উপর ভিত্তি করে বাইনারি ফলাফলের ঘটনায় অনিশ্চয়তার একটি পরিমাপ সরবরাহ করে। আউটপুটটি asyptotically এবং মধ্যে আবদ্ধ হয় এবং লিনিয়ার মডেলটির উপর নির্ভর করে, যেমন অন্তর্নিহিত রিগ্রেশন লাইনের মান হলে লজিস্টিক সমীকরণ সরবরাহ করে শ্রেণিবিন্যাসের উদ্দেশ্যে একটি প্রাকৃতিক কাট অফ পয়েন্ট। যাইহোক, এটি result এর প্রকৃত ফলাফলের সম্ভাব্যতার তথ্য ছড়িয়ে দেওয়ার ব্যয় is , যা প্রায়শই আকর্ষণীয় (যেমন loanণ খেলাপির প্রদত্ত সম্ভাবনা, প্রদত্ত আয়, ক্রেডিট স্কোর, বয়স ইত্যাদি)।0100.5=e01+e0h(ΘTx)=eΘTx1+eΘTx
Perceptron শ্রেণীবিন্যাস অ্যালগরিদম আরো একটি মৌলিক পদ্ধতি, মধ্যে ডট পণ্যে ভিত্তিক উদাহরণ এবং ওজন । যখনই কোনও উদাহরণ ভুল শৃঙ্খলাবদ্ধ হয় তবে প্রশিক্ষণ শ্রেণিবদ্ধকরণ মান ( এবং ) এর সাথে ডট পণ্যটির সাইন দ্বন্দ্ব হয় । এটি সংশোধন করার জন্য, উদাহরণস্বরূপ ভেক্টরটি পুনরাবৃত্তভাবে ওজন বা সহগের ভেক্টর থেকে সংযুক্ত বা বিয়োগ করা হবে, ক্রমান্বয়ে এর উপাদানগুলি আপডেট করে:−11
ভেক্টরিয়ালি, উদাহরণস্বরূপের বৈশিষ্ট্য বা বৈশিষ্ট্যগুলি হ'ল , এবং ধারণাটি "পাস" করা হয় যদি:dx
∑1dθixi>theshold বা ...
h(x)=sign(∑1dθixi−theshold) । লজিস্টিক রিগ্রেশন এবং এর বিপরীতে সাইন ফাংশনটির ফলাফল বা ।1−101
প্রান্তিকটি পক্ষপাত সহগ, শোষিত হবে । সূত্রটি এখন:+θ0
h(x)=sign(∑0dθixi) , বা ভেক্টরাইজড: ।h(x)=sign(θTx)
Misclassified পয়েন্ট থাকবে , যার মানে হল এর ডট পণ্য এবং ইতিবাচক (একই দিক ভেক্টর) হতে হবে যখন নেতিবাচক হয়, অথবা ডট পণ্যটি নেতিবাচক হবে (বিপরীত দিকের ভেক্টর), যখন ইতিবাচক।sign(θTx)≠ynΘxnynyn
আমি একই কোর্স থেকে একটি ডেটাসেটে এই দুটি পদ্ধতির মধ্যে পার্থক্য নিয়ে কাজ করছি , যেখানে দুটি পৃথক পরীক্ষায় পরীক্ষার ফলাফল কলেজের চূড়ান্ত গ্রহণের সাথে সম্পর্কিত:
সিদ্ধান্তের সীমানাটি সহজেই লজিস্টিক রিগ্রেশন সহ সন্ধান করা যায়, তবে এটি আকর্ষণীয় ছিল যে পার্সেপট্রন সহ প্রাপ্ত সহগগুলি লজিস্টিক রিগ্রেশনের তুলনায় সম্পূর্ণ আলাদা ছিল, তবে ফলাফলের জন্য ফাংশনের সহজ প্রয়োগ application একটি শ্রেণিবদ্ধ অ্যালগরিদম ঠিক যেমন ভাল। প্রকৃতপক্ষে সর্বাধিক নির্ভুলতা (কিছু উদাহরণের লিনিয়ার অবিচ্ছেদ্যতার দ্বারা সীমা নির্ধারিত) দ্বিতীয় পুনরাবৃত্তির মাধ্যমে পৌঁছেছিল। গুণমানের একটি এলোমেলো ভেক্টর থেকে শুরু করে পুনরাবৃত্তিগুলি ওজনের প্রায় কাছাকাছি হওয়ায় সীমানা বিভাগ রেখার ক্রমটি এখানে রয়েছে :sign(⋅)10
পুনরাবৃত্তির সংখ্যার ফাংশন হিসাবে শ্রেণিবদ্ধে যথার্থতা দ্রুত বৃদ্ধি পায় এবং এ মালভূমি90%
ব্যবহৃত কোডটি এখানে ।