"..প্রতিবন্ধের মাধ্যমে প্রবন্ধের শ্রেণিবদ্ধকরণ সমস্যা .." "প্রতিরোধের " দ্বারা আমি ধরে নিচ্ছি যে আপনি লিনিয়ার রিগ্রেশন বোঝাতে চাইছেন এবং আমি এই পদ্ধতির সাথে লজিস্টিক রিগ্রেশন মডেল লাগানোর "শ্রেণিবিন্যাস" পদ্ধতির সাথে তুলনা করব।
আমরা এটি করার আগে, রিগ্রেশন এবং শ্রেণিবিন্যাসের মডেলগুলির মধ্যে পার্থক্যটি স্পষ্ট করা গুরুত্বপূর্ণ। রিগ্রেশন মডেল বৃষ্টিপাতের পরিমাণ বা সূর্যালোকের তীব্রতার মতো অবিচ্ছিন্ন পরিবর্তনশীল হিসাবে পূর্বাভাস দেয়। তারা সম্ভাব্যতা যেমন ভবিষ্যদ্বাণী করতে পারে যেমন কোনও চিত্রের মধ্যে একটি বিড়াল রয়েছে ability কোনও সম্ভাব্যতা-ভবিষ্যদ্বাণীমূলক রিগ্রেশন মডেল কোনও সিদ্ধান্তের নিয়ম চাপিয়ে শ্রেণিবদ্ধের অংশ হিসাবে ব্যবহার করা যেতে পারে - উদাহরণস্বরূপ, যদি সম্ভাবনা 50% বা তার বেশি হয় তবে সিদ্ধান্ত নিন এটি একটি বিড়াল।
লজিস্টিক রিগ্রেশন সম্ভাব্যতার পূর্বাভাস দেয় এবং তাই রিগ্রেশন অ্যালগরিদম। তবে এটি সাধারণত মেশিন লার্নিং সাহিত্যে শ্রেণিবদ্ধকরণ পদ্ধতি হিসাবে বর্ণনা করা হয়, কারণ এটি শ্রেণিবদ্ধকরণ করতে ব্যবহৃত হতে পারে (এবং প্রায়শই ব্যবহৃত হয়)। এসভিএম এর মতো "সত্য" শ্রেণিবদ্ধকরণ অ্যালগরিদমগুলিও রয়েছে যা কেবল কোনও ফলাফলের পূর্বাভাস দেয় এবং কোনও সম্ভাবনা সরবরাহ করে না। আমরা এখানে এই ধরণের অ্যালগরিদম নিয়ে আলোচনা করব না।
শ্রেণিবিন্যাস সমস্যাগুলিতে লিনিয়ার বনাম লজিস্টিক রিগ্রেশন
অ্যান্ড্রু এনজি যেমন এটি ব্যাখ্যা করেছেন , লিনিয়ার রিগ্রেশন সহ আপনি ডেটাগুলির মাধ্যমে একটি বহুবর্ষের সাথে মাপসই হন - বলুন, নীচের উদাহরণের মতো আমরা একটি {টিউমার আকার, টিউমার ধরণের} নমুনা সেটের মাধ্যমে একটি সরল রেখায় ফিট করছি :
উপরে, ম্যালিগন্যান্ট টিউমারগুলি এবং অ-ম্যালিগন্যান্টগুলি এবং সবুজ লাইনটি আমাদের অনুমান । পূর্বাভাস দেওয়ার জন্য আমরা বলতে পারি যে কোনও প্রদত্ত টিউমার আকার , চেয়ে বড় হয়ে গেলে আমরা ম্যালিগন্যান্ট টিউমারটির পূর্বাভাস দিই, অন্যথায় আমরা সৌম্যর ভবিষ্যদ্বাণী করি।10h(x)xh(x)0.5
দেখে মনে হচ্ছে এইভাবে আমরা প্রতিটি একক প্রশিক্ষণ সেট নমুনার সঠিকভাবে পূর্বাভাস দিতে পারি, তবে এখন আসুন কার্যটি কিছুটা পরিবর্তন করা যাক।
স্বজ্ঞাতভাবে এটি স্পষ্ট যে সমস্ত টিউমার বৃহত্তর নির্দিষ্ট থ্রেশহোল্ডগুলি মারাত্মক। সুতরাং আসুন একটি বিশাল টিউমার আকার সহ অন্য একটি নমুনা যুক্ত করুন এবং আবার রৈখিক প্রতিরোধ চালান:
এখন আমাদের আর কাজ করে না। সঠিক ভবিষ্যদ্বাণী করা চালিয়ে যেতে আমাদের এটিকে বা অন্য কোনও কিছুতে পরিবর্তন করতে হবে - তবে এটি কীভাবে অ্যালগরিদমটি কাজ করা উচিত নয়।h(x)>0.5→malignanth(x)>0.2
প্রতিবার নতুন নমুনা এলে আমরা হাইপোথিসিসটি পরিবর্তন করতে পারি না। পরিবর্তে, আমাদের এটি প্রশিক্ষণ সেট ডেটা থেকে শিখতে হবে এবং তারপরে (আমরা যে অনুমানটি শিখেছি তা ব্যবহার করে) আমরা যে ডেটা আগে দেখিনি সেগুলির জন্য সঠিক ভবিষ্যদ্বাণী করা উচিত।
আশা করি এটি ব্যাখ্যা করে যে কেন শ্রেণিবিন্যাসের সমস্যার জন্য লিনিয়ার রিগ্রেশন সবচেয়ে উপযুক্ত নয়! এছাড়াও, আপনি VI দেখতে চাইবেন । পণ্য সরবরাহ সংশ্লেষণ. বিভাগ ভিডিও ml-class.org যা আরো বিস্তারিত ধারণা ব্যাখ্যা করে।
সম্পাদনা
সম্ভাব্যতা ব্লগ জিজ্ঞাসা করেছিল একটি ভাল শ্রেণিবদ্ধকারী কী করবে। এই বিশেষ উদাহরণে আপনি সম্ভবত লজিস্টিক রিগ্রেশন ব্যবহার করবেন যা এই জাতীয় অনুমানটি শিখতে পারে (আমি কেবল এটি তৈরি করছি):
মনে রাখবেন যে লিনিয়ার রিগ্রেশন এবং লজিস্টিক রিগ্রেশন উভয়ই আপনাকে একটি সরল রেখা দেয় (বা উচ্চতর অর্ডার বহুপদী) তবে এই রেখার আলাদা অর্থ রয়েছে:
- h(x) রৈখিক রিগ্রেশনের interpolates, অথবা অবলুপ্তি, আউটপুট এবং মান অনুমান আমরা দেখতে পাইনি। এটি কেবলমাত্র নতুন প্লাগ করা এবং একটি কাঁচা নম্বর পাওয়ার মতো এবং ভবিষ্যদ্বাণী করা, {গাড়ির আকার, গাড়ির বয়স} ইত্যাদির উপর ভিত্তি করে গাড়ির দাম বলার মতো কাজের জন্য আরও উপযুক্তxx
- h(x)লজিস্টিক রিগ্রেশন এর জন্য আপনাকে সম্ভাব্যতা জানায় যে "ধনাত্মক" শ্রেণীর অন্তর্গত। এ কারণেই এটিকে একটি রিগ্রেশন অ্যালগরিদম বলা হয় - এটি একটি অবিচ্ছিন্ন পরিমাণ, সম্ভাবনা অনুমান করে। যাইহোক, আপনি যদি সম্ভাব্যতার উপর একটি প্রান্তিক সেট স্থাপন করেন, যেমন , আপনি একটি শ্রেণিবদ্ধকারী পাবেন এবং অনেক ক্ষেত্রে লজিস্টিক রিগ্রেশন মডেল থেকে আউটপুট দিয়ে এটি করা হয়। এটি প্লটের উপর একটি লাইন রাখার সমতুল্য: শ্রেণিবদ্ধ রেখার উপরে বসে সমস্ত পয়েন্টগুলি একটি শ্রেণির অন্তর্গত, যখন নীচের পয়েন্টগুলি অন্য শ্রেণীর অন্তর্গত।x h ( x ) > 0.5xh(x)>0.5
সুতরাং, নীচের লাইনটি হ'ল শ্রেণিবিন্যাসের দৃশ্যে আমরা রিগ্রেশন দৃশ্যের চেয়ে সম্পূর্ণ ভিন্ন যুক্তি এবং সম্পূর্ণ ভিন্ন অ্যালগরিদম ব্যবহার করি ।