নিষ্কলুষ বেয়াস শ্রেণিবদ্ধ কেন 0-1 লোকসানের জন্য অনুকূল?


13

নাইভ বেইস শ্রেণিবদ্ধকারীটি শ্রেণিবদ্ধকারী যা ক্লাস-সদস্যতার জন্য উত্তরাধিকারী পি ( সি | এক্স ) সর্বাধিক করার উপর ভিত্তি করে ক্লাস সিতে আইটেম বরাদ্দ করে এবং ধরে নেয় যে আইটেমের বৈশিষ্ট্যগুলি স্বাধীন।xCP(C|x)

0-1 ক্ষতি হ'ল ক্ষতি যা কোনও মিস-শ্রেণিবিন্যাসকে "1" এর ক্ষতি এবং যে কোনও সঠিক শ্রেণিবিন্যাসের জন্য "0" এর ক্ষতির দায়িত্ব দেয়।

আমি প্রায়শই পড়ি (1) যে "নেভ বেইস" শ্রেণিবদ্ধ, 0-1 এর ক্ষতির জন্য সর্বোত্তম। এটা সত্য কেন?

(1) একটি অনুকরণীয় উত্স: বেয়েস শ্রেণিবদ্ধ এবং বয়েস ত্রুটি


2
আপনি কি আপনার বক্তব্যের জন্য একটি রেফারেন্স সরবরাহ করতে পারেন, " আমি প্রায়শই পড়েছি যে" নেভ বেইস "শ্রেণিবদ্ধ, 0-1 লোকসানের পক্ষে অনুকূল "? যেমন আপনি অতীতে এই ধরণের বিবৃতিটি কোথায় পড়ে থাকতে পারেন
জন

1
সম্পাদিত, অনুকরণীয় উত্স যুক্ত হয়েছে

উত্তর:


16

আসলে এটি বেশ সহজ: বেইস শ্রেণিবদ্ধকারী এমন ক্লাসটি চয়ন করে যা ঘটনাক্রমে সবচেয়ে বেশি উত্তরোত্তর সম্ভাবনা থাকে (যাকে বলা হয় সর্বাধিক উত্তরোত্তর অনুমান )। 0-1 ক্ষতি ফাংশন স্থগিত misclassification, IE এটা সমাধান সঠিক শ্রেণীবিভাগেরও সর্বাধিক সংখ্যা আছে যা থেকে ক্ষুদ্রতম ক্ষতি নির্ধারণ করা হয়। সুতরাং উভয় ক্ষেত্রে আমরা মোড অনুমানের কথা বলছি । এই মোডটি স্মরণ করুন যে ডেটাসেটে সর্বাধিক সাধারণ মান , বা সর্বাধিক সম্ভাব্য মান , সুতরাং উত্তরোত্তর সম্ভাবনা সর্বাধিক করে তোলা এবং 0-1 ক্ষতি হ্রাস উভয়ই মোডটি অনুমানের দিকে নিয়ে যায়।

আপনার যদি কোনও আনুষ্ঠানিক প্রমাণের প্রয়োজন হয় তবে সেগুলি অ্যাঞ্জেলা জে ইউয়ের দ্বারা বায়সিয়ান ডিসিশন থিওরি পেপারের ভূমিকাতে দেওয়া হয়েছে :

0-1 বাইনারি ক্ষয় ফাংশন নিম্নলিখিত ফর্ম রয়েছে:

lx(s^,s)=1δs^s={1ifs^s0otherwise

যেখানে ক্রোনেকার ডেল্টা ফাংশন। (...) প্রত্যাশিত ক্ষতি হ'ল:δ

Lx(s^)=slx(s^,s)P(s=sx)=s(1δs^s)P(s=sx)=sP(s=sx)dssδs^sP(s=sx)=1P(s=sx)

এটি সাধারণভাবে একটি পোস্টেরিয়েরি অনুমানের জন্য সত্য। সুতরাং আপনি যদি উত্তরোত্তর বিতরণটি জানেন , তবে 0-1 লোকসান ধরে ধরে, সর্বোত্তম শ্রেণিবিন্যাসের নিয়মটি উত্তরোত্তর বিতরণের মোড গ্রহণ করা হয়, আমরা এটিকে অনুকূল বেইস শ্রেণিবদ্ধ বলি । বাস্তব জীবনে আমরা সাধারণত উত্তরোত্তর বিতরণ জানি না, তবে আমরা এটি অনুমান করি। নায়েভ বেয়েস শ্রেণিবদ্ধকারী অনুশীলনমূলক বিতরণ দেখে এবং ভবিষ্যদ্বাণীকারীদের স্বাধীনতা ধরে ধরে অনুকূল শ্রেণিবদ্ধের কাছাকাছি চলে যায়। সুতরাং নিষ্পাপ বায়েস শ্রেণিবদ্ধকারী নিজেই অনুকূল নয়, তবে এটি সর্বোত্তম সমাধানটির সান্নিধ্যে। আপনার প্রশ্নে আপনি এই দুটি জিনিসকে বিভ্রান্ত করছেন বলে মনে হচ্ছে।


আমি মনে করি আমি বুঝতে পেরেছি: সুতরাং আনুষ্ঠানিক প্রমাণটি হারাতে হবে লস (ক্রিয়া_1) = 1-পি (ক্রিয়াকলাপ 3 | ডেটা) এর লাইনে কিছু হবে <--- আমরা এটি হ্রাস করতে চাই। এটি আবার হ্রাস করা হ'ল আবার সঠিক শ্রেণির পূর্বের সর্বাধিককরণের সমান (অর্থাত্ সর্বাধিক পি (ক্রিয়া 2 | ডেটা)) What যা আমাকে বিভ্রান্ত করে, তাই কেন প্রতিটি শ্রেণিবদ্ধ এই সম্মানের সাথে সর্বোত্তম হবে না - কারণ এটি মনে হয় এটিই সবচেয়ে মৌলিক প্রয়োজনীয়তা requirement ক্লাসে একটি ডেটাসম্পল নিয়োগের জন্য। তাই আমরা যদি সর্বদা উচ্চতর উত্তরোত্তর সহ ক্লাসে আমাদের ডেটাসম্পলটি অর্পণ করতে পছন্দ করি, তবে আমরা কি স্বয়ংক্রিয়ভাবে এই

@ টেস্টগুয়েস্ট আনুষ্ঠানিক প্রমাণের জন্য আমার সম্পাদনা পরীক্ষা করুন।
টিম

আমি এই জাতীয় প্রমাণের জন্য এটি দেখেছি সবচেয়ে জটিল আনুষ্ঠানিকতা :)) তবে আপনাকে ধন্যবাদ, আমি আশা করি এটি অন্যকেও সহায়তা করবে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.