বায়েস শ্রেণিবদ্ধের সাথে কেন আমরা সর্বাধিক পারফরম্যান্স অর্জন করতে পারি? এর আনুষ্ঠানিক প্রমাণ / ব্যাখ্যা কী?
সাধারণত, একটি ডেটা্যাসেট আপনার ডেটা উত্পন্ন করে এমন বিতরণে iid নমুনা নিয়ে গঠিত বলে বিবেচিত হয় । তারপরে, আপনি প্রদত্ত ডেটা থেকে ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করেন: একটি নমুনা দেওয়া , আপনি শ্রেণীর পূর্বাভাস , যেখানে নমুনার আসল শ্রেণি হল ।Dnxixiচ ( এক্স আমি ) চ ( এক্স আমি )f^(xi)চ( এক্সআমি)
তবে তাত্ত্বিকভাবে, আপনি কোনও নির্দিষ্ট মডেল না বেছে নেওয়ার সিদ্ধান্ত নিতে পারেন , তবে সমস্ত সম্ভাব্য মডেলগুলি once একবারে বিবেচনা করুন এবং সেগুলি কোনওভাবে একটি বড় মডেল ।চ^নির্বাচিত চ এফচ^এফ^
অবশ্যই, ডেটা দেওয়া, অনেক ছোট মডেলগুলি বেশ অসম্ভব বা অনুপযুক্ত হতে পারে (উদাহরণস্বরূপ, এমন মডেলগুলি যা আপনার ডেটাसेट লক্ষ্যমাত্রার একাধিক মান থাকা সত্ত্বেও লক্ষ্যমাত্রার একমাত্র মান পূর্বাভাস দেয় )।ডি
যে কোনও ক্ষেত্রে, আপনি নতুন নমুনাগুলির লক্ষ্য মানটি পূর্বাভাস দিতে চান, যা s এর সমান বন্টন থেকে আঁকা । আপনার মডেলের পারফরম্যান্সের
একটি ভাল পরিমাপ হ'ল অর্থাৎ আপনার সম্ভাব্যতার পূর্বাভাস এলোমেলোভাবে নমুনাযুক্ত জন্য সঠিক টার্গেট মান ।এক্সআমিইe ( মডেল ) = পি[ চ( এক্স) = মডেল ( এক্স) ] ,
এক্স
ব্যবহার বায়েসের সূত্র, আপনি গনা করতে পারেন, কোনটা সম্ভাব্যতা একটি নতুন নমুনা যে লক্ষ্য মান আছে , ডাটা দেওয়া :xvD
P(v∣D)=∑f^P(v∣f^)P(f^∣D).
একটিকে জোর দেওয়া উচিত
- সাধারণত হয় বা , যেহেতু একটি প্রতিরোধমূলক ক্রিয়া ,P(v∣f^)01চ এক্সf^x
- সাধারণত নয়, তবে প্রায় সব সময়ই (পূর্বোক্ত তুচ্ছ মামলার ব্যতীত অনুমান করা অসম্ভব ,P(f^∣D)
- উপরের যোগফলটি মূল্যায়নের জন্য সাধারণত নয়, প্রায় সবসময়ই সম্ভাব্য মডেলগুলির সংখ্যা too খুব বড়।f^
অতএব, বেশিরভাগ ক্ষেত্রে অর্জন / অনুমান করা খুব কঠিন ।P(v∣D)
এখন, আমরা অনুকূল বেইস শ্রেণিবদ্ধের দিকে এগিয়ে যাই। প্রদত্ত , এটি মান
যেহেতু এই সবথেকে সম্ভাব্য মান মধ্যে সম্ভাব্য সব লক্ষ্য মান হয় , সর্বাপেক্ষা কাম্য বায়েসের ক্লাসিফায়ার কর্মক্ষমতা পরিমাপ maximizes ।xv^=argmaxv∑f^P(v∣f^)P(f^∣D).
ve(f^)
যেহেতু আমরা সবসময় অন্যান্য শ্রেণিবদ্ধের পারফরম্যান্সের তুলনা করার জন্য বেইস শ্রেণিবদ্ধকে একটি মানদণ্ড হিসাবে ব্যবহার করি।
সম্ভবত, আপনি বেয়েস শ্রেণিবদ্ধের भोটি সংস্করণ ব্যবহার করেন । এটি কার্যকর করা সহজ, বেশিরভাগ সময় যুক্তিসঙ্গতভাবে ভাল কাজ করে তবে একটি নির্দোষ অনুমান গণনা করে ।P(v∣D)