বেইস ক্লাসিফায়ার কেন আদর্শ শ্রেণিবদ্ধ?


11

এটি আদর্শ কেস হিসাবে বিবেচনা করা হয় যেখানে বিভাগগুলির অন্তর্গত সম্ভাব্যতা কাঠামোটি পুরোপুরি জানা যায় is

বায়েস শ্রেণিবদ্ধের সাথে কেন আমরা সর্বাধিক পারফরম্যান্স অর্জন করতে পারি?

এর আনুষ্ঠানিক প্রমাণ / ব্যাখ্যা কী? যেহেতু আমরা সবসময় অন্যান্য শ্রেণিবদ্ধের পারফরম্যান্সের তুলনা করার জন্য বেইস শ্রেণিবদ্ধকে একটি মানদণ্ড হিসাবে ব্যবহার করি।

উত্তর:


9

বায়েস শ্রেণিবদ্ধের সাথে কেন আমরা সর্বাধিক পারফরম্যান্স অর্জন করতে পারি? এর আনুষ্ঠানিক প্রমাণ / ব্যাখ্যা কী?

সাধারণত, একটি ডেটা্যাসেট আপনার ডেটা উত্পন্ন করে এমন বিতরণে iid নমুনা নিয়ে গঠিত বলে বিবেচিত হয় । তারপরে, আপনি প্রদত্ত ডেটা থেকে ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করেন: একটি নমুনা দেওয়া , আপনি শ্রেণীর পূর্বাভাস , যেখানে নমুনার আসল শ্রেণি হল ।Dnxixi ( এক্স আমি ) ( এক্স আমি )f^(xi)f(xi)

তবে তাত্ত্বিকভাবে, আপনি কোনও নির্দিষ্ট মডেল না বেছে নেওয়ার সিদ্ধান্ত নিতে পারেন , তবে সমস্ত সম্ভাব্য মডেলগুলি once একবারে বিবেচনা করুন এবং সেগুলি কোনওভাবে একটি বড় মডেল ।f^chosen এফf^F^

অবশ্যই, ডেটা দেওয়া, অনেক ছোট মডেলগুলি বেশ অসম্ভব বা অনুপযুক্ত হতে পারে (উদাহরণস্বরূপ, এমন মডেলগুলি যা আপনার ডেটাसेट লক্ষ্যমাত্রার একাধিক মান থাকা সত্ত্বেও লক্ষ্যমাত্রার একমাত্র মান পূর্বাভাস দেয় )।D

যে কোনও ক্ষেত্রে, আপনি নতুন নমুনাগুলির লক্ষ্য মানটি পূর্বাভাস দিতে চান, যা s এর সমান বন্টন থেকে আঁকা । আপনার মডেলের পারফরম্যান্সের একটি ভাল পরিমাপ হ'ল অর্থাৎ আপনার সম্ভাব্যতার পূর্বাভাস এলোমেলোভাবে নমুনাযুক্ত জন্য সঠিক টার্গেট মান ।xie

e(model)=P[f(X)=model(X)],
X

ব্যবহার বায়েসের সূত্র, আপনি গনা করতে পারেন, কোনটা সম্ভাব্যতা একটি নতুন নমুনা যে লক্ষ্য মান আছে , ডাটা দেওয়া :xvD

P(vD)=f^P(vf^)P(f^D).
একটিকে জোর দেওয়া উচিত

  • সাধারণত হয় বা , যেহেতু একটি প্রতিরোধমূলক ক্রিয়া ,P(vf^)01 এক্সf^x
  • সাধারণত নয়, তবে প্রায় সব সময়ই (পূর্বোক্ত তুচ্ছ মামলার ব্যতীত অনুমান করা অসম্ভব ,P(f^D)
  • উপরের যোগফলটি মূল্যায়নের জন্য সাধারণত নয়, প্রায় সবসময়ই সম্ভাব্য মডেলগুলির সংখ্যা too খুব বড়।f^

অতএব, বেশিরভাগ ক্ষেত্রে অর্জন / অনুমান করা খুব কঠিন ।P(vD)

এখন, আমরা অনুকূল বেইস শ্রেণিবদ্ধের দিকে এগিয়ে যাই। প্রদত্ত , এটি মান যেহেতু এই সবথেকে সম্ভাব্য মান মধ্যে সম্ভাব্য সব লক্ষ্য মান হয় , সর্বাপেক্ষা কাম্য বায়েসের ক্লাসিফায়ার কর্মক্ষমতা পরিমাপ maximizes ।x

v^=argmaxvf^P(vf^)P(f^D).
ve(f^)

যেহেতু আমরা সবসময় অন্যান্য শ্রেণিবদ্ধের পারফরম্যান্সের তুলনা করার জন্য বেইস শ্রেণিবদ্ধকে একটি মানদণ্ড হিসাবে ব্যবহার করি।

সম্ভবত, আপনি বেয়েস শ্রেণিবদ্ধের भोটি সংস্করণ ব্যবহার করেন । এটি কার্যকর করা সহজ, বেশিরভাগ সময় যুক্তিসঙ্গতভাবে ভাল কাজ করে তবে একটি নির্দোষ অনুমান গণনা করে ।P(vD)


বেয়েস শ্রেণিবদ্ধকারী (নিষ্পাপ বেয়েস নয়) কি বেয়েস অনুকূল শ্রেণিবদ্ধের মতো ???? এবং এর পূর্ব সম্ভাবনা কি? P(v|f)
রুইকিউ

@RuiQi আমি মনে করি না যেমন জিনিস নেই না বায়েসের ক্লাসিফায়ার। আমি নিষ্পাপ বায়েস শ্রেণিবদ্ধ এবং সর্বোত্তম বেয়েস শ্রেণিবদ্ধ সম্পর্কে সচেতন।
আঁটোইন

@RuiQi সম্ভাব্যতা করে একটি নমুনা শ্রেণীবদ্ধ করা বর্গ পড়া হবে যদি আমরা ভবিষ্যদ্বাণীপূর্ণ মডেল ব্যবহার । আমার ধারণা, আপনি এটিকে পূর্ব সম্ভাবনা বলতে পারেন call P(vf^)vf^
আঁটোইন

0

শ্রেণিবদ্ধের সাফল্যের হারের পরিপ্রেক্ষিতে পারফরম্যান্স সম্ভাবনার সাথে সম্পর্কিত যে সত্যিকার শ্রেণি পূর্বাভাসীকৃত শ্রেণি সমান ।CTCP

আপনি বৈশিষ্ট্য ভেক্টরের সব সম্ভব পরিস্থিতিতে উপর অবিচ্ছেদ্য হিসাবে এই সম্ভাবনা প্রকাশ করতে পারত (অথবা যোগফল যখন বিযুক্ত হয়) এবং শর্তাধীন সম্ভাব্যতা তাদের জন্য সঠিক শ্রেণীভুক্ত করতেXXx

P(CT=CP)=all possible Xf(x)P(CT=CP|x)dx

যেখানে বৈশিষ্ট্য ভেক্টর সম্ভাবনা ঘনত্ব ।f(x)X

যদি বৈশিষ্ট্যগুলির কয়েকটি সম্ভাব্য সেট , কোনও শ্রেণিবদ্ধকারী সেই বৈশিষ্ট্যগুলির সেটের জন্য সর্বাধিক সম্ভাব্য শ্রেণী নির্বাচন না করে তবে এটির উন্নতি করা যেতে পারে।x

বেইস শ্রেণিবদ্ধকারী সর্বদা বৈশিষ্ট্যগুলির প্রতিটি সেটের জন্য সর্বাধিক সম্ভাবনাময় শ্রেণি নির্বাচন করে ( শব্দটি সর্বাধিক), সুতরাং এটি বৈশিষ্ট্যগুলির উপর ভিত্তি করে নয়, উপর উন্নত করা যায় না ।xP(CT=CP|x)x

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.