নাইভ বেয়েস কীভাবে লিনিয়ার ক্লাসিফায়ার?


31

আমি এখানে অন্য থ্রেড দেখেছি তবে আমি মনে করি না উত্তরটি প্রকৃত প্রশ্নের সন্তুষ্ট। আমি যা নিয়মিত পড়েছি তা হ'ল নাইভ বেয়েস লিনিয়ার প্রতিক্রিয়া প্রদর্শনের সাহায্যে লিনিয়ার শ্রেণিবদ্ধ (যেমন: এখানে ) (যেমন এটি লিনিয়ার সিদ্ধান্তের সীমানা আঁকায়)।

যাইহোক, আমি দুটি গাউসিয়ান মেঘ সিমুলেটেড করে একটি সিদ্ধান্তের সীমানা লাগিয়েছি এবং ফল পেয়েছি (আরে লাইব্রেরি ই 1071, নাইভবেইস () ব্যবহার করে) 1- সবুজ, 0 - লাল

আমরা দেখতে পাচ্ছি, সিদ্ধান্তের সীমানা অ-রৈখিক। ক্লাসিফায়ার নিজেই ডেটা রৈখিকভাবে পৃথক করে না বলে প্যারামিটারগুলি (শর্তসাপেক্ষ সম্ভাবনাগুলি) লগ স্পেসে রৈখিক সংমিশ্রণ তা বলার চেষ্টা করছে?


আপনি কীভাবে সিদ্ধান্তের সীমানা তৈরি করলেন? আমি শ্রেণিবদ্ধের সত্যিকারের সিদ্ধান্তের সীমানার চেয়ে আপনার ফিটনেস রুটিনের সাথে এটি করার সন্দেহ করি। আপনার চতুষ্কোণের প্রতিটি একক সময়ে সিদ্ধান্ত গণনা করে একজন সাধারণত সিদ্ধান্তের সীমা তৈরি করতে পারে।
seanv507

এটিই আমি করলাম, আমি এক্স = [মিন (এক্স), সর্বাধিক (এক্স)] এবং ওয়াই = [মিন (ওয়াই), সর্বাধিক (ওয়াই)] এর দুটি রেঞ্জকে 0.1 এর ব্যবধানের সাথে নিয়েছি। আমি তখন সেই সমস্ত ডেটা পয়েন্ট প্রশিক্ষিত শ্রেণিবদ্ধের সাথে লাগিয়েছি এবং পয়েন্টগুলি খুঁজে পেয়েছি যে লগের বিরোধগুলি -0.05 এবং 0.05 এর মধ্যে ছিল
কেভিন পেই

উত্তর:


30

সাধারণভাবে নিষ্পাপ বায়েস শ্রেণিবদ্ধকারী লিনিয়ার নয়, তবে সম্ভাবনা কারণগুলি পরিবারগুলির থেকে থাকলে , নিষ্পাপ বয়েস শ্রেণিবদ্ধ একটি নির্দিষ্ট বৈশিষ্ট্যের জায়গাতে লিনিয়ার শ্রেণিবদ্ধের সাথে মিল রাখে correspond এটি দেখতে কিভাবে এখানে।p(xic)

আপনি যে কোনও নিরীহ বায়েস শ্রেণিবদ্ধকে লিখতে পারেন *

p(c=1x)=σ(ilogp(xic=1)p(xic=0)+logp(c=1)p(c=0)),

যেখানে হ'ল লজিস্টিক ফাংশন । যদি কোনও তাত্পর্যপূর্ণ পরিবার থেকে থাকে তবে আমরা এটি লিখতে পারিপি ( x আমিসি )σp(xic)

p(xic)=hi(xi)exp(uicϕi(xi)Ai(uic)),

এবং অতঃপর

পি(=1|এক্স)=σ(ΣআমিWআমিφআমি(এক্সআমি)+ +),

কোথায়

Wআমি=তোমার দর্শন লগ করাআমি1-তোমার দর্শন লগ করাআমি0,=লগপি(=1)পি(=0)-Σআমি(একজনআমি(তোমার দর্শন লগ করাআমি1)-একজনআমি(তোমার দর্শন লগ করাআমি0))

নোট করুন যে এটি লজিস্টিক রিগ্রেশন-এর অনুরূপ - লিনিয়ার ক্লাসিফায়ার - space দ্বারা নির্ধারিত বৈশিষ্ট্য । দুই শ্রেণীর বেশিের জন্য আমরা একত্রে বহু-জাতীয় লজিস্টিক (বা সফটম্যাক্স) রিগ্রেশন পাইφআমি

যদি গাউসিয়ান হয়, তবে এবং আমাদের ϕ i ( x i ) = ( x i , x 2 i ) w i 1পি(এক্সআমি|)φআমি(এক্সআমি)=(এক্সআমি,এক্সআমি2)

wi1=σ12μ1σ02μ0,wi2=2σ022σ12,bi=logσ0logσ1,

অভিমানী ।p(c=1)=p(c=0)=12


* এই ফলাফলটি কীভাবে অর্জন করা যায় তা এখানে:

পি(=1|এক্স)=পি(এক্স|=1)পি(=1)পি(এক্স|=1)পি(=1)+ +পি(এক্স|=0)পি(=0)=11+ +পি(এক্স|=0)পি(=0)পি(এক্স|=1)পি(=1)=11+ +মেপুঃ(-লগপি(এক্স|=1)পি(=1)পি(এক্স|=0)পি(=0))=σ(Σআমিলগপি(এক্সআমি|=1)পি(এক্সআমি|=0)+ +লগপি(=1)পি(=0))

আমি এখন যে অনুভূতিটি বুঝতে পেরেছি তার জন্য আপনাকে ধন্যবাদ, আপনি কি 2 এবং নীচের সমীকরণে স্বরলিপিগুলি ব্যাখ্যা করতে পারেন? (ইউ, এইচ (এক্স_আই), ফাই (এক্স_আই), ইত্যাদি) পি (x_i | সি) কেবল কোনও পিডিএফ থেকে মান গ্রহণ করা কোনও ক্ষতিকারক পরিবারের অধীনে?
কেভিন পেই

আপনি এক এবং একই বিতরণকে প্রকাশ করতে পারেন বিভিন্ন উপায় ways দ্বিতীয় সমীকরণটি ক্যানোনিকাল আকারে একটি সূচকীয় পরিবার বিতরণ। অনেকগুলি বিতরণ সূচকীয় পরিবার (গৌসিয়ান, ল্যাপ্লেস, ডিরিচলেট, বার্নৌলি, দ্বিপদী, কেবলমাত্র কয়েকটি নাম রাখার জন্য), তবে তাদের ঘনত্ব / ভর ফাংশন সাধারণত প্রচলিত আকারে দেওয়া হয় না। সুতরাং আপনাকে প্রথমে বিতরণটিকে পুনরায় তৈরি করতে হবে। এই টেবিলটি আপনাকে বিভিন্ন বিতরণের জন্য কীভাবে (প্রাকৃতিক প্যারামিটার) এবং (পর্যাপ্ত পরিসংখ্যান) গণনা করতে হবে তা জানায় : en.wikedia.org/wiki/Exononal_family# টেবিল_অফ_বিষয়কতোমার দর্শন লগ করাφ
লুকাস

1
গুরুত্বপূর্ণ পয়েন্টটি লক্ষ্য করুন যে । এর অর্থ কী যে লিনিয়ার শ্রেণিবদ্ধীরা একটি লিনিয়ার সংমিশ্রণ এবং বৈশিষ্ট্যগুলির সম্ভাব্য অ-রৈখিক ফাংশনগুলি! সুতরাং, মূল পোস্টারের বিন্দুতে, ডেটাপয়েন্টগুলির একটি প্লট এটি কোনও লাইনের দ্বারা পৃথকযোগ্য নয় তা দেখায়। φ(এক্স)=(এক্স,এক্স2)W
আরএমমারফি

আমি এই উত্তরটিকে বিভ্রান্তিকর বলে মনে করি: ঠিক প্রায় মন্তব্যে যেমন উল্লেখ করা হয়েছে এবং ঠিক ঠিক নীচে উত্তর দেওয়া হয়েছে যে গাউসিয়ান নিখাদ বায়েস মূল বৈশিষ্ট্যের জায়গাতে লিনিয়ার নয়, তবে এগুলির একটি অ-লিনিয়ার রূপান্তরিত। সুতরাং এটি প্রচলিত লিনিয়ার শ্রেণিবদ্ধ নয়।
গ্যাল ভেরাকোয়াক্স

কেন গসিয়ান, তারপর ? আমি মনে করি গাউসীয় বিতরণের জন্য পর্যাপ্ত পরিসংখ্যান হওয়া উচিত । φ আমি ( এক্স আমি ) = ( x এর আমি , এক্স 2 আমি ) টি ( X ) এক্স / σপি(এক্সআমি|)φআমি(এক্সআমি)=(এক্সআমি,এক্সআমি2)টি(এক্স)এক্স/σ
নাওমি

8

এটি শুধুমাত্র লিনিয়ার যদি শ্রেণি শর্তসাপেক্ষে ভেরিয়েন্স ম্যাট্রিকগুলি উভয় শ্রেণির জন্য একই থাকে। এটি দেখতে লগ পোস্টারিয়রগুলির রেশন লিখুন এবং যদি সম্পর্কিত বৈকল্পগুলি একই হয় তবে আপনি কেবল এটির থেকে একটি লিনিয়ার ফাংশন পাবেন। অন্যথায় এটি চতুর্ভুজ।


3

আমি একটি অতিরিক্ত পয়েন্ট যোগ করতে চাই: কিছু "বিভ্রান্তির কারণ" নায়েভ বেয়েস শ্রেণিবিন্যাস "করার অর্থ কী তা নিয়েই স্থির রয়েছে।

"গাউসীয় বৈষম্যমূলক বিশ্লেষণ (জিডিএ)" এর বিস্তৃত বিষয়ের অধীনে বেশ কয়েকটি কৌশল রয়েছে: কিউডিএ, এলডিএ, জিএনবি, এবং ডিএলডিএ (চতুর্ভুজ ডিএ, লিনিয়ার ডিএ, গাউসিয়ান বোদ্ধাগুলি, তির্যক এলডিএ)। [আপডেট হওয়া] প্রদত্ত ভবিষ্যদ্বাণীকারীদের জায়গায় এলডিএ এবং ডিএলডিএ লিনিয়ার হওয়া উচিত। (দেখুন, উদাহরণস্বরূপ, মার্ফি , 4.2, পৃষ্ঠা। 101 এর জন্য ডিএ এবং পৃষ্ঠা 82 এর জন্য এনবি। দ্রষ্টব্য: জিএনবি অগত্যা রৈখিক নয় Disc বিচ্ছিন্ন এনবি (যা হুডের অধীনে বহু-জাতীয় বিতরণ ব্যবহার করে) লিনিয়ার। আপনি ডুডাও পরীক্ষা করে দেখতে পারেন , হার্ট অ্যান্ড স্টার্ক বিভাগ 2.6)। কিউডিএ চতুর্ভুজযুক্ত যেমন অন্যান্য উত্তরগুলি নির্দেশ করেছে (এবং যা আমি মনে করি যা আপনার গ্রাফিকের মধ্যে ঘটছে - নীচে দেখুন)।

Σ

  • Σ
  • Σ=Σ
  • Σ=আমিএকটি
  • Σ=আমিএকটি

যদিও ই 1071 এর নথিগুলি দাবি করেছে যে এটি শ্রেণিবদ্ধ শর্তাধীন স্বাধীনতা ধরে নিচ্ছে (যেমন, জিএনবি), আমি সন্দেহ করছি যে এটি আসলে কিউডিএ করছে। কিছু লোক "সরল বায়েশিয়ান শ্রেণিবিন্যাসের বিধি" দিয়ে "নিষ্পাপ বয়েস" (স্বাধীন ধারণা অনুধাবন) করে। জিডিএর সমস্ত পদ্ধতি পরবর্তী থেকে প্রাপ্ত; তবে কেবলমাত্র জিএনবি এবং ডিএলডিএই প্রাক্তন ব্যবহার করে।

একটি বড় সতর্কতা, আমি এটি করছে কি তা নিশ্চিত করার জন্য e1071 উত্স কোডটি পড়িনি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.