কেন কেউ বায়েশিয়ান বহুজাতিক নয়েভ বেয়েস শ্রেণিবদ্ধ ব্যবহার করে না?


15

সুতরাং (অপ্রচলিত) পাঠ্য মডেলিংয়ে, লেটেন্ট ডিরিচলেট অ্যালোকেশন (এলডিএ) হ'ল সম্ভাবনাবাদী ল্যাটেন্ট সেমেন্টিক অ্যানালাইসিস (পিএলএসএ) এর একটি বয়েসিয়ান সংস্করণ। মূলত, এলডিএ = পিএলএসএ + ডিরিচলেট এর পরামিতিগুলির আগে। আমার বোধগম্যতা হল যে এলডিএ এখন রেফারেন্স অ্যালগরিদম এবং বিভিন্ন প্যাকেজগুলিতে প্রয়োগ করা হয়েছে, যখন পিএলএসএ আর ব্যবহার করা উচিত নয়।

তবে (তত্ত্বাবধানে) পাঠ্য শ্রেণীবদ্ধকরণে আমরা বহুজাতিক নেভ বেয়েস শ্রেণিবদ্ধের জন্য ঠিক একই জিনিসটি করতে পেরেছি এবং প্যারামিটারগুলির আগে একটি ডিরিচলেট রেখেছিলাম। তবে আমি কখনই কাউকে এটি করতে দেখিনি বলে মনে করি না, এবং বহুজাতিক নয়েভ বায়াসের "পয়েন্ট অ্যাস্টিমেট" সংস্করণটি বেশিরভাগ প্যাকেজগুলিতে প্রয়োগ করা সংস্করণ বলে মনে হয়। এর কোনও কারণ আছে কি?

উত্তর:


7

এখানে একটি দুর্দান্ত কাগজ যা বহুজাতিক নাইভ বেয়েস (এমএনবি) শ্রেণিবদ্ধের কিছু 'সিস্টেমিক' ত্রুটিগুলিকে সম্বোধন করে। ধারণাটি হ'ল আপনি কিছু টুইটের মাধ্যমে এমএনবির পারফরম্যান্স বাড়িয়ে তুলতে পারেন। এবং তারা (ইউনিফর্ম) ডিরিচলেট প্রিয়ার ব্যবহার করে উল্লেখ করে।

সামগ্রিকভাবে আপনি যদি এমএনবিতে আগ্রহী হন এবং আপনি এখনও এই কাগজটি না পড়েন তবে আমি দৃ strongly়ভাবে এটি করার পরামর্শ দিচ্ছি।

আমি একই ব্যক্তি / লোকদের দ্বারা সংগীতযুক্ত এমএসসি থিসিসটি পেয়েছি তবে এটি এখনও আমি পড়ে নি। আপনি এটা চেক আউট করতে পারেন।


দ্বিতীয় লিঙ্কটি মারা গেছে - সম্ভবত dspace.mit.edu/handle/1721.1/7074 আপ-টু-ডেট সংস্করণ
বেলডাজ

5

আমি সন্দেহ করি যে বেশিরভাগ এনবি বাস্তবায়নগুলি ল্যাপ্লেস সংশোধন সহ শর্তাধীন সম্ভাবনার অনুমানের জন্য মঞ্জুরি দেয়, যা বেয়েসিয়ান এনবি শ্রেণিবদ্ধকে (একটি নির্দিষ্ট ডিরিচলেট পূর্বে) এমএপি সমাধান দেয়। @ ঝুবার্ব (+1) হিসাবে উল্লেখ করেছেন যে এনবি ক্লাসিফায়ারদের বায়েশিয়ান চিকিত্সা ইতিমধ্যে উদ্ভূত হয়েছে এবং প্রয়োগ করা হয়েছে (রেনি এর থিসিস / গবেষণাগুলি ভালভাবে পড়ার উপযুক্ত)। তবে এনবি-র স্বতন্ত্র ধারণা প্রায় সর্বদা ভুল, এই ক্ষেত্রে মডেলটিকে আরও দৃ strongly়ভাবে সেই অনুমানের উপর নির্ভর করে (পুরো বায়েশিয়ান চিকিত্সার মাধ্যমে) করা ভাল কাজ হতে পারে না।


0

আপনি যা বর্ণনা করেছেন তা সত্য বলে আমি বিশ্বাস করি না। এলডিএ এবং এমএনবির সম্ভাব্য মডেলগুলি পৃথক।

উভয়ের মধ্যে একটি প্রধান পার্থক্য হ'ল এলডিএর জন্য জেনারেটরি মডেলে, যখন কোনও শব্দ আঁকানো হয়, প্রথমে সেই শব্দের জন্য একটি বিষয় বেছে নেওয়া হয়, এবং তারপরে সেই বিষয়বস্তু বিতরণের একটি শব্দ বেছে নেওয়া হয়। নথির প্রতিটি শব্দের আলাদা বিষয় থেকে আঁকতে পারে।

এমএনবি-র জন্য জেনারেটাল মডেলটিতে নথিকে একটি শ্রেণি বরাদ্দ করা হয়েছে এবং সেই নথির সমস্ত শব্দ সেই শ্রেণীর জন্য বিতরণ (একই) থেকে আঁকা হয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.