বায়েসের উপপাদ্যটিতে কেন ডিনোমিনেটর ভেঙে ফেলা হবে?


23

(আমি পরিসংখ্যানের ক্ষেত্রে একজন নবাগত I'm আমি একজন গণিতবিদ এবং একজন প্রোগ্রামার এবং আমি নিষ্পাপ বায়েশিয়ান স্প্যাম ফিল্টারের মতো কিছু তৈরি করার চেষ্টা করছি))

আমি অনেক জায়গায় লক্ষ্য করেছি যে লোকেরা বাইসের উপপাদ্য থেকে সমীকরণে ডিনোমিনেটরকে ভেঙে ফেলার প্রবণতা রয়েছে। সুতরাং এর পরিবর্তে:

পি(একজন|বি)পি(বি)পি(একজন)

আমরা এর সাথে উপস্থাপন করছি:

পি(একজন|বি)পি(বি)পি(একজন|বি)পি(বি)+ +পি(একজন|¬বি)পি(¬বি)

আপনি দেখতে পাচ্ছেন যে এই সম্মেলনটি এই উইকিপিডিয়া নিবন্ধে এবং টিম পিটার্সের অন্তর্দৃষ্টিপূর্ণ পোস্টে ব্যবহৃত হয়েছে ।

আমি এতে হতবাক হয়েছি ডিনোমিনিটারটি কেন এভাবে ভেঙে যায়? কীভাবে এটি জিনিসগুলিকে আদৌ সহায়তা করে? গণনা সম্পর্কে এত জটিল , যা স্প্যাম ফিল্টারগুলির ক্ষেত্রে হবে ?পি(একজন)The probability that the word "cheese" appears in an email, regardless of whether it's spam or not


আমি সন্দেহ করি যে উত্তরটি ডোমেন নির্দিষ্ট (যেমন স্প্যাম ফিল্টারগুলির জন্য নির্দিষ্ট)। আপনি যদি পি (এ | বি) ইত্যাদি উপাদানগুলি গণনা করতে পারেন তবে আপনার বক্তব্য অনুসারে আপনি সরল পি (এ) গণনা করতে সক্ষম হবেন। অথবা, সম্ভবত উত্তরটি পাঠশাস্ত্রের সাথে সম্পর্কিত যাতে পাঠকরা পি (এ) এবং এর পচন (প) এর (পি | বি), পি (বি) ইত্যাদির ক্ষেত্রে বুঝতে পারেন

1
আমার দৃ strong় উত্তর নেই, তবে আমি বলতে পারি যে আমি পরীক্ষাগুলিতে বোকামি ভুল করেছি যেখানে আমি স্পষ্টত ডিনোমিনেটরে প্লাগইন করতে পারি, কিন্তু আমি ভেবেছিলাম আমি পি (এ) জানি এবং আমি ভুল ছিলাম।
ওয়েইন

উত্তর:


16

আপনার প্রশ্নের সংক্ষিপ্ত উত্তর হ'ল, "বেশিরভাগ সময় আমরা জানি না যে পি (পনির) কী, এবং এটি প্রায়শই (তুলনামূলকভাবে) গণনা করা কঠিন।"

বায়েসের নিয়ম / উপপাদ্যটি আপনি যেভাবে লিখেছিলেন তা সাধারণত উত্তর হিসাবে দেওয়া হয় কারণ বায়েশিয়ান সমস্যাগুলিতে আমরা - আমাদের কোলে বসে - পূর্বের বন্টন (উপরের পি (বি)) এবং সম্ভাবনা (পি (এ |) বি), পি (এ | নটবি) উপরে) এবং এটি উত্তরক (পি (বি | এ)) গণনা করা অপেক্ষাকৃত সহজ গুণ। পি (এ) এর সংক্ষিপ্ত আকারে পুনরায় প্রকাশ করতে সমস্যার দিকে যাওয়া সেই প্রচেষ্টা যা অন্যত্র ব্যয় করা যায়।

কোনও ইমেলের প্রসঙ্গে এটি এত জটিল বলে মনে হচ্ছে না কারণ আপনি ঠিক বলেছেন যে এটি ঠিক পি (পনির), তাই না? সমস্যাটি হ'ল যুদ্ধের ময়দানে বায়েশিয়ান সমস্যাগুলির সাথে আরও জড়িত হ'ল ডিনোমিনেটরটি একটি কদর্য অবিচ্ছেদ্য, যার কোনও বন্ধ-ফর্ম সমাধান হতে পারে বা নাও হতে পারে। প্রকৃতপক্ষে, কখনও কখনও আমাদের অবিচ্ছেদ্য অনুমান করার জন্য পরিশীলিত মন্টি কার্লো পদ্ধতির প্রয়োজন হয় এবং সংখ্যাগুলি মন্থন করা পিছনের পিছনে সত্যিকারের ব্যথা হতে পারে।

তবে মূল বিষয়টি, আমরা সাধারণত পি (পনির) কী তা যত্নশীল করি না। মনে রাখবেন, আমরা কোনও ইমেল স্প্যাম কিনা তা সম্পর্কিত আমাদের বিশ্বাসকে আরও বাড়িয়ে দেওয়ার চেষ্টা করছি এবং উপাত্তের প্রান্তিক বিতরণ (পি (এ)) এর বিষয়ে কম যত্ন নিতে পারি না। এটি যাইহোক, এটি কেবলমাত্র একটি সাধারণকরণের ধ্রুবক, যা প্যারামিটারের উপর নির্ভর করে না; সংমিশ্রনের কাজটি প্যারামিটার সম্পর্কে আমাদের যা কিছু তথ্য ছিল তা ধুয়ে দেয়। ধ্রুবক গণনা করা একটি উপদ্রব এবং এটি ইমেলের স্প্যাম কিনা তা সম্পর্কে আমাদের বিশ্বাসকে শূন্য করার বিষয়টি শেষ পর্যন্ত অপ্রাসঙ্গিক। কখনও কখনও আমরা এটি গণনা করতে বাধ্য, যে ক্ষেত্রে এটি করার দ্রুততম উপায়টি আমাদের কাছে ইতিমধ্যে থাকা তথ্যের সাথে রয়েছে: পূর্ব এবং সম্ভাবনা।


কেউ কি 'অসতর্কভাবে অবিচ্ছেদ্য, যার কোনও ক্লোজড ফর্ম সমাধান থাকতে পারে বা নাও থাকতে পারে' এর উদাহরণ সরবরাহ করতে পারে, যা কোনও সমস্যায় ব্যবহৃত হবে?
পলজি

8

মোট সম্ভাব্যতা নিয়মটি ব্যবহার করার একটি কারণ হ'ল আমরা প্রায়শই সেই অভিব্যক্তিতে উপাদানগুলির সম্ভাব্যতাগুলি মোকাবিলা করি এবং কেবলমাত্র মানগুলিতে প্লাগ করে প্রান্তিক সম্ভাবনা খুঁজে পাওয়া সোজা। এর উদাহরণের জন্য, উইকিপিডিয়ায় নিম্নলিখিত উদাহরণটি দেখুন:

আর একটি কারণ হ'ল এই অভিব্যক্তিটি চালিত করে বায়েসের নিয়মের সমতুল্য রূপগুলি চিহ্নিত করা। উদাহরণ স্বরূপ:

পি(বি|একজন)=পি(একজন|বি)পি(বি)পি(একজন|বি)পি(বি)+ +পি(একজন|¬বি)পি(¬বি)

সংখ্যক দ্বারা আরএইচএসের মাধ্যমে ভাগ করুন:

পি(বি|একজন)=11+ +পি(একজন|¬বি)পি(একজন|বি)পি(¬বি)পি(বি)

যা বেয়েসের নিয়মের জন্য একটি দুর্দান্ত সমতুল্য রূপ, এটি প্রাপ্ত করার জন্য মূল প্রকাশ থেকে এটি বিয়োগ করে এমনকি আরও সহজতর করা হয়েছে:

পি(¬বি|একজন)পি(বি|একজন)=পি(একজন|¬বি)পি(একজন|বি)পি(¬বি)পি(বি)

এই অডস পরিপ্রেক্ষিতে বিবৃত বায়েসের 'নিয়ম নেই, অর্থাত্ অবর বি বার বিরুদ্ধে বি = বায়েসের ফ্যাক্টর বিরুদ্ধে মতভেদ পূর্বে বি বিরুদ্ধে মতভেদ (অথবা আপনি এটি invert বি মতভেদ পরিপ্রেক্ষিতে একটি অভিব্যক্তি পেতে পারে) বায়েসের ফ্যাক্টর আপনার মডেলগুলির সম্ভাবনার অনুপাত। প্রদত্ত যে আমরা অন্তর্নিহিত ডেটা উত্পাদন প্রক্রিয়া সম্পর্কে অনিশ্চিত, আমরা ডেটা পর্যবেক্ষণ করি এবং আমাদের বিশ্বাস আপডেট করি।

আপনি যদি এই দরকারী খুঁজে পান তবে আমি নিশ্চিত নই, তবে আশা করি এটি বিস্মিত হবে না; আপনার দৃশ্যের জন্য সবচেয়ে ভাল কাজ করে এমন প্রকাশের সাথে অবশ্যই কাজ করা উচিত। আরও ভাল কারণগুলির সাথে অন্য কেউ পাইপ করতে পারেন।


আপনি আরও একধাপ এগিয়ে যেতে পারেন এবং লগ নিতে পারেন। তারপরে আপনার লগ-পোস্টেরিয়র রেশিও = লগ-পূর্বের অনুপাত + লগ-সম্ভাবনা অনুপাত
সম্ভাব্যতা ব্লগ

6

পি(একজন)

পি(একজন)পি(একজন|বি)বিপি(একজন|বি)পি(একজন|¬বি)বি¬বিপি(একজন|বি)পি(একজন|¬বি)পি(বি)পি(¬বি)

পি(একজন)=পি(একজন|বি)পি(বি)+ +পি(একজন|¬বি)পি(¬বি)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.