এটা কি সত্য যে বায়েশিয়ান পদ্ধতিগুলি বেশি মানায় না?


25

এটা কি সত্য যে বায়েশিয়ান পদ্ধতিগুলি বেশি মানায় না? (আমি কিছু কাগজপত্র এবং টিউটোরিয়াল এই দাবি করা দেখেছি)

উদাহরণস্বরূপ, আমরা যদি এমএনআইএসটিতে (হস্তাক্ষর অঙ্কিত শ্রেণিবিন্যাস) কোনও গাউসিয়ান প্রক্রিয়া প্রয়োগ করি তবে কেবলমাত্র এটি একটি একক নমুনা দেখায়, তবে এটি কি সেই একক নমুনা থেকে আলাদা কোনও ইনপুটগুলির পূর্ববর্তী বিতরণে ফিরে যাবে, তবুও পার্থক্যটি কি কম?


কেবল ভাবছিলাম - গাণিতিকভাবে সঠিক কোনও উপায় আছে যা আপনি "ওভার ফিটিং" সংজ্ঞায়িত করতে পারেন? যদি আপনি পারেন তবে সম্ভবত এটি বৈশিষ্ট্যগুলি কোনও সম্ভাবনা ফাংশনে বা এটি হওয়া এড়ানোর আগে তৈরি করতে পারেন build আমার ধারণা হ'ল এই ধারণাটি "বিদেশী" এর মতো বলে মনে হচ্ছে।
সম্ভাব্যতাবিরোধী

উত্তর:


25

না, এটা সত্য নয়। বায়েশিয়ান পদ্ধতিগুলি অবশ্যই ডেটাগুলিকে উপস্থাপন করবে। এমন বেশ কয়েকটি জিনিস রয়েছে যা বায়েশিয়ান পদ্ধতিগুলিকে ওভারফিটের বিরুদ্ধে আরও শক্তিশালী করে তোলে এবং আপনি সেগুলি আরও ভঙ্গুর করে তুলতে পারেন।

বাইনারি হাইপোথেসিসের চেয়ে বায়সিয়ান হাইপোথিসিসের সম্মিলনীয় প্রকৃতি একাধিক তুলনা করতে দেয় যখন কারও কাছে নাল অনুমানের পদ্ধতির জন্য "সত্য" মডেলটি নেই। কোনও বায়েশিয়ান উত্তরোত্তর কার্যকরভাবে মডেলের কাঠামো বৃদ্ধির ক্ষেত্রে উপযুক্তভাবে পরিবর্তনগুলিকে যুক্ত করার সাথে সাথে ফিটের ক্ষেত্রে পুরষ্কার প্রদানের ক্ষেত্রে শাস্তি দেয়। জরিমানা এবং লাভগুলি বেআইসিয়ান পদ্ধতিতে যেমন হয় তেমন অপ্টিমাইজেশন নয়, তবে নতুন তথ্য থেকে সম্ভাব্যতা পরিবর্তন করে।

যদিও এটি সাধারণত আরও শক্তিশালী পদ্ধতি দেয়, সেখানে একটি গুরুত্বপূর্ণ বাধা রয়েছে এবং এটি যথাযথ পূর্ববর্তী বিতরণ ব্যবহার করছে। ফ্ল্যাট প্রিয়ার ব্যবহার করে ফ্রিকোয়েন্সিবাদী পদ্ধতিগুলি নকল করার প্রবণতা থাকলেও এটি সঠিক সমাধানের আশ্বাস দেয় না। বায়েশিয়ান পদ্ধতিগুলিতে অত্যধিক মানসিকতা সম্পর্কিত নিবন্ধ রয়েছে এবং আমার কাছে মনে হয়েছে যে কঠোরভাবে সমতল প্রিয়ার দিয়ে শুরু করে পাপটি বাই-বেসরকারী পদ্ধতিতে "ন্যায্য" হওয়ার চেষ্টা করে বলে মনে হচ্ছে। অসুবিধাটি হ'ল সম্ভাবনাটি স্বাভাবিক করার ক্ষেত্রে পূর্বেরটি গুরুত্বপূর্ণ।

বায়েশিয়ান মডেলগুলি শব্দের ওয়াল্ডের গ্রহণযোগ্যতা অর্থে অন্তর্নিহিত সর্বোত্তম মডেল, তবে সেখানে একটি লুকিয়ে আছে বুজিম্যান। ওয়াল্ড ধরে নিচ্ছে যে পূর্বটি আপনার সত্যিকারের পূর্ব এবং আপনি ব্যবহার করছেন এমন কিছু পূর্ব নয় যাতে সম্পাদকরা এতে খুব বেশি তথ্য রাখার জন্য আপনাকে ডিঙ্গাবেন না। ফ্রিকোয়েন্সিস্ট মডেলগুলি একইভাবে সেগুলি অনুকূল নয়। নিরপেক্ষ থাকাকালীন ঘনত্বটি হ্রাস করার অপ্টিমাইজেশনের মাধ্যমে ঘনঘনবাদী পদ্ধতিগুলি শুরু হয়।

এটি একটি ব্যয়বহুল অপ্টিমাইজেশন যার ফলে এটি তথ্য বাতিল করে দেয় এবং ওয়াল্ড অর্থে এটি স্বতন্ত্রভাবে গ্রহণযোগ্য নয়, যদিও এটি প্রায়শই স্বীকারযোগ্য। সুতরাং ফ্রিকোয়েন্সিস্ট মডেলগুলি পক্ষপাতহীনতার কারণে ডেটাতে একটি সর্বোত্তম ফিট সরবরাহ করে। বায়েশিয়ান মডেলগুলি কোনও পক্ষপাতদুষ্ট বা উপাত্তের জন্য উপযুক্ত নয়। ওভারফিটিং হ্রাস করার জন্য এটি আপনি বাণিজ্য করছেন।

বায়েশিয়ান মডেলগুলি অন্তর্নিহিত পক্ষপাতী মডেল, যদি না তাদের পক্ষপাতহীন করার জন্য বিশেষ পদক্ষেপ নেওয়া হয়, তবে এটি সাধারণত ডেটাগুলির চেয়ে আরও খারাপ fit তাদের গুণটি হ'ল তারা "সত্য মডেল" সন্ধানের জন্য বিকল্প পদ্ধতির চেয়ে কম তথ্য ব্যবহার করেন না এবং এই অতিরিক্ত তথ্য বায়েশিয়ান মডেলগুলি বিকল্প মডেলের তুলনায় কখনই কম ঝুঁকিপূর্ণ করে না, বিশেষত নমুনা তৈরির সময়। এটি বলেছিল, সর্বদা এমন একটি নমুনা থাকবে যা এলোমেলোভাবে আঁকতে পারত যে বায়েশিয়ান পদ্ধতিটি পদ্ধতিগতভাবে "প্রতারণা" করবে।

আপনার প্রশ্নের দ্বিতীয় অংশ হিসাবে, আপনি যদি একটি একক নমুনা বিশ্লেষণ করতে চান তবে উত্তরোত্তরটি তার সমস্ত অংশে চিরতরে পরিবর্তিত হবে এবং দ্বিতীয় স্যাম্পল না থাকলে পূর্ববর্তীটিতে ফিরে যাবে না যা সঠিকভাবে সমস্ত তথ্য বাতিল করে দিয়েছে প্রথম নমুনা। কমপক্ষে তাত্ত্বিকভাবে এটি সত্য। অনুশীলনে, যদি পূর্বেরটি যথেষ্ট পরিমাণে তথ্যবহুল এবং পর্যবেক্ষণটি যথেষ্ট পরিমাণে তথ্যহীন হয় তবে তার প্রভাব এত কম হতে পারে যে কোনও কম্পিউটার উল্লেখযোগ্য সংখ্যার সীমাবদ্ধতার কারণে পার্থক্যগুলি পরিমাপ করতে পারে না। উত্তরোত্তর পরিবর্তন প্রক্রিয়া করার জন্য কম্পিউটারের পক্ষে কোনও প্রভাব খুব কম হওয়া সম্ভব।

সুতরাং উত্তরটি "হ্যাঁ" আপনি একটি বায়সিয়ান পদ্ধতি ব্যবহার করে একটি নমুনাকে বেশি মানিয়ে নিতে পারেন, বিশেষত যদি আপনার কাছে একটি ছোট নমুনার আকার এবং অনুপযুক্ত প্রিয়ার থাকে। দ্বিতীয় উত্তরটি "না" বায়েসের উপপাদ্য পূর্বের তথ্যের প্রভাবকে কখনই ভুলে যায় না, যদিও প্রভাবটি এত কম হতে পারে আপনি এটি গণনার দিক থেকে মিস করেন।


2
ইন তারা নিরপেক্ষ থাকাকালীন বৈচিত্রটি হ্রাস করার অনুকূলিতকরণের সাথে শুরু করে। তারা কি ?
রিচার্ড হার্ডি

N(θ,σ2)σ

1
σ

11

সচেতন হওয়ার মতো কিছু হ'ল ব্যবহারিকভাবে অন্য যে কোনও জায়গায়, বয়েশিয়ান পদ্ধতিতে একটি উল্লেখযোগ্য সমস্যা হ'ল মডেল অপব্যবহার।

এটি একটি সুস্পষ্ট বিষয়, তবে আমি ভেবেছিলাম আমি এখনও একটি গল্প ভাগ করব।

আন্ডারগ্রাডের পিছনে থেকে একটি ভিনগেট ...

বায়সিয়ান কণা ফিল্টারিংয়ের একটি ক্লাসিক অ্যাপ্লিকেশন হ'ল একটি ঘরের চারদিকে ঘুরতে যাওয়ার সাথে সাথে একটি রোবটের অবস্থান ট্র্যাক করা। সেন্সর রিডিং অনিশ্চয়তা হ্রাস করার সময় চলাচল অনিশ্চয়তা প্রসারিত করে।

আমি মনে করি এটি করার জন্য কিছু রুটিন কোড করে আছি। সত্যিকার মূল্যবোধগুলি দিয়ে বিভিন্ন সোনার পাঠগুলি পর্যবেক্ষণ করার সম্ভাবনার জন্য আমি একটি বুদ্ধিমান, তাত্ত্বিকভাবে অনুপ্রাণিত মডেল লিখেছিলাম। সবকিছু স্পষ্টভাবে উদ্ভূত হয়েছিল এবং সুন্দরভাবে কোডিং হয়েছিল। তারপরে আমি এটি পরীক্ষা করতে যাই ...

কি হলো? মোট ব্যর্থতা! কেন? আমার কণা ফিল্টারটি দ্রুত মনে করেছিল যে সেন্সর রিডিংগুলি প্রায় সমস্ত অনিশ্চয়তা দূর করেছে। আমার পয়েন্ট মেঘটি এক পর্যায়ে ধসে গেছে, তবে আমার রোবটটি অগত্যা সেই সময়ে ছিল না!

মূলত, আমার সম্ভাবনা ফাংশন খারাপ ছিল; আমার সেন্সর পঠনগুলি তেমন তথ্যবহুল ছিল না যতটা আমি ভেবেছিলাম সেগুলি। আমি ছিলাম। একটি সমাধান? আমি আরও এক টন গাউসিয়ান শব্দে মিশ্রিত হয়েছি (পরিবর্তে অ্যাডহক ফ্যাশনে), পয়েন্ট মেঘটি ভেঙে যাওয়া বন্ধ করে দিয়েছে এবং তারপরে ফিল্টারিংটি বরং সুন্দরভাবে কাজ করেছে।

নৈতিক?

বক্স যেমন বিখ্যাত বলেছিল, "সমস্ত মডেল ভুল, তবে কিছু কার্যকর।" প্রায় অবশ্যই, আপনার আসল সম্ভাবনা ফাংশনটি থাকবে না এবং যদি এটি যথেষ্ট পরিমাণে বন্ধ থাকে তবে আপনার বায়সিয়ান পদ্ধতিটি ভয়াবহভাবে উদ্বেগজনক এবং অত্যধিক উপযোগী হতে পারে।

অগ্রণী যোগ করা জাদুকরভাবে পর্যবেক্ষণগুলি আইআইডি হবার সময় ধরে না নিয়ে ধারণা করা থেকে উদ্ভূত সমস্যাগুলির সমাধান করে না, ধরে নিই যে সম্ভাবনাগুলি এর চেয়ে বেশি বক্রতা রয়েছে ...


3
"আন্ডারগ্রাড থেকে পিছনে থেকে একটি ভিনগেট ... বায়সিয়ান কণা ফিল্টারিংয়ের একটি ক্লাসিক অ্যাপ্লিকেশন হ'ল একটি ঘরের চারদিকে ঘুরতে যাওয়ার সাথে সাথে একটি রোবোটের অবস্থান ট্র্যাক করা" ... ওহ, আপনার আন্ডারগ্র্যাডটি কোথায় ছিল? :)
ক্লিফ এবি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.