বিশপের পিআরএমএল বইয়ে তিনি বলেছিলেন যে, ওভারফিট করা সর্বাধিক সম্ভাবনা অনুমানের (এমএলই) সমস্যা এবং বায়েসিয়ান এড়াতে পারেন।
তবে আমি মনে করি, মডেল নির্বাচন সম্পর্কে পরামিতি নির্ধারণের জন্য ব্যবহৃত পদ্ধতি সম্পর্কে নয়, ওভারফিটিং আরও বেশি সমস্যা। এটি, ধরুন আমার কাছে একটি ডেটা সেট , যা মাধ্যমে উত্পন্ন হয়েছে , এখন আমি ডেটা ফিট করতে এবং খুঁজে পেতে বিভিন্ন মডেল নিতে পারি কোনটি সবচাইতে ভাল. এবং বিবেচনাধীন মডেলগুলি হ'ল বিভিন্ন অর্ডার সহ বহুপদী, আদেশ 1, 2 আদেশ 2, হ'ল আদেশ 9।এফ ( এক্স ) = এস আই এন ( এক্স ) ,এইচ আই এইচ 1 এইচ 2 এইচ 3
এখন আমি ডেটা মাপসই চেষ্টা 3 মডেলের সাথে, প্রতিটি মডেল তার paramters, যেমন প্রকাশ করেছেন জন্য ।w i H i
এমএল ব্যবহার করে, আমি মডেল পরামিতি একটি বিন্দু হিসাব থাকবে , এবং খুব সহজ হয় এবং সর্বদা ডাটা underfit, যেহেতু হবে অত্যন্ত জটিল এবং ডেটা overfit করবে শুধুমাত্র তথ্য ভাল মাপসই করা হবে।এইচ 1 এইচ 3 এইচ 2
আমার প্রশ্নগুলি হ'ল,
1) মডেল 12 ডেটা দেবে, তবে আমি মনে করি এটি এমএল এর সমস্যা নয়, তবে প্রতি সেড মডেলের সমস্যা। কারণ, জন্য এমএল ব্যবহার করা নয়। আমি কি সঠিক?এইচ 1 , এইচ 2
2) Bayesian তুলনায় এমএল যেহেতু এটা শুধু মডেল পরামিতি বিন্দু অনুমান দেয়, কিছু অসুবিধেও আছে , এবং এটি overconfident আছে। যদিও বায়েসিয়ান প্যারামিটারের সর্বাধিক সম্ভাব্য মানের উপর নির্ভর করে না, তবে পর্যবেক্ষণের ডেটা দিয়ে প্যারামিটারগুলির সমস্ত সম্ভাব্য মানগুলি ঠিক আছে?ডি
3) বায়েশিয়ানরা কেন বা ওভারফিটিং হ্রাস করতে পারে? আমি এটা বুঝতে হিসাবে, আমরা মডেল তুলনা, যে জন্য Bayesian ব্যবহার করতে পারেন, তথ্য দেওয়া , আমরা খুঁজে পাইনি প্রান্তিক সম্ভাবনা (অথবা মডেল প্রমাণ) বিবেচনা অধীন প্রতিটি মডেল জন্য, এবং তারপর সর্বোচ্চ প্রান্তিক সম্ভাবনা, ডান সঙ্গে এক বাছাই ? যদি তাই হয় তবে তা কেন?