সম্পাদনাগুলি: আমি একটি সাধারণ উদাহরণ জুড়েছি: গড়ের অনুমান । আত্মবিশ্বাসের অন্তরগুলির সাথে মেলে না এমন বিশ্বাসযোগ্য ব্যবধানগুলি কেন খারাপ তা আমিও কিছুটা স্পষ্ট করে দিয়েছি।
আমি, মোটামুটি ধর্মপ্রাণ বায়েশিয়ান, বিভিন্ন প্রকারের বিশ্বাসের সঙ্কটের মাঝে আছি।
আমার সমস্যাটি নিম্নলিখিত is ধরে নিন যে আমি কিছু আইআইডি ডেটা বিশ্লেষণ করতে চাই । আমি যা করবো তা হ'ল:
প্রথমে শর্তযুক্ত মডেলটির প্রস্তাব দিন:
তারপরে, : আগে একটি পছন্দ চয়ন করুন
পরিশেষে, বয়েসের নিয়মটি প্রয়োগ করুন, উত্তরোত্তর গণনা করুন: (বা এটি কিছুটা অনুকম্পযোগ্য হতে হবে যদি তার কাছাকাছি) এবং আমার সম্পর্কে সমস্ত প্রশ্নের উত্তর দিন ta
এটি একটি বোধগম্য পদ্ধতি: যদি ডেটার সত্যিকারের মডেলটি সত্যই আমার শর্তাধীনের "ভিতরে" থাকে (এটি কিছু মানের সাথে মিলিত হয় ) তবে আমি পরিসংখ্যানগত সিদ্ধান্ত তত্ত্বকে আমার পদ্ধতিটি বলে বলতে পারি (রবার্টের দেখুন) বিশদগুলির জন্য "বায়েশিয়ান পছন্দ"; "সমস্ত পরিসংখ্যান" প্রাসঙ্গিক অধ্যায়েও একটি স্পষ্ট অ্যাকাউন্ট দেয়)।
যাইহোক, সবাই জানেন, আমার মডেলটি সঠিক বলে ধরে নিচ্ছেন যে মোটামুটি অহংকারী: আমি যে মডেলগুলি বিবেচনা করেছি তার বাক্সের ভিতরে প্রকৃতি কেন ঝরঝরে পড়বে? এটা আরো অনেক বাস্তবসম্মত অনুমান করা যে ডেটা প্রকৃত মডেল থেকে পৃথক সব মানের জন্য । একে সাধারণত "ভুল বর্ণিত" মডেল বলা হয়।p ( X | θ ) θ
আমার সমস্যাটি হ'ল, এই আরও বাস্তববাদী ভুল বর্ণিত মামলায় আমার বেইসিয়ান হওয়ার পক্ষে কোনও ভাল যুক্তি নেই (যেমন: উত্তরোত্তর বিতরণ গণনা) বনাম কেবলমাত্র সর্বাধিক সম্ভাবনার প্রাক্কলনকারী (এমএলই) গণনা:
প্রকৃতপক্ষে, ক্লিজন, ভিডি ভার্ট (২০১২) এর মতে , ভুল বানানযুক্ত মামলায় উত্তরোত্তর বিতরণ:
একটি at কেন্দ্রে একটি ডায়রাক বিতরণে হিসাবে রূপান্তর করে
জন্য উত্তরোত্তর ম্যাচের আত্মবিশ্বাসের অন্তরগুলির বিশ্বাসযোগ্য অন্তরগুলি নিশ্চিত করার জন্য সঠিক ভেরিয়েন্সটি (দুটি মান ঠিক একই রকম না হলে) থাকে না । (দ্রষ্টব্য, যদিও আত্মবিশ্বাসের ব্যবধানগুলি স্পষ্টতই এমন কিছু যা বেইসিয়ানরা অতিরিক্ত মাত্রায় যত্ন নেয় না, তবে এর গুণগতভাবে বোঝায় যে উত্তরোত্তর বিতরণটি অভ্যন্তরীণভাবে ভুল, কারণ এটি বোঝাচ্ছে যে এর বিশ্বাসযোগ্য অন্তরগুলির সঠিক কভারেজ নেই)
সুতরাং, আমরা কোনও অতিরিক্ত সম্পত্তি ছাড়াই একটি গণনামূলক প্রিমিয়াম (বায়েশিয়ান অনুমান, সাধারণত এমএলইয়ের চেয়ে বেশি ব্যয়বহুল) প্রদান করি
সুতরাং, অবশেষে, আমার প্রশ্ন: মডেলটির ভুল বানান করা হয়েছে যখন সহজ এমএলই বিকল্পের উপর বায়েশিয়ান অনুমান ব্যবহার করার জন্য তাত্ত্বিক বা অভিজ্ঞতাবাদী কোনও যুক্তি আছে কি?
(যেহেতু আমি জানি যে আমার প্রশ্নগুলি প্রায়শই অস্পষ্ট থাকে, দয়া করে আপনি যদি কিছু বুঝতে না পারেন তবে আমাকে জানান: আমি এটি পুনরায় লেখার চেষ্টা করব)
সম্পাদনা করুন: আসুন একটি সহজ উদাহরণ বিবেচনা করুন: গাউসিয়ান মডেলটির অধীনে এর গড় করা (পরিচিত আরও ভিন্নতা সহ আরও সহজ করার জন্য)। আমরা একটি গাউসিয়ান পূর্বে বিবেচনা করি: আমরা পূর্বের বোঝায়, পূর্বের বিপরীত । যাক এর গবেষণামূলক গড় হতে । অবশেষে, দ্রষ্টব্য: ।
উত্তরোত্তর বিতরণ:
সঠিকভাবে নির্দিষ্ট ক্ষেত্রে (যখন সত্যিকার অর্থে গাউসিয়ান বিতরণ রয়েছে), এই উত্তরোত্তরতে নিম্নলিখিত সুন্দর বৈশিষ্ট্য রয়েছে
যদি হায়ারারিকিকাল মডেল থেকে উত্পন্ন হয় যেখানে পূর্ববর্তী বিতরণ থেকে তাদের ভাগ করা বেছে নেওয়া হয়, তবে উত্তরোত্তর বিশ্বাসযোগ্য অন্তরগুলির সঠিক কভারেজ থাকে। তথ্যের শর্তসাপেক্ষ, কোনও ব্যবধানে থাকার সম্ভাবনা উত্তরোত্তর এই ব্যবধানে যে সম্ভাবনার সমতুল্য
এমনকি যদি পূর্বেরটি সঠিক না হয় তবে বিশ্বাসযোগ্য সীমা এর সঠিক কভারেজ থাকে যার মধ্যে পূর্বের প্রভাবটি অদৃশ্য হয়ে যায়
উত্তরোত্তরটিতে আরও ভাল ঘন ঘন বৈশিষ্ট্য রয়েছে: পশ্চিমা থেকে নির্মিত যে কোনও বায়েশিয়ান অনুমানকটি গ্রহণযোগ্য বলে গ্যারান্টিযুক্ত, উত্তরোত্তর গড়টি একটি দক্ষ অনুমানকারী (ক্র্যামার-রাও অর্থে), বিশ্বাসযোগ্য অন্তরগুলি, অ্যাসিপোটোটিকভাবে, আত্মবিশ্বাসের অন্তর অন্তর্ভুক্ত।
ভুল বর্ণিত ক্ষেত্রে, এই সম্পত্তিগুলির বেশিরভাগের তত্ত্ব দ্বারা গ্যারান্টি নেই। ধারণাগুলি ঠিক করার জন্য, ধরে নেওয়া যাক এর আসল মডেল হ'ল তারা পরিবর্তে শিক্ষার্থীদের বিতরণ। একমাত্র সম্পত্তি যা আমরা গ্যারান্টি দিতে পারি (ক্লিজন এট আল) উত্তরোত্তর বিতরণটি এর প্রকৃত মধ্যে কেন্দ্রীভূত করে । সাধারণভাবে, সমস্ত কভারেজের সম্পত্তি বিলুপ্ত হবে। সবচেয়ে খারাপ, সাধারণভাবে, আমরা গ্যারান্টি দিতে পারি যে, এই সীমাতে, কভারেজের বৈশিষ্ট্যগুলি মূলত ভুল: উত্তরোত্তর বিতরণ স্থানের বিভিন্ন অঞ্চলে ভুল সম্ভাবনা হিসাবে বর্ণনা করে।