বায়েশিয়ান পরিসংখ্যান এবং জেনারেটরি মডেলিংয়ের মধ্যে সংযোগ


15

কেউ কি আমাকে কোনও ভাল রেফারেন্সে রেফার করতে পারেন যা বায়সিয়ান পরিসংখ্যান এবং জেনারেটরি মডেলিং কৌশলগুলির মধ্যে সংযোগটি ব্যাখ্যা করে? কেন আমরা সাধারণত বায়েসীয় কৌশলগুলি সহ জেনারেটরি মডেল ব্যবহার করি?

সম্পূর্ণ ডেটা অনুপস্থিতিতে বায়েসিয়ান পরিসংখ্যান কেন ব্যবহার করার জন্য বিশেষত আবেদন করা হচ্ছে, যদি তা না হয়?

নোট করুন যে আমি আরও মেশিন লার্নিং দৃষ্টিভঙ্গি থেকে এসেছি এবং আমি পরিসংখ্যান সম্প্রদায়ের কাছ থেকে এটি সম্পর্কে আরও পড়তে আগ্রহী।

এই পয়েন্টগুলি নিয়ে আলোচনা করা যে কোনও ভাল রেফারেন্স প্রশংসা করা হবে। ধন্যবাদ।


আমি রূপান্তরকরণের অভিযোজক এবং জেনারেটরি পদ্ধতির মধ্যে মৌলিক পার্থক্য সম্পর্কে সন্ধান করছি। দেখে মনে হচ্ছে বায়েসিয়ান জেনারেটর নয় তবে অভিযোজক অধ্যয়নের জন্য স্ট্যাটিস্টিকাল মডেল হিসাবে উপযুক্ত। আরও দৃlusion়তার সাথে এই সিদ্ধান্তে পৌঁছানো দরকার।

1
হাই শ্রীনিধি, সাইটে আপনাকে স্বাগতম। এটি একটি প্রশ্নোত্তর সাইট। আপনি কি দয়া করে একটি প্রশ্নে আপনার মন্তব্যটি আবার তৈরি করতে পারেন? এছাড়াও, এটি যত বেশি নির্দিষ্ট প্রশ্ন, ততই কার্যকর উত্তর পাওয়ার সম্ভাবনা তত বেশি।
nnot101

উত্তর:


12

মেশিন শেখার ক্ষেত্রে সম্পূর্ণ সম্ভাবনার মডেল পি (x, y) কে জেনারেটরি বলা হয় কারণ এটি ডেটা তৈরি করতে ব্যবহার করা যেতে পারে যেখানে শর্তযুক্ত মডেল পি (y | x) কে বৈষম্যমূলক বলা হয় কারণ এটি পি (এক্স) এর সম্ভাব্যতা মডেল নির্দিষ্ট করে না ) এবং শুধুমাত্র প্রদত্ত x প্রদান করতে পারে। উভয়ই বেয়েসিয়ান ফ্যাশনে অনুমান করা যায়।

পুরো সম্ভাবনার মডেল নির্দিষ্ট করা এবং মডেল এবং ডেটাতে শর্তসাপেক্ষ শর্তাবলী সম্পাদন সম্পর্কে বেয়েশিয়ান অনুমান সহজাতভাবে। এটি অনেক বায়েশিয়ান মডেলগুলির একটি উত্পাদনশীল অনুভূতি তৈরি করে। তবে একজন বায়েশিয়ানের কাছে গুরুত্বপূর্ণ পার্থক্যটি কীভাবে ডেটা তৈরি করা যায় তা সম্পর্কে নয়, তবে আগ্রহের অজানা প্যারামিটারগুলির উত্তরোত্তর বিতরণ পাওয়ার জন্য কী প্রয়োজন তা আরও বেশি।

বৈষম্যমূলক মডেল p (y | x) বড় মডেলের অংশ যেখানে p (y, x) = p (y | x) p (x)। অনেক ক্ষেত্রে, p (x) মডেল পি (y | x) এর পরামিতিগুলির উত্তর বিতরণের সাথে অপ্রাসঙ্গিক। বিশেষত, যদি p (x) এর প্যারামিটারগুলি p (y | x) থেকে পৃথক হয় এবং প্রিরিয়াররা স্বতন্ত্র থাকে তবে মডেল পি (x) এ শর্তযুক্ত মডেল p (y | x) এর অজানা পরামিতি সম্পর্কে কোনও তথ্য নেই, সুতরাং একজন বায়েশিয়ান এটির মডেল করার দরকার নেই।


আরও স্বজ্ঞাত স্তরে, "ডেটা উত্পন্ন করা" এবং "উত্তর বিতরণ গণনা করা" এর মধ্যে একটি স্পষ্ট লিঙ্ক রয়েছে। রুবিন (1984) এই লিঙ্কটির নিম্নলিখিত চমত্কার বিবরণ দেয়:

এখানে চিত্র বর্ণনা লিখুন


বেইসিয়ান পরিসংখ্যানগুলি মূলত অনুপস্থিত তথ্য প্রদানে দরকারী কারণ এটি উপদ্রব পরামিতিগুলি - ইন্টিগ্রেশনকে দূর করার জন্য একীভূত উপায় সরবরাহ করে। অনুপস্থিত ডেটা (বহু) উপদ্রব পরামিতি হিসাবে ভাবা যেতে পারে। প্রত্যাশিত মানটিতে প্লাগিংয়ের মতো বিকল্প প্রস্তাবগুলি খুব খারাপভাবে সঞ্চালিত হয় কারণ আমরা উচ্চ মাত্রার যথাযথতার সাথে নিখোঁজ ডেটা কোষগুলি খুব কমই অনুমান করতে পারি। এখানে, সংহতকরণ সর্বাধিককরণের চেয়ে ভাল।

X (x | x) এর মতো বৈষম্যমূলক মডেলগুলিও সমস্যাযুক্ত হয়ে যায় যদি x অনুপস্থিত ডেটা অন্তর্ভুক্ত করে কারণ আমাদের কাছে কেবলমাত্র পি (y | x_obs) অনুমান করার জন্য ডেটা রয়েছে তবে বেশিরভাগ বুদ্ধিমান মডেলগুলি সম্পূর্ণ ডেটা পি (y | x) এর সাথে লেখা থাকে। আপনার যদি সম্পূর্ণ সম্ভাব্যতা মডেল পি (y, x) থাকে এবং বায়েসিয়ান হন তবে আপনি ঠিক আছেন কারণ আপনি অন্য কোনও অজানা পরিমাণের মতো কেবল হারিয়ে যাওয়া ডেটাগুলিকে সংহত করতে পারেন।


2

@ ত্রিস্তান: আশা করি আপনি যেভাবে সাধারণ বিষয়টিকে যথাসম্ভব স্বচ্ছ করতে পারবেন সে বিষয়ে আমি কাজ করে যাচ্ছি বলে আপনার উত্তর দেওয়ার বিষয়ে আমার আপত্তি নেই।

আমার কাছে, প্রাথমিকপরিসংখ্যানগুলির অন্তর্দৃষ্টি হ'ল পুনরাবৃত্তি পর্যবেক্ষণগুলির বিভিন্ন ধারণাগুলি কল্পনা করা - যেমন কোনও সম্ভাব্যতা তৈরির মডেল যেমন নরমাল (মিউ, সিগমা) দ্বারা উত্পন্ন। 1800 এর গোড়ার দিকে, সম্ভাব্যতা তৈরির মডেলগুলি কেবলমাত্র পরামিতিগুলির ভূমিকা সহ পরিমাপের ত্রুটির জন্য যেমন মু এবং সিগমা এবং তাদের জন্য প্রিয়ারগুলি বিভ্রান্ত করে তোলে। ঘনঘনবাদী পন্থাগুলি স্থির এবং অজানা হিসাবে পরামিতিগুলি নিয়েছিল এবং তাই সম্ভাব্যতা তৈরির মডেলগুলি কেবল তখনই সম্ভাব্য পর্যবেক্ষণগুলিতে জড়িত। বায়েশিয়ান পদ্ধতির (যথাযথ প্রিয়ার সহ) সম্ভাব্য অজানা প্যারামিটার এবং সম্ভাব্য পর্যবেক্ষণ উভয়ের জন্য সম্ভাব্যতা তৈরির মডেল রয়েছে। এই যৌথ সম্ভাব্যতা তৈরির মডেলগুলি সামগ্রিকভাবে সমস্তটির জন্য অ্যাকাউন্ট করে - এটি আরও সাধারণভাবে রাখার জন্য - সম্ভাব্য অজানা (যেমন পরামিতি) এবং পরিচিত (যেমন পর্যবেক্ষণ)। যেমনটি আপনি দিয়েছেন রুবিনের লিঙ্কে,

1800 এর দশকের শেষের দিকে গ্যাল্টন এটি দুটি স্টেজ কুইঞ্চংসে আসলে খুব স্পষ্টভাবে চিত্রিত করেছিলেন। চিত্র 5> স্টিলার, স্টিফেন এম 2010 দেখুন Darwin ডারউইন, গ্যালটন এবং পরিসংখ্যান

জ্ঞানদান. রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল: সিরিজ এ 173 (3): 469-482 । ।

এটি সমতুল্য তবে সম্ভবত এটি আরও স্বচ্ছ

posterior = পূর্বে (সম্ভাব্য অজানা | সম্ভাব্য জ্ঞাত = জ্ঞাত)

পূর্ববর্তী ~ পূর্বের (সম্ভাব্য অজানা) * পি (সম্ভাব্য নামস = জ্ঞাত | সম্ভাব্য অজানা)

প্রাপ্য মূল্যবোধের জন্য খুব বেশি নতুন কিছু নেই কারণ একটি সম্ভাব্যতা মডেলের জন্য সম্ভাব্য অজানা যুক্ত করা হয় এবং অনুপস্থিত মানগুলির সম্ভাব্য পরিচিতদের মধ্যে একটি হিসাবে অনুপস্থিত আচরণ করে (যেমন 3 য় পর্যবেক্ষণ অনুপস্থিত ছিল)।

সম্প্রতি, আনুমানিক বায়েশিয়ান গণনা (এবিসি) এই গঠনমূলক দ্বি-পর্যায়ের সিমুলেশন পদ্ধতির গুরুত্ব সহকারে নিয়েছে যখন পি (সম্ভাব্য জ্ঞাত = জ্ঞাত | সম্ভাব্য অজানা) কাজ করা যায় না। তবে এটি কার্যকর করার পরেও এবং এমসিএমসি স্যাম্পলিংয়ের মাধ্যমে উত্তরোত্তরগুলি সহজেই পাওয়া যায় (বা এমনকি পূর্বের সংযোগের কারণে উত্তরোত্তর সরাসরি উপস্থিত থাকলেও) রুবিনের এই দ্বি-পর্যায়ের স্যাম্পলিং নির্মাণ সম্পর্কে সহজ বোঝাপড়াকে সক্ষম করার বিষয়টি সম্পর্কে অবহেলা করা উচিত নয়।

উদাহরণস্বরূপ, আমি নিশ্চিত যে @ জেন এখানে বায়েশিয়ানরা কী করেছে তা সম্ভবত ধরা পড়ে : সম্ভাব্যতার কাজটির দাস? কারন একটি পূর্বের (প্রথম ধাপ) থেকে একটি সম্ভাব্য অজানা সি আঁকতে হবে এবং তারপরে একটি সি (স্টেজ ২) প্রদত্ত একটি সম্ভাব্য পরিচিত (তথ্য) আঁকতে হবে যা পি (সম্ভাব্য জ্ঞাত | গ) হিসাবে এলোমেলো প্রজন্ম না হত would একটি এবং কেবলমাত্র এক গ ছাড়া সম্ভাবনা ছিল না।

এক্সআমি|সি(|)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.