প্রথমে একটি সংঘবদ্ধটি কী তা আমাকে ব্যাখ্যা করুন । তারপরে আমি আপনার নির্দিষ্ট উদাহরণ ব্যবহার করে বায়েশিয়ান বিশ্লেষণগুলি ব্যাখ্যা করব। বায়েশিয়ান পরিসংখ্যানগুলি নিম্নলিখিত পদক্ষেপগুলিতে জড়িত:
- পূর্ববর্তী বিতরণটি সংজ্ঞায়িত করুন যা কোনও প্যারামিটার সম্পর্কে আপনার বিষয়গত বিশ্বাসকে অন্তর্ভুক্ত করে (আপনার উদাহরণে সুদের প্যারামিটারটি বাম-হাতের অনুপাত)। পূর্ববর্তীটি "অপ্রয়োজনীয়" বা "তথ্যবহুল" হতে পারে (তবে এর আগে কোনও তথ্য নেই যা এখানে আলোচনা দেখুন )।
- তথ্য সংগ্রহ করুন।
- কোনও পূর্ববর্তী বিতরণ পেতে বয়েসের উপপাদ্যটি ব্যবহার করে ডেটা দিয়ে আপনার পূর্ব বিতরণ আপডেট করুন । উত্তরোত্তর বিতরণ একটি সম্ভাব্যতা বিতরণ যা ডেটা দেখার পরে প্যারামিটার সম্পর্কে আপনার আপডেট বিশ্বাসকে উপস্থাপন করে।
- উত্তরোত্তর বিতরণ বিশ্লেষণ করুন এবং এর সংক্ষিপ্ত বিবরণ করুন (গড়, মধ্যম, এসডি, কোয়ান্টাইলস, ...)।
সমস্ত বায়সিয়ান পরিসংখ্যানের ভিত্তি হল বয়েসের উপপাদ্য, যা
posterior∝prior×likelihood
আপনার ক্ষেত্রে, সম্ভাবনা দ্বি-দ্বীনি। পূর্ব এবং উত্তরোত্তর বিতরণ যদি একই পরিবারে হয় তবে পূর্ব এবং উত্তরোত্তরকে কনজুগেট বিতরণ বলা হয় । বিটা বিতরণ পূর্বের একটি সংঘবদ্ধ কারণ উত্তরবর্তীটিও বিটা বিতরণ। আমরা বলি যে বিটা বিতরণ দ্বিপাক্ষিক সম্ভাবনার জন্য সম্মিলিত পরিবার। সংঘবদ্ধ বিশ্লেষণগুলি সুবিধাজনক তবে বাস্তব-বিশ্ব সমস্যাগুলিতে খুব কমই ঘটে। বেশিরভাগ ক্ষেত্রে, পোস্টারিয়র ডিস্ট্রিবিউশনটি এমসিএমসি (স্ট্যান, উইনবইউজিএস, ওপেনবিগিজস, জেএজিএস, পিএমসি বা অন্য কোনও প্রোগ্রাম ব্যবহার করে) মাধ্যমে সংখ্যাগতভাবে খুঁজে পেতে হয়।
পূর্বের সম্ভাব্যতা বিতরণ যদি 1 এর সাথে সংহত না হয় তবে একে অপ্রয়োজনীয় পূর্বে বলা হয় , যদি এটি 1 এর সাথে সংহত করে তবে একে যথাযথ পূর্ব বলা হয় । বেশিরভাগ ক্ষেত্রে, বেইসিয়ান বিশ্লেষণগুলির জন্য একটি অনুচিত পূর্ববর্তী একটি বড় সমস্যা তৈরি করে না। উত্তরোত্তর বিতরণ অবশ্যই যথাযথ হতে হবে , অর্থাত্ উত্তরোত্তর 1 টিতে সংহত করতে হবে।
থাম্বের এই নিয়মগুলি সরাসরি বায়েশীয় বিশ্লেষণ পদ্ধতির প্রকৃতি থেকে অনুসরণ করে:
- পূর্বেরটি যদি তথ্যহীন হয় তবে পশ্চাত্পদকটি ডেটা দ্বারা অনেক নির্ধারিত হয় (উত্তরোত্তর ডেটা-চালিত হয়)
- পূর্ব যদি তথ্যবহুল হয় তবে পূর্ববর্তীটি পূর্বের এবং উপাত্তগুলির মিশ্রণ
- পূর্বের যত তথ্যবহুল, তত বেশি তথ্য আপনার বিশ্বাসকে "পরিবর্তন" করতে হবে, তাই কথা বলতে হবে কারণ পূর্ববর্তী তথ্য পূর্ববর্তী তথ্য দ্বারা চালিত
- আপনার যদি প্রচুর ডেটা থাকে তবে ডেটাগুলি উত্তরোত্তর বিতরণকে প্রাধান্য দেবে (তারা পূর্বের দিকে ছাপিয়ে যাবে)
বিটা বিতরণের জন্য কিছু সম্ভাব্য "তথ্যবহুল" এবং "তথ্যহীন" প্রিরিয়ার একটি দুর্দান্ত ওভারভিউ এই পোস্টে পাওয়া যাবে ।
আপনার পূর্ববর্তী বিটাটি হ'ল যেখানে left বাম-হাতের অনুপাত। পূর্ববর্তী প্যারামিটারগুলি এবং নির্দিষ্ট করতে , বিটা বিতরণের গড় এবং প্রকরণটি জানতে দরকারী (উদাহরণস্বরূপ, যদি আপনি চান আপনার পূর্বের একটি নির্দিষ্ট গড় এবং ভিন্নতা আছে)। গড়টি হল। । সুতরাং, যখনই , । বিটা বিতরণ ভ্যারিয়েন্স হয় । এখন, সুবিধাজনক জিনিসটি হ'ল আপনি এবং ভাবতে পারেনBeta(πLH|α,β)πLHαβπ¯LH=α/(α+β)α=β0.5αβ(α+β)2(α+β+1)αβপূর্বে পরিলক্ষিত (ছদ্ম-) ডেটা, যথা যেমন বাম-হাতি এবং আকারের একটি (ছদ্ম-) নমুনা থেকে বের ডান-হাতি । বন্টন অভিন্ন (এর সব মান হয় সমানভাবে সম্ভাব্য হয়) এবং দুই লোকেরা পালন থাকার সমতূল্য যার মধ্যে একটি বাম হাত এবং অন্যটি ডানহাতে।αβneq=α+βBeta(πLH|α=1,β=1)πLH
উত্তরোত্তর বিটা বিতরণটি কেবলমাত্র যেখানে নমুনার আকার এবং নমুনায় বাম-হাতের সংখ্যা। এর পূর্ববর্তী তাই । তাই অবর বিটা বিতরণের পরামিতি এটি, কেবলমাত্র আমরা যোগ বাম-হাতি এবং ডান-হাতি থেকে । পূর্বের পার্থক্যটি হ'লBeta(z+α,N−z+β)NzπLH(z+α)/(N+α+β)zαN−zβ(z+α)(N−z+β)(N+α+β)2(N+α+β+1)। মনে রাখবেন যে একটি উচ্চ তথ্যবহুল পূর্ববর্তীটিও উত্তরোত্তর বিতরণের একটি ছোট বৈচিত্রের দিকে পরিচালিত করে (নীচের গ্রাফগুলি বিন্দুটি সুন্দরভাবে চিত্রিত করে)।
আপনার ক্ষেত্রে, এবং এবং আপনার পূর্ববর্তীটি ইউনিফর্ম যা অননুমোদিত, তাই । আপনার উত্তর বিতরণ অতএব । পূর্ববর্তী গড়টি হ'ল । এখানে একটি গ্রাফ রয়েছে যা পূর্বের, ডেটা এবং উত্তরগুলির সম্ভাবনা দেখায় showsz=2N=18α=β=1Beta(3,17)π¯LH=3/(3+17)=0.15
আপনি দেখতে পাচ্ছেন যে আপনার পূর্ববর্তী বিতরণটি তথ্যহীন, আপনার উত্তরোত্তর বিতরণ সম্পূর্ণরূপে ডেটা দ্বারা চালিত। উত্তরোত্তর বিতরণের জন্য সর্বোচ্চ ঘনত্বের ব্যবধান (এইচডিআই) প্লটও করা হয়েছে। কল্পনা করুন যে আপনি আপনার উত্তরোত্তর বিতরণটি 2 ডি-বেসিনে রেখেছেন এবং 95% বন্টনের জলরেখার উপরে না হওয়া পর্যন্ত আপনি জল পূরণ শুরু করেন। যে পয়েন্টগুলি উত্তরোত্তর বিতরণের সাথে জলরেখা ছেদ করে সেগুলি 95% -HDI গঠন করে। এইচডিআই এর প্রতিটি পয়েন্টের বাইরের কোনও বিন্দুর চেয়ে উচ্চতর সম্ভাবনা থাকে। এছাড়াও, এইচডিআই সর্বদা উত্তরোত্তর বিতরণের শীর্ষস্থান (যেমন মোড) অন্তর্ভুক্ত করে। এইচডিআই একটি সমান লেজযুক্ত 95% বিশ্বাসযোগ্য ব্যবধানের চেয়ে পৃথক যেখানে উত্তরের প্রতিটি পুচ্ছ থেকে 2.5% বাদ দেওয়া হয় ( এখানে দেখুন )।
আপনার দ্বিতীয় কাজের জন্য, আপনাকে তথ্য অন্তর্ভুক্ত করতে বলা হয়েছে যে জনসংখ্যার ৫-২০% বাম-হ্যান্ডার অ্যাকাউন্টে রয়েছে। এটি করার বিভিন্ন উপায় রয়েছে। সবচেয়ে সহজ বলা যায় যে পূর্ববর্তী বিটা গড় পরিমাণ হওয়া উচিত যা এবং । তবে কীভাবে পূর্ব বিটা বিতরণের এবং চয়ন করবেন ? প্রথমে আপনি পূর্বে বন্টন আপনার গড় হতে চান সমতুল্য নমুনা আকারের একটি সিউডো-নমুনা থেকে বের । আরও সাধারণভাবে, আপনি যদি পূর্বের একটি সিউডো-নমুনা আকারের with , সংশ্লিষ্ট সহ একটি গড় করতে চান0.1250.050.2αβ0.125neqmneqαএবং মান হল: এবং । আপনার এখন যা করা বাকি তা হ'ল সিউডো-নমুনা আকার যা আপনার পূর্বের তথ্য সম্পর্কে আপনি কতটা আত্মবিশ্বাসী তা নির্ধারণ করে। ধরা যাক আপনি আপনার পূর্বের তথ্য সম্পর্কে খুব নিশ্চিত এবং সেট করেছেন । আপনার পূর্ববর্তী বিতরণের প্যারামিটারগুলি এখানে রয়েছে d সিডট এবং d সিডট । অবর বন্টন করা হয় সম্পর্কে একটি গড় সঙ্গে যা কার্যত পূর্ব গড় হিসাবে একইβα=mneqβ=(1−m)neqneqneq=1000α=0.125⋅1000=125β=(1−0.125)⋅1000=875Beta(127,891)0.1250.125। পূর্বের তথ্যগুলি উত্তরোত্তর উপর প্রভাব ফেলছে (নিম্নলিখিত গ্রাফটি দেখুন):
আপনি যদি পূর্বের তথ্য সম্পর্কে কম নিশ্চিত হন তবে আপনি নিজের সিউডো-নমুনার সেট করতে পারেন , বলে , যা আপনার পূর্ববর্তী বিটা বিতরণের জন্য এবং । অবর বন্টন করা হয় প্রায় একটি গড় সঙ্গে । উত্তরোত্তর গড়টি এখন আপনার ডেটা ( ) এর গড়ের কাছাকাছি কারণ ডেটা যায়। পরিস্থিতি দেখানো গ্রাফটি এখানে:neq10α=1.25β=8.75Beta(3.25,24.75)0.1160.111
পূর্বে তথ্য একত্রিত একটি আরো উন্নত পদ্ধতি বলতে চাই যে হবে আপনার পূর্বের বিটা বিতরণের সমাংশক সম্পর্কে হওয়া উচিত এবং সমাংশক সম্পর্কে হওয়া উচিত । এটি বলার সমান যে আপনার 95% নিশ্চিত যে জনসংখ্যায় বাম-হাতের অনুপাত 5% এবং 20% এর মধ্যে রয়েছে। আর প্যাকেজটিতে ফাংশনটি এই জাতীয় কোয়ান্টাইলের সাথে সম্পর্কিত বিটা বিতরণের সম্পর্কিত এবং মান গণনা করে । কোডটি হ'ল0.0250.050.9750.2beta.select
LearnBayes
αβ
library(LearnBayes)
quantile1=list(p=.025, x=0.05) # the 2.5% quantile should be 0.05
quantile2=list(p=.975, x=0.2) # the 97.5% quantile should be 0.2
beta.select(quantile1, quantile2)
[1] 7.61 59.13
দেখে মনে হচ্ছে এবং সহ একটি বিটা বিতরণে পছন্দসই বৈশিষ্ট্য রয়েছে। পূর্বের যা আপনার তথ্য ( ) এর গড়ের নিকটে । আবার এই পূর্ববর্তী সমতুল্য নমুনা আকারের সিউডো-নমুনার তথ্য অন্তর্ভুক্ত করে । অবর বন্টন করা হয় এর একটি গড় সঙ্গে যা পূর্ববর্তী বিশ্লেষণ একটি অত্যন্ত তথ্যপূর্ণ ব্যবহার গড় সঙ্গে তুলনা করা যায় পূর্বে। এখানে সম্পর্কিত গ্রাফটি রয়েছে:α=7.61β=59.137.61/(7.61+59.13)≈0.1140.111neq≈7.61+59.13≈66.74Beta(9.61,75.13)0.113Beta(125,875)
বায়েশিয়ান যুক্তি এবং সাধারণ বিশ্লেষণের একটি সংক্ষিপ্ত তবে imho ভাল ওভারভিউয়ের জন্য এই রেফারেন্সটি দেখুন । কনজুগেট বিশ্লেষণের জন্য দীর্ঘতর ভূমিকা, বিশেষত দ্বিপদী তথ্যের জন্য এখানে পাওয়া যাবে । বায়েশিয়ান চিন্তার সাধারণ পরিচিতি এখানে পাওয়া যাবে । বেসিয়ান পরিসংখ্যানের দিকগুলি সম্পর্কে আরও স্লাইডগুলি এখানে রয়েছে ।