আমি ক্যান্সারের হার সম্পর্কিত মডেলিংয়ের উদাহরণ উদাহরণ হিসাবে বর্ণনা করতে চাই (জনসন এবং অ্যালবার্ট ১৯৯৯ হিসাবে)। এটি আপনার আগ্রহের প্রথম এবং তৃতীয় উপাদান স্পর্শ করবে।
তাই সমস্যাটি বিভিন্ন শহরে ক্যান্সারের হারের পূর্বাভাস দিচ্ছে। আমরা বিভিন্ন শহরে মানুষের সংখ্যা ডাটা আছে বলুন এবং যারা ক্যান্সারে মারা যান সংখ্যা । বলুন আমরা ক্যান্সারের হারগুলি অনুমান করতে চাই । তাদের মডেল করার বিভিন্ন উপায় রয়েছে এবং আমরা তাদের প্রতিটিটির সাথে সমস্যা দেখতে পাচ্ছি। আমরা দেখব কীভাবে উত্তরাধিকারী বেইস মডেলিং কিছু সমস্যা কাটিয়ে উঠতে পারে।
১. একটি উপায় হ'ল পৃথকভাবে প্রাক্কলন করা তবে আমরা স্বল্প ডেটা সমস্যায় এবং কম মতো হারের একটি হ্রাস করা হবে ।x i θ i N i θ i θ i θ i x i ∼ B i n ( N i , θ i ) θ i ∼ B e t a ( a , b ) p ( D , θ , η | N ) = p ( η ) ∏ N i = 1 B iএনআমিএক্সআমিθআমি
এনআমি
২. স্পার্স ডেটা সমস্যা পরিচালনা করার জন্য আরও একটি পদ্ধতি সমস্ত নগরীর জন্য একই ব্যবহার করা এবং প্যারামিটারগুলি তবে এটি একটি খুব ।
৩. সুতরাং যা করা যায় তা সমস্ত এর কোনও নয় তবে শহরের নির্দিষ্ট প্রকরণের সাথেও একই রকম। সুতরাং কেউ এমনভাবে মডেল করতে পারে যে সমস্ত গুলি একটি সাধারণ বিতরণ থেকে আঁকা। বলুন এবং
একটি পূর্ণ যৌথ বন্টন হবে তারপর যেখানে । আমরা অনুমান করা প্রয়োজনθআমি
θআমিθআমিএক্সআমি∼ বি i এন ( এনআমি, θআমি)θআমি∼ বি ই টি এ ( ক , খ )
η = ( a , b ) η θ i η θ iপি ( ডি , θ , η)| এন) = পি ( η) ∏এনi = 1খ i এন ( এক্সআমি| এনআমি, θআমি) বি ই টি ক ( θআমি| η)η= ( ক , খ )ηতথ্য থেকে। যদি এটি একটি ধ্রুবকটিতে থাকে তবে তথ্যটি মধ্যে প্রবাহিত হবে না এবং তারা শর্তাধীন স্বাধীন। তবে ta অজানা হিসাবে বিবেচনা করে আমরা কম ডেটাযুক্ত শহরগুলিকে আরও ডেটাযুক্ত শহরগুলির থেকে পরিসংখ্যানিক শক্তি ধার করতে দিয়েছি।
মূল ধারণাটি হ'ল হাইপারপ্যারামিটারে অনিশ্চয়তার মডেল হিসাবে আরও বায়সিয়ান এবং প্রিয়ারকে প্রিয়ার স্থাপন করা। এটি এই উদাহরণে এর মধ্যে প্রভাব প্রবাহকে মঞ্জুরি দেয় ।θআমিη
θআমি