এই হাইপারপ্রাইয়ার সমস্যার সমাধানটি প্রদর্শনের জন্য, আমি পাইএমসি 3-তে একটি শ্রেণিবিন্যাসিক গামা-ডিরিচলেট-মাল্টিনোমিয়াল মডেলটি প্রয়োগ করেছি। টেডি ডানিংয়ের ব্লগ পোস্টে দিরিচ্লেটের পূর্বের গামা নির্দিষ্ট এবং নমুনাযুক্ত ।
আমি প্রয়োগ করা মডেলটি এই গিস্টটিতে পাওয়া যাবে তবে নীচেও বর্ণিত হয়েছে:
এটি সিনেমা রেটিংয়ের জন্য একটি বয়েসিয়ান হায়ারার্কিকাল (পুলিং) মডেল। প্রতিটি মুভি শূন্য থেকে পাঁচ পর্যন্ত স্কেলে রেট দেওয়া যায়। প্রতিটি মুভি বেশ কয়েকবার রেট করা হয়। আমরা প্রতিটি সিনেমার জন্য রেটিংগুলির একটি দ্রুত বন্টন খুঁজে পেতে চাই।
আমরা ডেটা থেকে মুভি রেটিংয়ের উপরে একটি শীর্ষ স্তরের পূর্ব বিতরণ (হাইপারপ্রায়ার) শিখতে চলেছি। এরপরে প্রতিটি মুভিটির নিজস্ব প্রাক থাকবে যা এই শীর্ষ-স্তরের পূর্বের দ্বারা ধীরে ধীরে ছড়িয়ে পড়ে। এ সম্পর্কে চিন্তাভাবনার আরেকটি উপায় হ'ল প্রতিটি সিনেমার রেটিংয়ের পূর্বেরটি গ্রুপ-স্তর, বা পুল করা, বিতরণের দিকে সঙ্কুচিত হবে।
যদি কোনও সিনেমার একটি অ্যাটিকিকাল রেটিং বিতরণ থাকে তবে এই পদ্ধতির রেটিংগুলি প্রত্যাশিত সাথে আরও কিছুটা ইন-লাইনে সঙ্কুচিত করবে। তদ্ব্যতীত, এই শিখানো পূর্বে কয়েকটি রেটিং সহ সিনেমাগুলি বুটস্ট্র্যাপ করতে কার্যকর হতে পারে যাতে অনেকগুলি রেটিংয়ের সাথে চলচ্চিত্রের তুলনায় অর্থপূর্ণভাবে তুলনা করা যায়।
মডেলটি নিম্নরূপ:
γকে = 1 ... কে∼ জি এ এম এম এ ( α , β))
θমি = 1 ... এম~ ডি আমি দ আমি গ জ ঠ ই টিএম( সি γ)1, । । । , গ γকে)
z- রমি = 1 ... এম, এন = 1 ... এনমি। সিa t e go r i c a lএম( θ)মি)
কোথায়:
- কে মুভি রেটিং স্তরের সংখ্যা (যেমন বোঝায় রেটিং 0, ..., 5)কে= 6
- এম মুভি রেট করা হচ্ছে
- এনমি জন্য রেটিং সংখ্যাm
- α=1/K গামা আরভিএসের সংগ্রহকে তাত্পর্যপূর্ণ সহগ হিসাবে কাজ করে
- βon পূর্বে সূচকীয় শীর্ষ স্তরের জন্য রেট প্যারামিটার
- c ঘনত্ব পরামিতি উপরের স্তরের শক্তি আগে নির্ধারিত
- কেγk টপ লেভেল রেটিং স্তরের জন্য পূর্বেk
- θm চলচ্চিত্র-স্তরের রেটিং স্তরের পূর্বে (মাত্রা = দিয়ে মাল্টিভিয়ারেট )K
- এন মিzmn রেটিং সিনেমার জন্যnm