ডিকরান মার্সুপিয়ালের মন্তব্যে (ক্রস-বৈধতা) মাত্র কিছুটা বাড়ানো। মূল ধারণাটি হ'ল কোনও উপায়ে আপনার ডেটা প্রশিক্ষণ এবং বৈধতা সেটগুলিতে বিভক্ত করা, বিভিন্ন সংখ্যক উপাদান চেষ্টা করে সংশ্লিষ্ট প্রশিক্ষণ এবং বৈধতা সম্ভাবনার মানগুলির ভিত্তিতে সেরাটি নির্বাচন করা select
জিএমএমের সম্ভাবনা হ'ল সংজ্ঞা অনুসারে, যেখানে উপাদানগুলির (ক্লাস্টার) সংখ্যা এবং number , , মডেল প্যারামিটার। এর মান পরিবর্তন করে আপনি নীচের মত প্রশিক্ষণ এবং বৈধতা সেট জন্য GMM সম্ভাবনা প্লট করতে পারেন।p ( x | π), μ , Σ ) =Σকেπটএন( এক্স |)μট,Σট)কেπμΣকে
এই উদাহরণে এটি সুস্পষ্ট হওয়া উচিত যে উপাদানগুলির সর্বোত্তম সংখ্যাটি প্রায় 20 এর কাছাকাছি C এই সম্পর্কে একটি দুর্দান্ত ভিডিও রয়েছে কোরসেরায়, এবং এটিই আমি এখানে থেকে উপরের ছবিটি পেয়েছি।
পদ্ধতিটিতে ব্যবহৃত অন্য একটি হ'ল বেইসিয়ান তথ্য মাপদণ্ড (বিআইসি) :
যেখানে সম্ভাবনা, কে প্যারামিটারের সংখ্যা এবং ডাটা পয়েন্টের সংখ্যা। এটি লগ সম্ভাবনার পরামিতিগুলির সংখ্যার জন্য একটি জরিমানা যুক্ত হিসাবে বোঝা যায়।
বি আইসি= - 2 লগ( এল ) + কেলগ( এন )
এলএন