ধরুন আপনার কাছে একটি ওয়েব সার্ভারের লগ রয়েছে। এই লগগুলিতে আপনার এই ধরণের টিপল রয়েছে:
user1, timestamp1
user1, timestamp2
user1, timestamp3
user2, timestamp4
user1, timestamp5
...
এই টাইমস্ট্যাম্পগুলি যেমন ব্যবহারকারীদের ক্লিককে উপস্থাপন করে। এখন, user1
মাসে একাধিকবার (সেশনস) সাইটটি পরিদর্শন করবে এবং প্রতিটি সেশনের সময় প্রতিটি ব্যবহারকারীর কাছ থেকে আপনি কয়েকবার ক্লিক পেয়ে যাবেন (মনে করুন যে কোনও ব্যবহারকারী যখন আপনার সাইটটিতে যান, তিনি একাধিক পৃষ্ঠায় ক্লিক করবেন)।
ধরুন আপনি ক্লিকগুলি এই বিস্ফোরণগুলি সেশনগুলিতে ভাগ করতে চান যা সেগুলি তৈরি করেছে, তবে আপনার কাছে কোনও অতিরিক্ত উত্স নেই, কেবলমাত্র টাইমস্ট্যাম্পগুলির তালিকা list যদি আপনি একই ব্যবহারকারীর দুটি ফলস্বরূপ ক্লিকগুলির মধ্যে অন্তরগুলির বিতরণ গণনা করেন তবে আপনি একটি দীর্ঘ-লেজযুক্ত বিতরণ পাবেন। স্বজ্ঞাতভাবে, আপনি একটি "কাটা প্যারামিটার" সন্ধান করতে চাইবেন, যেমন এন সেকেন্ড, যেখানে যদি হয় timestamp_{i+1} - timestamp{i} > N
তবে আপনার timestamp_{i+1}
নতুন সেশনের শুরু।
সমস্যাটি হ'ল বাস্তবে এই বিতরণটি দুটি ভেরিয়েবলের মিশ্রণ: এক্স = "একই সেশনে দুটি ফলস্বরূপ ক্লিকের মধ্যে অন্তর" এবং ওয়াই = "পূর্ববর্তী সেশনের শেষ ক্লিক এবং নতুনটির প্রথমটির মধ্যে অন্তর"।
প্রশ্নটি হল, এই এনটিকে কীভাবে অনুমান করা যায়, যা কেবল দুটি ক্লিকগুলি বার্ট দেখে দুটি বিতরণকে (সম্ভবত কিছুটা ওভারল্যাপ দিয়ে) ভাগ করে দেয়?