ঘনত্বের অনুমানের প্রয়োগের জন্য একটি সাধারণ বিষয় হ'ল অভিনবত্ব সনাক্তকরণ, ওরফে আউটলেটারের সনাক্তকরণ, যেখানে ধারণাটি কেবলমাত্র আপনার (বা বেশিরভাগ) এক ধরণের ডেটা রয়েছে তবে আপনি খুব বিরল, গুণগত স্বতন্ত্র ডেটাতে আগ্রহী, যা থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয় যারা সাধারণ ক্ষেত্রে।
উদাহরণস্বরূপ হ'ল জালিয়াতি সনাক্তকরণ, সিস্টেমে ব্যর্থতা সনাক্তকরণ ইত্যাদি। এগুলি এমন পরিস্থিতিতে যেখানে আপনার আগ্রহী বাছাইয়ের ডেটা সংগ্রহ করা খুব কঠিন এবং / অথবা ব্যয়বহুল These এই বিরল ক্ষেত্রে, অর্থাত্ হ'ল সম্ভাবনা কম।
বেশিরভাগ সময় আপনি সঠিকভাবে সঠিক বিতরণটি সঠিকভাবে অনুমান করতে আগ্রহী হন না, তবে আপেক্ষিক প্রতিক্রিয়াগুলিতে (প্রদত্ত নমুনাটি সত্যিকারের বহিরাগত বনাম একটি না হওয়ার সম্ভাবনা কতটা সম্ভব)।
বিষয়টিতে কয়েক ডজন টিউটোরিয়াল এবং পর্যালোচনা রয়েছে। এই এক একটি ভাল এক দিয়ে শুরু করতে হতে পারে।
সম্পাদনা: কারও কারও কাছে বহিরাগত সনাক্তকরণের জন্য ঘনত্বের অনুমান ব্যবহার করে বিজোড় বলে মনে হচ্ছে। আসুন প্রথমে একটি বিষয়ে আমরা একমত হই : যখন কেউ তার উপাত্তের সাথে একটি মিশ্রণের মডেল ফিট করে, তখন সে আসলে ঘনত্বের অনুমান করে। একটি মিশ্রণ মডেল সম্ভাবনার বন্টন উপস্থাপন করে।
কেএনএন এবং জিএমএম আসলে সম্পর্কিত: এগুলি সম্ভাবনার ঘনত্বের অনুমানের দুটি পদ্ধতি। অভিনবত্ব সনাক্তকরণে অনেক পদ্ধতির জন্য এটি অন্তর্নিহিত ধারণা। উদাহরণস্বরূপ, এই এক উপর kNNs, এই ভিত্তিক অন্যটি Parzen জানালা (যা কাগজ শুরুতে এই খুব ধারণা জোর) উপর ভিত্তি করে, এবং অনেক অন্যদের ।
এটি আমার কাছে মনে হয় (তবে এটি কেবল আমার ব্যক্তিগত উপলব্ধি) সর্বাধিক যদি না হয় তবে এই ধারণাটি নিয়ে কাজ করে। আপনি কীভাবে অন্যমনস্ক / বিরল ইভেন্টের ধারণাটি প্রকাশ করবেন?