প্রশ্নের সূচনা থেকে, আমি ধরে নিই যে ব্যতিক্রমগুলির কোনও (উদাহরণস্বরূপ) লেবেল নেই no এই অনুমানের সাথে, একটি সম্ভাব্য পদ্ধতির অটোইনকোডারগুলি ব্যবহার করা হবে : নিউরাল নেটওয়ার্কগুলি যা আপনার ডেটা ইনপুট হিসাবে গ্রহণ করে এবং সেই একই ডেটা আউটপুট দেওয়ার প্রশিক্ষণপ্রাপ্ত। ধারণাটি হ'ল প্রশিক্ষণটি নেটকে সুপ্ত ভেরিয়েবলের আকারে ইনপুট ডেটা বিতরণের উপস্থাপনা শিখতে দিয়েছে।
ডেনোইজিং অটোইনকোডার নামে এক ধরণের অটোইনকোডার রয়েছে , যা ইনপুট হিসাবে মূল ডেটার দূষিত সংস্করণ এবং আউটপুট হিসাবে নিরবচ্ছিন্ন মূল ডেটা দিয়ে প্রশিক্ষিত । এটি এমন একটি নেটওয়ার্ক সরবরাহ করে যা শব্দগুলি (অর্থাত্ ডেটা দুর্নীতি) ইনপুটগুলি থেকে সরিয়ে ফেলতে পারে ।
আপনি প্রতিদিনের ডেটা দিয়ে কোনও ডিনোইজিং অটোরকোডারকে প্রশিক্ষণ দিতে পারেন। তারপরে এটি নতুন প্রতিদিনের ডেটাতে ব্যবহার করুন; এইভাবে আপনার কাছে মূল দৈনিক ডেটা এবং সেই একই ডেটার একটি নিরবচ্ছিন্ন সংস্করণ রয়েছে। এরপরে আপনি উভয়কে তুলনামূলকভাবে গুরুত্বপূর্ণ পার্থক্য সনাক্ত করতে পারেন ।
এখানে কীটি আপনার চয়নযোগ্য উল্লেখযোগ্য পার্থক্যের সংজ্ঞা । আপনি ইউক্যালিডিয়ান দূরত্ব গণনা করতে পারেন এবং ধরে নিতে পারেন যে এটি যদি কিছু স্বেচ্ছাসেবী চৌম্বককে ছাড়িয়ে যায় তবে আপনার একটি অসঙ্গতি রয়েছে। আর একটি গুরুত্বপূর্ণ বিষয় হ'ল আপনি যে ধরণের দুর্নীতি প্রবর্তন করেছেন; যুক্তিসঙ্গত অস্বাভাবিকতার জন্য তাদের যতটা সম্ভব কাছাকাছি হওয়া উচিত।
আরেকটি বিকল্প হ'ল জেনারেটাল অ্যাডভারসিয়াল নেটওয়ার্কগুলি ব্যবহার করা । প্রশিক্ষণের উপ-উত্পাদক একটি বৈষম্যমূলক নেটওয়ার্ক যা সাধারণ দৈনিক ডেটা অস্বাভাবিক ডেটা থেকে আলাদা করে দেয়।