সমস্যার পটভূমি: আমি এমন একটি প্রকল্পে কাজ করছি যা আইটি মনিটরিং স্পেসে (আইটি স্পেস সম্পর্কে আমার সর্বোত্তম বোঝার জন্য) খুঁজে পাওয়া অনুরূপ লগ ফাইলগুলিতে জড়িত। এই লগ ফাইলগুলি টাইম-সিরিজ ডেটা, বিভিন্ন পরামিতিগুলির কয়েকশ / হাজারে সারিতে সংগঠিত। প্রতিটি প্যারামিটার সংখ্যাসূচক (ভাসা) এবং প্রতিটি সময় পয়েন্টের জন্য একটি তুচ্ছ / নন-ত্রুটিযুক্ত মান থাকে। আমার কাজটি হ'ল অস্বাভাবিক সনাক্তকরণের জন্য লগ ফাইলগুলি (স্পাইকস, ফলস, কিছু পরামিতি সিঙ্কের বাইরে থাকা, অদ্ভুত ১ ম / ২ য় / ইত্যাদি der ডেরিভেটিভ আচরণ ইত্যাদি) জন্য লগ ফাইলগুলি পর্যবেক্ষণ করা।
অনুরূপ অ্যাসাইনমেন্টে, আমি প্রিলার্টের সাথে স্প্লঙ্কটি চেষ্টা করেছি, তবে আমি এই মুহুর্তে ওপেন-সোর্স বিকল্পগুলি অন্বেষণ করছি।
সীমাবদ্ধতা: আমি পাইথনে নিজেকে সীমাবদ্ধ রাখছি কারণ আমি এটি ভালভাবে জানি, এবং আরে এবং সম্পর্কিত শিক্ষার বক্ররেখার দিকে যেতে দেরি করতে চাই। আর (বা অন্যান্য ভাষা / সফ্টওয়্যার) এর জন্য অপ্রতিরোধ্য সমর্থন বলে মনে না হলে আমি এই কাজের জন্য পাইথনকে আঁকড়ে রাখতে চাই।
এছাড়াও, আমি মুহূর্তের জন্য একটি উইন্ডোজ পরিবেশে কাজ করছি। আমি ছোট আকারের লগ ফাইলগুলিতে উইন্ডোজের স্যান্ডবক্সে চালিয়ে যেতে চাই তবে প্রয়োজনে লিনাক্স পরিবেশে যেতে পারি।
সংস্থানসমূহ: ফলাফল হিসাবে আমি মৃত-প্রান্তগুলি সহ নিম্নলিখিতগুলি পরীক্ষা করে দেখেছি:
জালিয়াতি সনাক্তকরণের জন্য মেশিন লার্নিং অ্যালগরিদমগুলি প্রয়োগ করার জন্য পাইথন বা আর । এখানে কিছু তথ্য সহায়ক, তবে দুর্ভাগ্যক্রমে, আমি সঠিক প্যাকেজটি খুঁজতে লড়াই করছি কারণ:
টুইটারের "অ্যানোমালি ডিটেকশন" আর এ আছে এবং আমি পাইথনকে আঁকড়ে রাখতে চাই। তদুপরি, পাইথন বন্দর অদ্ভুততা আমার জন্য উইন্ডোজ পরিবেশে প্রয়োগের ক্ষেত্রে সমস্যা সৃষ্টি করেছে।
আমার পরবর্তী প্রচেষ্টা, স্কাইলাইন মনে হয় বেশ কিছুটা বন্ধ হয়ে গেছে ( গিথুব সমস্যাগুলি থেকে )। অনলাইনে সামান্য সমর্থন বলে মনে হচ্ছে তা দেওয়া হলেও আমি এর গভীরে ডুব দিয়েছি না।
আমি এখনও সন্ধান করছি, কিন্তু এটি অনেক বেশি ম্যানুয়াল বলে মনে হচ্ছে। নিচু আগাছা পদ্ধতিটি আমার কাছে ঠিক আছে তবে শেখার সরঞ্জামগুলিতে আমার পটভূমি দুর্বল, সুতরাং স্প্লঙ্ক + প্রিলার্টের মতো অ্যালগরিদমের মতো প্রযুক্তিগত দিকগুলির জন্য একটি ব্ল্যাক বক্সের মতো কিছু চাই।
সমস্যার সংজ্ঞা এবং প্রশ্নসমূহ: আমি ওপেন-সোর্স সফ্টওয়্যারটি খুঁজছি যা পাইথনে টাইম-সিরিজ লগ ফাইলগুলি প্যাকেজ বা লাইব্রেরির মাধ্যমে অ্যানোমালি সনাক্তকরণের প্রক্রিয়াটি স্বয়ংক্রিয়করণে আমাকে সহায়তা করতে পারে।
- আমার তাত্ক্ষণিক কাজে সহায়তা করার জন্য এই জাতীয় জিনিসগুলি উপস্থিত রয়েছে, বা সেগুলি কি আমার মনে কাল্পনিক?
- ব্যাকগ্রাউন্ড ফান্ডামেন্টাল বা ধারণাগুলি সহ আমার লক্ষ্যতে আমাকে সহায়তা করতে কেউ কি দৃ concrete় পদক্ষেপে সহায়তা করতে পারেন?
- জিজ্ঞাসা করার জন্য এটিই কি সেরা স্ট্যাকএক্সচেঞ্জ সম্প্রদায়, বা স্ট্যাটস, ম্যাথ, এমনকি সুরক্ষা বা স্ট্যাকওভারফ্লো আরও ভাল বিকল্প?
সম্পাদনা করুন [২০১৫-০7-২৩] নোট করুন যে অদ্ভুততার সর্বশেষ আপডেটটি উইন্ডোজ পরিবেশের জন্য স্থির হয়েছে বলে মনে হচ্ছে ! আমি এখনও নিশ্চিত করতে পারি না, তবে সম্প্রদায়ের জন্য অন্য দরকারী সরঞ্জাম হওয়া উচিত।
সম্পাদনা [2016-01-19] একটি ছোট্ট আপডেট। আমার এটি নিয়ে গবেষণা এবং গবেষণার জন্য সময় ছিল না, তবে আমি সুনির্দিষ্ট বিবরণে গবেষণা চালিয়ে যাওয়ার আগে এই সমস্যার মৌলিক বিষয়গুলি বুঝতে আমি একটি পদক্ষেপ ফিরে নিচ্ছি। উদাহরণস্বরূপ, আমি যে দুটি দৃ concrete় পদক্ষেপ নিচ্ছি তা হ'ল:
অসঙ্গত সনাক্তকরণের জন্য উইকিপিডিয়া নিবন্ধগুলি দিয়ে শুরু করা [ https://en.wikedia.org/wiki/Anomaly_detection ], সম্পূর্ণরূপে বুঝতে এবং তারপরে হয় অন্য লিঙ্কযুক্ত উইকিপিডিয়া নিবন্ধগুলির ধারণা বিকাশের উপরে বা নীচে সরানো, যেমন [ https: // en.wikedia.org/wiki/K-narerest_neighbors_algorithm ], এবং তারপরে [ https://en.wikedia.org/wiki/Machine_learning ]।
চান্ডোলা এট আল ২০০৯ "অ্যানোমালি ডিটেকশন: একটি জরিপ" [ http://www-users.cs.umn.edu/~banerjee/papers/09/anomaly.pdf ] এবং হজ এট আল 2004 এর দুর্দান্ত সমীক্ষায় কৌশলগুলি অন্বেষণ করে "আউটিলার সনাক্তকরণ পদ্ধতির একটি সমীক্ষা" [ http://eprints.whiterose.ac.uk/767/1/hodgevj4.pdf ]।
ধারণাগুলি আরও ভালভাবে বুঝতে পারলে (আমি ব্যবহারিক দিকটিও উন্নত করতে গিয়ে খেলনার উদাহরণগুলি নিয়ে ঘুরে দেখব), আমি বুঝতে পারব যে কোন ওপেন সোর্স পাইথন সরঞ্জামগুলি আমার সমস্যার জন্য আরও উপযুক্ত।