মেশিন লার্নিংয়ের প্রসঙ্গে আউটিলার এবং অ্যানোমালির মধ্যে পার্থক্য কী। আমার বোঝা হচ্ছে যে উভয়ই একই জিনিসকে বোঝায় to
মেশিন লার্নিংয়ের প্রসঙ্গে আউটিলার এবং অ্যানোমালির মধ্যে পার্থক্য কী। আমার বোঝা হচ্ছে যে উভয়ই একই জিনিসকে বোঝায় to
উত্তর:
দুটি পদটি প্রতিশব্দ অনুসারে:
আগরওয়াল, চারু সি আউটিলার বিশ্লেষণ। স্প্রিঞ্জার নিউ ইয়র্ক, 2017, দোই: http://dx.doi.org/10.1007/978-3-319-47578-3_1
পৃষ্ঠা 1 থেকে উদ্ধৃতি:
আউটলিয়ারদের ডেটা মাইনিং এবং পরিসংখ্যান সাহিত্যের অস্বাভাবিকতা, বিভেদ, বিচ্যুততা বা ব্যতিক্রম হিসাবেও ডাকা হয় ।
সাহসী পাঠ্য মূল পাঠ্যের অংশ নয়।
লেখকের কাছ থেকে উপলব্ধ বইয়ের পিডিএফ ডাউনলোড বিনামূল্যে here
একটি জিভ ইন গাল উত্তর:
আউটলেটর: এমন একটি মান যা আপনি পূর্বে আপনার ডেটাতে সন্ধান করেন যা আপনার মডেলটি সঠিকভাবে কাজ করে না তা নির্দেশ করে
অ্যানোমালি: একটি মান যা আপনার ডেটাতে খুঁজে পাওয়া সমস্ত প্রতিকূলের বিরুদ্ধে যা আপনার মডেলটিকে সঠিকভাবে কাজ করে তা নির্দেশ করে
আরও মারাত্মক, কম ক্রিপ্টিক উত্তর:
আউটলিয়ারদের ধারণাটি এমন একটি মডেল তৈরির বিষয়টি থেকে শুরু হয় যা ডেটা সম্পর্কে অনুমান করে। আউটলিয়াররা প্রায়শই সূচক হয় যে মডেলটি ডেটা সঠিকভাবে বর্ণনা করে না এবং তাই আমাদের মডেলগুলির ফলাফল বা আমাদের ডেটার গুণমান সম্পর্কে প্রশ্ন করা উচিত।
তাত্ত্বিক জগতের বাইরে এবং প্রয়োগকৃত বিশ্বের ভিতরে ব্যতিক্রমগুলির ধারণাটি শুরু হয়: আমরা আমাদের তথ্যগুলিতে অস্বাভাবিক আচরণের সন্ধান করতে চাই, কখনও কখনও এই সত্য দ্বারা অনুপ্রাণিত হয় যে কেউ এমন আচরণের প্রতি আগ্রহী যেটি লুকানোর চেষ্টা করছে (একটি ভাইরাসের মতো একটি ভাইরাস হিসাবে) ইমেইল)। সমস্যাটি হ'ল যেহেতু লোকেরা যা করছে তা আড়াল করার চেষ্টা করছে, তাই আমরা কীভাবে সন্ধান করব তা সত্যি জানি না। সুতরাং আমরা "ভাল" ডেটার একটি সেট নিয়েছি এবং সিদ্ধান্ত নিয়েছি যে আমরা আমাদের নতুন ডেটাসেটে যা দেখতে পাই যা "ভাল" দেখাচ্ছে না তা একটি বিরাগ এবং আমাদের বিশদটি আরও বিশদে বিশদ অনুসন্ধানের জন্য উপযুক্ত। প্রায়শই, অসঙ্গতিগুলির সন্ধানের অর্থ আপনার নতুন ডেটা সেটে বহিরাগতদের সন্ধান করা। তবে মনে রাখবেন যে আপনার পুরানো ডেটাসেটে বিরল সত্ত্বেও এই মানগুলি আপনার নতুন ডেটাসেটে খুব সাধারণ হতে পারে !
সংক্ষেপে, দুটি ধারণাগুলি তাদের পেছনের পরিসংখ্যানের ক্ষেত্রে খুব একই রকম (যেমন আপনার উপযুক্ত মডেলটি দেওয়া অস্বাভাবিক মান) তবে বিভিন্ন কোণ থেকে ধারণাটি আসে come তদুপরি, যখন আমরা আউটলিয়ারদের নিয়ে কথা বলি, আমরা সাধারণত আমাদের মডেলটিকে ফিট করার জন্য ব্যবহৃত ডেটাতে একটি অস্বাভাবিক ডেটা পয়েন্ট বলতে বুঝি যেখানে অসাধারণতা হিসাবে সাধারণত আমাদের মডেলটি ফিট করার জন্য ব্যবহৃত ডেটার বাইরে কোনও ডেটাসেটে একটি অস্বাভাবিক ডেটা পয়েন্ট হিসাবে বোঝানো হয় ।
দ্রষ্টব্য: এই উত্তরটি আমি আনুষ্ঠানিক সংজ্ঞা পরিবর্তে দুটি শব্দটি প্রায়শই কীভাবে ব্যবহার করেছি তা নির্ভর করে। ব্যবহারকারীর অভিজ্ঞতা পৃথক হতে পারে।
বেমানান এমন একটি ফলাফল যা বেস বিতরণ (আমাদের অনুমানগুলি সঠিক হলে একটি অসম্ভবতা) দিয়ে ব্যাখ্যা করা যায় না। বেস ডিস্ট্রিবিউশন (একটি অসম্ভাব্যতা) প্রদত্ত একটি আউটলিয়ার একটি সম্ভাবনাময় ঘটনা।
পদগুলি মূলত একটি বিনিময়যোগ্য পদ্ধতিতে ব্যবহৃত হয়। "আউটিলার" বলতে আদর্শের বাইরে থাকা কিছুকে বোঝায় - সুতরাং এটি "ব্যতিক্রমী"। তবে আমার কাছে এমন আক্ষেপ রয়েছে যা "আউটলেট" সাধারণত খুব বিরল পর্যবেক্ষণের জন্য ব্যবহৃত হয় । পরিসংখ্যানগুলিতে, একটি সাধারণ বিতরণে, আপনি তিনটি সিগমাকে আউটলিয়ার হিসাবে বিবেচনা করবেন। এটি আপনার 99.7% অবজেক্টের "স্বাভাবিক" হওয়ার প্রত্যাশা। "অ্যানোমালি" অনেক বেশি উদারভাবে ব্যবহৃত হয়। যদি হঠাৎ আপনার ওয়েবসাইটে লক্ষ লক্ষ দর্শক থাকে তবে এগুলি বিরল দর্শক নয়। আকস্মিক দর্শনার্থীদের বৃদ্ধি এখনও "ব্যতিক্রমী", যেখানে প্রতিটি পৃথক দর্শনার্থী কোনও "বহিরাগত" নয়।
এটি এই নিবন্ধে থাকতে পারে যেখানে আমি এই পার্থক্যগুলি আলোচিত দেখেছি, তবে দুর্ভাগ্যক্রমে আমি এখনই এটি অ্যাক্সেস করতে পারছি না।
পরিসংখ্যানগত বিশ্লেষণ এবং ডেটা মাইনিং, খণ্ড 5, ইস্যু 5, অক্টোবর 2012, পৃষ্ঠাগুলি 363–387 উচ্চ-মাত্রিক সংখ্যাসূচক তথ্যগুলিতে নিরীক্ষণযুক্ত আউটলেট সনাক্তকরণ সম্পর্কিত জরিপ
জলকে আরও কাদামাটি করতে জলবায়ুবিদ্যায় অসাধারণভাবে কেবল মূল্য এবং গড় বা বিচ্যুতির মধ্যে পার্থক্য বোঝায়:
তাপমাত্রা শব্দের বিচ্ছিন্নতার অর্থ একটি রেফারেন্স মান বা দীর্ঘমেয়াদী গড় থেকে প্রস্থান। একটি ইতিবাচক অসঙ্গতি ইঙ্গিত দেয় যে পর্যবেক্ষণ করা তাপমাত্রা রেফারেন্স মানের তুলনায় উষ্ণ ছিল, অন্যদিকে aণাত্মক বিপর্যয় নির্দেশ করে যে পর্যবেক্ষণ করা তাপমাত্রা রেফারেন্স মানের থেকে শীতল ছিল।
এটিকে বাইরের মেশিন লার্নিং হিসাবে ভাল হিসাবে বিবেচনা করা যেতে পারে তবে প্রশ্নে আগ্রহী লোকেরা এতে আগ্রহী হতে পারে।
একটি অনিয়ম একটি ডেটা পয়েন্ট হতে পারে, বা কোনও মডেল তৈরি হওয়ার পরে ডেটাতে একটি সাধারণ প্রবণতা বা আচরণ পর্যবেক্ষণ বা আচরণ তৈরির প্রক্রিয়া বোঝার জন্য তৈরি হতে পারে। আপনি অসঙ্গতিগুলির মুখোমুখি হচ্ছেন কারণ সিস্টেমটি ভিন্নভাবে আচরণ শুরু করে, বা আপনি এই জাতীয় ডেটা পয়েন্টগুলি সন্ধান করেন, কারণ যখন কোনও ইভেন্ট ঘটে তখন আপনার মডেলটি বৈধ নয় বলে আপনাকে অবহিত করতে চাই। আপনি সমুদ্রের তরঙ্গের প্রশস্ত পরিমাণে যে কোনও অস্বাভাবিক আচরণ পর্যবেক্ষণ করার বিষয়ে চিন্তা করতে পারেন, আপনি সেই তথ্য পয়েন্টগুলি ফেলে দিতে এবং আরও ভাল মডেল তৈরি করতে চান তা নয়, তবে সুনামি কখন ঘটবে তা আপনি সচেতন হতে চান বলে।