বিশ্লেষণ থেকে অপসারণের জন্য 'আউটিলার' হ'ল একসাথে ডেটা সংগ্রহ করার জন্য একটি সুবিধাজনক শব্দ যা আপনার প্রক্রিয়াটি যেমন দেখতে প্রত্যাশিত তা ফিট করে না।
আমি কখনই (পরে সাবধান) বিদেশী অপসারণের পরামর্শ দেব না । আমার ব্যাকগ্রাউন্ডটি পরিসংখ্যান প্রক্রিয়া নিয়ন্ত্রণ, তাই প্রায়শই স্বয়ংক্রিয়ভাবে উত্পন্ন সময়-সিরিজের ডেটাগুলির বড় পরিমাণের সাথে লেনদেন হয় যা ডেটা এবং বিতরণের উপর নির্ভর করে রান চার্ট / মুভিং বক্স প্লট / ইত্যাদি ব্যবহার করে প্রক্রিয়া করা হয়।
বিদেশিদের কাছে জিনিসটি হ'ল তারা সর্বদা আপনার 'প্রক্রিয়া' সম্পর্কিত তথ্য সরবরাহ করবেন। প্রায়শই আপনি একটি প্রক্রিয়া হিসাবে যা ভাবছেন তা আসলে অনেকগুলি প্রক্রিয়া এবং এটির জন্য আপনি এটি ক্রেডিট দেওয়ার চেয়ে অনেক জটিল।
আপনার প্রশ্নের উদাহরণ ব্যবহার করে, আমি পরামর্শ দেব যে সেখানে 'প্রক্রিয়া' সংখ্যক হতে পারে। বিভিন্ন কারণে হতে পারে ...
- একটি কন্ডাক্টেন্স ডিভাইস দ্বারা নেওয়া নমুনা
- পরিবাহী ডিভাইসের মধ্যে নেওয়া নমুনা
- যখন বিষয়টি একটি অনুসন্ধান সরিয়ে ফেলবে
- যখন বিষয়টি সরানো হয়েছিল
- কোনও বিষয়ের ত্বকের মধ্যে তাদের দেহ জুড়ে বা বিভিন্ন নমুনা দিবসের (চুল, আর্দ্রতা, তেল ইত্যাদি) মধ্যে পার্থক্য
- বিষয়গুলির মধ্যে পার্থক্য
- কর্মীদের মধ্যে পরিমাপ এবং তারতম্য গ্রহণকারী ব্যক্তির প্রশিক্ষণ
এই সমস্ত প্রক্রিয়া ডেটাতে অতিরিক্ত প্রকারের উত্পাদন ঘটায় এবং সম্ভবত বোধগম্যকে সরায় এবং বিতরণের আকার পরিবর্তন করে। এর মধ্যে অনেকগুলি আপনি আলাদা প্রক্রিয়াতে আলাদা করতে পারবেন না be
সুতরাং ডেটা পয়েন্টগুলি 'আউটলিয়ার' হিসাবে মুছে ফেলার ধারণাটিতে যাচ্ছি ... আমি কেবল তখনই ডেটা পয়েন্টগুলি সরিয়ে ফেলব, যখন আমি অবশ্যই তাদের নির্দিষ্ট কোনও প্রক্রিয়াতে নির্দিষ্ট করতে পারি যা আমি আমার বিশ্লেষণে অন্তর্ভুক্ত করতে চাই না। তারপরে আপনাকে নিশ্চিত করতে হবে যে অন্তর্ভুক্তির কারণগুলি আপনার বিশ্লেষণের অংশ হিসাবে রেকর্ড করা আছে, সুতরাং এটি সুস্পষ্ট। আপনার ডেটা সংগ্রহের সময় পর্যবেক্ষণের মাধ্যমে অতিরিক্ত নোট নেওয়ার মূল বিষয় হ'ল এট্রিবিউটটি ধরে নিবেন না।
আমি আপনার বক্তব্যকে চ্যালেঞ্জ জানাব 'কারণ তাদের বেশিরভাগই ত্রুটি', কারণ এটি ত্রুটি নয়, তবে আপনার পরিমাপের মধ্যে পৃথক হিসাবে চিহ্নিত হওয়া আলাদা প্রক্রিয়ার অংশ মাত্র of
আপনার উদাহরণে, আমি ডেটা পয়েন্টগুলি বাদ দেওয়া যুক্তিসঙ্গত বলে মনে করি যা আপনি বিশ্লেষণ করতে চান না এমন একটি পৃথক প্রক্রিয়াতে দায়ী করতে পারেন।