ছাঁটাইয়ের অর্থ কী তা বিবেচনা করুন: প্রোটোটাইপিকাল ক্ষেত্রে আপনি প্রথমে আপনার ক্রমবর্ধমান ক্রমে আপনার ডেটা সাজান। তারপরে আপনি নীচ থেকে ট্রিমিং শতাংশ পর্যন্ত গণনা করুন এবং সেই মানগুলি বাতিল করুন। উদাহরণস্বরূপ একটি 10% ছাঁটাই গড় সাধারণ; সেক্ষেত্রে আপনি আপনার সেটের সমস্ত ডেটার 10% পাস না করা পর্যন্ত আপনি সর্বনিম্ন মান থেকে গণনা করুন। এই চিহ্নের নীচের মানগুলি আলাদা করে রাখা হয়েছে। তেমনি, আপনি নিজের ট্রিমিং শতাংশ পেরিয়ে যাওয়া না হওয়া পর্যন্ত আপনি সর্বোচ্চ মান থেকে গণনা করেন এবং সমস্ত মানটিকে একপাশে আরও বেশি সেট করেন। আপনি এখন মাঝখানে ৮০% রেখে গেছেন। আপনি এর গড় গ্রহণ করুন এবং এটি আপনার 10% ছাঁটা গড়। (মনে রাখবেন যে আপনি দুটি লেজ থেকে অসম অনুপাত ছাঁটাই করতে পারেন, বা কেবল একটি লেজ ছাঁটাই করতে পারেন, তবে এই পদ্ধতিগুলি কম সাধারণ এবং আপনার অবস্থার সাথে তেমন প্রযোজ্য বলে মনে হয় না))
এখন আপনি যদি 50% ছাঁটাইয়ের গড় গণনা করেন তবে কী হবে তা ভেবে দেখুন। উপরের অর্ধেকটি নীচের অর্ধেকটি আলাদা করে রাখা হবে। আপনি মাঝখানে একক মান (সাধারণভাবে) রেখে যাবেন। আপনি তার ছাঁটাই করা অর্থ হিসাবে এর অর্থ গ্রহণ করবেন (যা বলতে গেলে, আপনি কেবল সেই মানটি নেবেন)। তবে নোট করুন যে মানটি হ'ল মাঝারি। অন্য কথায়, মিডিয়ান একটি ছাঁটাই গড় (এটি একটি 50% ছাঁটা গড়)। এটি কেবল খুব আক্রমণাত্মক। সংক্ষেপে এটি ধরে নেওয়া হয় যে আপনার 99% ডেটা দূষিত। এটি আপনাকে শক্তি / দক্ষতার চূড়ান্ত ক্ষতির বিনিময়ে বহিরাগতদের বিরুদ্ধে চূড়ান্ত সুরক্ষা দেয় ।
আমার অনুমান একটি মধ্যমা / 50% ছাঁটা গড়টি আপনার ডেটার জন্য প্রয়োজনীয় তুলনায় অনেক বেশি আক্রমণাত্মক এবং আপনার কাছে উপলব্ধ তথ্য অপ্রয়োজনীয়। আপনার যদি বিদ্যমান আউটলিয়ারের অনুপাতের কোনও ধারণা থাকে তবে আমি সেই তথ্যটি ছাঁটাই শতাংশ নির্ধারণ করতে এবং উপযুক্ত ছাঁটাইযুক্ত গড়টি ব্যবহার করতে চাই। ট্রিমিং শতাংশ বাছাই করার কোনও ভিত্তি আপনার কাছে না থাকলে আপনি ক্রস বৈধকরণের মাধ্যমে একটি নির্বাচন করতে পারেন, বা কেবল একটি বাধা দিয়ে একটি শক্তিশালী রিগ্রেশন বিশ্লেষণ ব্যবহার করতে পারেন।