এটা প্রায় সবসময় পর্যবেক্ষণ সরানোর জন্য একটি প্রতারণার উন্নত করতে একটি রিগ্রেশন মডেল। আপনার পর্যবেক্ষণগুলি কেবল তখনই বাদ দেওয়া উচিত যখন আপনি সত্যই ভাবেন যে এগুলি প্রকৃতপক্ষে বিদেশী।
উদাহরণস্বরূপ, আপনার স্মার্ট ঘড়ির সাথে সংযুক্ত হার্ট রেট মনিটর থেকে সময় সিরিজ রয়েছে। আপনি যদি সিরিজটি একবার দেখুন, এটি সহজেই দেখতে পাওয়া যায় যে 300 বিপিএসের মতো পাঠাগুলি দ্বারা ভ্রান্ত পর্যবেক্ষণ থাকবে। এগুলি অপসারণ করা উচিত, তবে আপনি মডেলটি (এটির অর্থ যাই হোক না কেন) উন্নত করতে চান তা নয়। এগুলি পড়ার ক্ষেত্রে ত্রুটি যার সাথে আপনার হার্টের হারের কোনও যোগসূত্র নেই।
তথাপি ত্রুটিগুলির পারস্পরিক সম্পর্কের বিষয়টি যদিও সাবধান হওয়া উচিত। আমার উদাহরণে এটি যুক্তিযুক্ত হতে পারে যে হার্ট রেট মনিটর যখন হে ঝাঁপানোর মতো ব্যায়ামের সময় বাস্তুচ্যুত হয় তখন আপনার ত্রুটি রয়েছে। যা এই ত্রুটিগুলি হার্টের হারের সাথে সম্পর্কযুক্ত করে তুলবে। এই ক্ষেত্রে, এই আউটলিয়ারগুলি এবং ত্রুটিগুলি অপসারণের ক্ষেত্রে অবশ্যই যত্ন নেওয়া উচিত, কারণ এগুলি এলোমেলোভাবে নয়
কখন আপনাকে বিদেশী অপসারণ করবেন না তার একটি উদাহরণ তৈরি করব । ধরা যাক আপনি একটি বসন্তের ওজনের চলন পরিমাপ করছেন। ওজনের শক্তির তুলনায় যদি ওজন সামান্য হয় , তবে আপনি খেয়াল করবেন যে হুকের আইন খুব ভালভাবে কাজ করে: যেখানে এফ বল, কে - টেনশন সহগ এবং Δ x হল ওজনের অবস্থান ।
F=−kΔx,
FkΔx
Δx
আপডেট আপনার ক্ষেত্রে আমি সেই ডেটা পয়েন্টগুলি টানতে এবং তাদের আরও কাছাকাছি দেখার পরামর্শ দেব। এটি ল্যাব যন্ত্র ব্যর্থতা হতে পারে? বাহ্যিক হস্তক্ষেপ? নমুনা ত্রুটি? প্রভৃতি
এরপরে এই আউটরিয়রদের প্রিন্স আপনি যে উদাহরণটি দিয়েছিলেন তার মতো আপনি মাপুন তার সাথে সম্পর্কযুক্ত হতে পারে কিনা তা চিহ্নিত করার চেষ্টা করুন। যদি পারস্পরিক সম্পর্ক থাকে তবে এটিকে নিয়ে যাওয়ার কোনও সহজ উপায় নেই। যদি কোনও সম্পর্ক নেই তবে আপনি বহিরাগতদের অপসারণ করতে পারেন