প্রথমত, আমার বক্তব্য থাকা উচিত যে আমি উত্তরের জন্য এই সাইটে অনুসন্ধান করেছি। আমি হয় এমন কোনও প্রশ্ন পাইনি যা আমার প্রশ্নের উত্তর দিয়েছে বা আমার জ্ঞানের স্তরটি এত কম যে আমি বুঝতে পারিনি যে আমি ইতিমধ্যে উত্তরটি পড়েছি।
আমি এপি পরিসংখ্যান পরীক্ষার জন্য পড়াশোনা করছি। আমাকে লিনিয়ার রিগ্রেশন শিখতে হবে এবং এর একটি বিষয় হল অবশিষ্টাংশ। এটিতে 253 পৃষ্ঠাতে পরিসংখ্যান এবং ডেটা অ্যানালাইসিসের সাথে পরিচিতির একটি অনুলিপি রয়েছে ।
দ্বিখণ্ডিত ডেটা সেটে অস্বাভাবিক পয়েন্টগুলি হ'ল দিক বা দিকের মধ্যে স্ক্যাটারপ্লোটের অন্যান্য পয়েন্টগুলির মধ্যে থেকে দূরে পড়ে are
কোনও পর্যবেক্ষণ হ'ল সম্ভাব্য প্রভাবশালী পর্যবেক্ষণ যদি এর কোনও মান থাকে যা বাকী ডেটা থেকে অনেক দূরে থাকে ( দিকের বাকী ডেটা থেকে পৃথক )। এই পর্যবেক্ষণটি বাস্তবে প্রভাবশালী কিনা তা নির্ধারণ করার জন্য, আমরা নির্ধারণ করি যে এই পর্যবেক্ষণটি অপসারণের ফলে opeালের মান বা সর্বনিম্ন-বর্গাকার লাইনের বাধাকে বড় প্রভাব রয়েছে কিনা whether
পর্যবেক্ষণটি আউটলেটর হয় যদি এর বড় অংশ থাকে। আউটলারের পর্যবেক্ষণ দিকের সর্বনিম্ন-বর্গাকার লাইন থেকে অনেক দূরে পড়ে ।
স্ট্যাটরেক ডট কম অবশিষ্টাংশ থেকে একজন আউটলেট নির্ধারণের জন্য চারটি পদ্ধতি জানিয়েছে:
সামগ্রিক প্যাটার্ন থেকে একটি বৃহত্তর পথে ডাইভার্ট হওয়া ডেটা পয়েন্টগুলিকে আউটলিয়ার বলা হয়। চারটি উপায় রয়েছে যে কোনও ডেটা পয়েন্টকে আউটলেট হিসাবে বিবেচনা করা যেতে পারে।
- অন্যান্য ডেটার পয়েন্টের তুলনায় এটির চরম এক্স মান থাকতে পারে।
- অন্যান্য ডেটার পয়েন্টের তুলনায় এটির চূড়ান্ত ওয়াই মান থাকতে পারে।
- এর চরম এক্স এবং ওয়াই মান থাকতে পারে।
- চূড়ান্ত এক্স বা ওয়াই মান ছাড়াই এটি বাকী ডেটা থেকে দূরে থাকতে পারে।
এই দুটি উত্স একে অপরের বিরোধ বলে মনে হচ্ছে। কেউ আমার বিভ্রান্তি দূর করতে সাহায্য করতে পারে। এছাড়াও, একটি চরম সংজ্ঞা দেয় কিভাবে। এপি পরিসংখ্যানগুলি নিয়মটি ব্যবহার করে যদি ডেটা পয়েন্ট (Q1-1.5IQR, Q3 + 1.5IQR) এর বাইরে থাকে তবে এটি বাহ্যিক। আমি কীভাবে কীভাবে প্রয়োগ করব তা কেবল অবশিষ্টদের কাছ থেকে কেবল একটি গ্রাফ থেকে প্রয়োগ করতে পারি।