আমি আউটলিয়ারদের নিয়ে প্রচুর গবেষণা করেছি, বিশেষত যখন আমি ১৯ak৮ থেকে ১৯৮০ সাল পর্যন্ত ওক রিজে শক্তির ডেটা বৈধকরণের জন্য কাজ করেছি normal মাল্টিভারিয়েট আউটলিয়ার এবং টাইম সিরিজের জন্য পরীক্ষা রয়েছে। "স্ট্যাটিস্টিকাল ডেটাতে আউটলিয়ার্স" সম্পর্কিত বার্নেট এবং লুইসের বইটি বহিরাগতদের বাইবেল এবং প্রায় সবকিছুর উপরে .াকা পড়েছে।
আমি যখন ওক রিজে ছিলাম ডেটা যাচাইকরণের জন্য কাজ করছিলাম তখন আমাদের কাছে বড় মাল্টিভারিয়েট ডেটা সেট ছিল। অবিচ্ছিন্ন outliers জন্য চূড়ান্ত জন্য একটি দিক আছে (উচ্চতর গড় এবং উচ্চতর নীচে)। তবে মাল্টিভারিয়েট আউটলিয়ারদের জন্য বহিরাগতদের সন্ধানের জন্য অনেকগুলি দিকনির্দেশ রয়েছে। আমাদের দর্শনটি ডেটা ব্যবহারের উদ্দেশ্যে কী তা বিবেচনা করা ছিল। আপনি যদি বাইভারিয়েট পারস্পরিক সম্পর্ক বা একটি রিগ্রেশন সহগ হিসাবে নির্দিষ্ট পরামিতিগুলি অনুমান করার চেষ্টা করছেন তবে আপনি সেই দিকটি দেখতে চান যা আগ্রহের পরামিতিগুলিতে সর্বাধিক প্রভাব সরবরাহ করে। সেই সময় আমি প্রভাব ফাংশন সম্পর্কিত ম্যাল্লোসের অপ্রকাশিত কাগজ পড়েছিলাম। বহিরাগতদের সনাক্ত করতে প্রভাব ফাংশনগুলির ব্যবহার জ্ঞানাদেসিকানের মাল্টিভারিয়েট বিশ্লেষণ বইয়ে আচ্ছাদিত। অবশ্যই আপনি এটি বার্নেট এবং লুইসেও খুঁজে পেতে পারেন।
প্যারামিটারের জন্য প্রভাব ফাংশন পর্যবেক্ষণের মাল্টিভারিয়েট স্পেসের পয়েন্টগুলিতে সংজ্ঞায়িত করা হয় এবং প্রয়োজনীয় পরামিতি অনুমানের মধ্যে পার্থক্য পরিমাপ করে যখন ডেটা পয়েন্টটি বাদ দেওয়া হয় তার সাথে তুলনা করা হয়। আপনি প্রতিটি নমুনা বিন্দুর সাথে এ জাতীয় অনুমানগুলি করতে পারেন তবে সাধারণত আপনি প্রভাব কার্যের জন্য একটি দুর্দান্ত কার্যকরী ফর্ম অর্জন করতে পারেন যা অন্তর্দৃষ্টি এবং দ্রুত গণনা দেয়।
উদাহরণস্বরূপ আমেরিকান জার্নাল অফ ম্যাথমেটিকাল অ্যান্ড ম্যানেজমেন্ট সায়েন্সে আমার পেপারে ১৯৮২ সালে "ইনফ্লুয়েন্স ফাংশন এবং ডেটা বৈধকরণের জন্য এটি প্রয়োগ" আমি দ্বিপার্শ্ব সম্পর্কের জন্য প্রভাব ফাংশনের বিশ্লেষণাত্মক সূত্রটি দেখাই এবং ধ্রুবক প্রভাবের সংক্ষিপ্তসারগুলি হাইপারবোলাই হয়। সুতরাং সংক্ষিপ্তসারগুলি বিমানের দিকনির্দেশ দেখায় যেখানে প্রভাব ফাংশনটি দ্রুত বৃদ্ধি করে।
আমার গবেষণাপত্রে আমি দেখিয়েছি যে আমরা কীভাবে জ্বালানি উত্পাদন ও ব্যবহার সম্পর্কিত এফপিসি ফর্ম 4 ডেটার সাথে দ্বিচারিত সম্পর্কের জন্য প্রভাব ফাংশনটি প্রয়োগ করেছি। উভয়ের মধ্যে একটি স্পষ্ট উচ্চ ইতিবাচক পারস্পরিক সম্পর্ক রয়েছে এবং আমরা কয়েকজন আউটলিয়ারকে পেয়েছি যা পারস্পরিক সম্পর্কের অনুমানের উপর অত্যন্ত প্রভাবশালী ছিল। আরও তদন্তে দেখা গেছে যে কমপক্ষে একটি পয়েন্ট ত্রুটিযুক্ত ছিল এবং আমরা এটি সংশোধন করতে সক্ষম হয়েছি।
তবে একটি গুরুত্বপূর্ণ বিষয় যা আমি সর্বদা আউটলিয়ারদের নিয়ে আলোচনা করার সময় উল্লেখ করি তা হ'ল স্বয়ংক্রিয় প্রত্যাখ্যান ভুল। আউটলেট সর্বদা একটি ত্রুটি হয় না এবং কখনও কখনও এটি ডেটা সম্পর্কে গুরুত্বপূর্ণ তথ্য সরবরাহ করে। বৈধ ডেটা কেবল সরিয়ে নেওয়া উচিত নয় কারণ এটি আমাদের বাস্তবতার তত্ত্বের সাথে সামঞ্জস্য করে না। এটি করা কঠিন কিনা বা না, কেন আউটলেটারের কারণটি সর্বদা তদন্ত করা উচিত।
আমার উল্লেখ করা উচিত যে এটি প্রথমবার নয় যখন বহু সাইটে আগতদের এই সাইটে আলোচনা করা হয়েছিল। বহিরাগতদের সন্ধানের ফলে সম্ভবত বেশ কয়েকটি প্রশ্ন দেখা দিতে পারে যেখানে মাল্টিভারিয়েট আউটলেয়ারদের নিয়ে আলোচনা করা হয়েছে। আমি জানি যে আমি আমার কাগজ এবং এই বইগুলি আগে উল্লেখ করেছি এবং তাদের লিঙ্ক দিয়েছি।
এছাড়াও যখন আউটরিয়র প্রত্যাখ্যান নিয়ে আলোচনা করা হয় তখন এই সাইটে আমাদের অনেকের বিরুদ্ধে এটির বিরুদ্ধে সুপারিশ করা হয়েছে বিশেষত যদি এটি কেবল একটি পরিসংখ্যানগত পরীক্ষার ভিত্তিতে করা হয়। পিটার হুবার প্রায়শই বহিরাগত প্রত্যাখ্যানের বিকল্প হিসাবে দৃ esti় অনুমানের উল্লেখ করেন। ধারণাটি হ'ল দৃust় পদ্ধতিগুলি প্রত্যাখ্যানকারীদের এগুলি প্রত্যাখ্যান এবং একটি শক্তিশালী অনুমানকারী ব্যবহার না করে ভারী হাতের পদক্ষেপ ছাড়াই অনুমানের উপর তাদের প্রভাব হ্রাস করবে।
প্রভাব ফাংশনটি প্রকৃতপক্ষে ফ্র্যাঙ্ক হ্যাম্পেল তাঁর পিএইচডি গবেষণামূলক প্রবন্ধে 1970 এর দশকের গোড়ার দিকে তৈরি করেছিলেন (আমার মনে হয় 1974)। তার ধারণাটি ছিল আসলে অনুমানকারীদের সনাক্ত করতে প্রভাব ফাংশনগুলি ব্যবহার করা যা বিদেশীদের বিরুদ্ধে শক্তিশালী ছিল না এবং শক্তিশালী অনুমানকারী বিকাশ করতে সহায়তা করেছিল।
এখানে এই বিষয়ে পূর্বের আলোচনার একটি লিঙ্ক এখানে আমি প্রভাব ফাংশন ব্যবহার করে টাইম সিরিজে বিদেশী সনাক্তকরণ সম্পর্কে আমার কিছু কাজের কথা উল্লেখ করেছি।