বেশ কয়েকটি ভাল উত্তর এখনও আরও মন্তব্যে রাখে।
প্রথমত, মধ্যমা আউটলাইনারদের নির্মূল করার উদ্দেশ্যে করা এই ধারণাটি নিয়ে কেউ আপত্তি করেননি, তবে আমি এটি যোগ্যতা অর্জন করব। উদ্দিষ্ট অর্থটি প্রকট, তবে বাস্তব ডেটা আরও জটিল হওয়া সহজ। বেশিরভাগ ক্ষেত্রে, মধ্যস্থতাকারী বাহ্যিকদের ছাড় বা উপেক্ষা করার উদ্দেশ্যে তৈরি হয়, তবে এটিরও গ্যারান্টি নেই। উদাহরণস্বরূপ, 1 1 1 5 5 5 এর রেডিং সহ মিডিয়ান এবং গড় 3 এ সম্মত হয়, তাই সমস্ত কিছু ভাল লাগতে পারে। তবে একটি অতিরিক্ত 5 মধ্যমানকে 5 এ টিপ করবে এবং একটি অতিরিক্ত 1 মধ্যমানকে 1 টিপ করবে The প্রতি ক্ষেত্রে গড়টি প্রায় 0.286 দ্বারা সরবে। সুতরাং গড়টি এখানে মিডিয়ানের চেয়ে বেশি প্রতিরোধী। উদাহরণটি অস্বাভাবিক হিসাবে খারিজ করা যেতে পারে, তবে এটি আপত্তিজনক নয়। বিন্দুটি মূল নয়, স্বাভাবিকভাবেই। এটি তৈরি করা একটি জায়গা মোস্টেলার, এফ এবং টুকি, জেডাব্লু 1977। ডেটা অ্যানালাইসিস এবং রিগ্রেশন। পড়া, এমএ: অ্যাডিসন-ওয়েসলি, পিপি ৩৪-৩৫।
দ্বিতীয়ত, ছাঁটাইযুক্ত উপায়ের কথা উল্লেখ করা হয়েছে এবং ধারণাটি একটি বড় ধাক্কা প্রাপ্য। গড় এবং মাঝারিদের জন্য একেবারে বিকল্প বিকল্প হওয়া দরকার না যাতে বিশ্লেষককে অবশ্যই একে অপরকে বাছাই করতে (ভোট দেওয়া) করতে হবে। আপনি প্রতিটি লেজের নির্দিষ্ট সংখ্যক মান ছাঁটাইয়ের উপর ভিত্তি করে সমস্ত সম্ভাব্য ছাঁটাই উপায় বিবেচনা করতে পারেন । টেবিলটি # হিসাবে গণনার সাথে অন্তর্ভুক্ত মানের সংখ্যা হিসাবে দেখায়:
+----------------------------+
| number # trimmed mean |
|----------------------------|
| 0 16 4.0625 |
| 1 14 4.214286 |
| 2 12 4.416667 |
| 3 10 4.6 |
| 4 8 4.75 |
| 5 6 4.833333 |
| 6 4 5 |
| 7 2 5 |
+----------------------------+
এখানে মূল চিত্রটি হ'ল চূড়ান্ত মূল্যবোধের কারণে বন্ধ হওয়ার ঝুঁকির বিরুদ্ধে এক ধরণের বীমা হিসাবে আপনি আপনার ছাড়ের হারকে (সন্দেহ হিসাবে প্রতিটি পুচ্ছের এতগুলি মান উপেক্ষা করুন) বেছে নিতে পারেন। আমি যা দেখছি তা হ'ল গড় এবং মাঝারিগুলির মধ্যে বেশ মসৃণ গ্রেডিয়েন্ট, যা এখানে প্রত্যাশিত কারণ সম্ভাব্য মান 1, 2, 3, 4, 5 সমস্তই ডেটাতে উপস্থিত রয়েছে। ধারাবাহিকতায় একটি বড় জাম্প একটি বিচ্ছিন্ন আউটলেটারের সাথে প্রত্যাশিত।
ছাঁটাইযুক্ত অর্থের সাথে প্রতিটি লেজের সমান সংখ্যাকে ছাঁটাই করার কোনও বাধ্যবাধকতা নেই, তবে আমি এর উপর প্রসারিত করব না।
তৃতীয়, উদাহরণটি অ্যামাজন পর্যালোচনাগুলির। আপনি কীভাবে ডেটা সংক্ষিপ্ত করতে চান তা গাইড করতে প্রসঙ্গ সর্বদা প্রাসঙ্গিক । আমাজনের রিভিউয়ের ক্ষেত্রে সবচেয়ে ভাল উত্তরটি রিভিউ পড়তে হবে! উচ্চ এবং নিম্ন গ্রেডগুলি একইভাবে উত্সাহপূর্ণ কারণে হতে পারে (স্পষ্টত: এই বইটির লেখক আমার বন্ধু) এবং / বা আপনার সিদ্ধান্তের সাথে অপ্রাসঙ্গিক (স্পষ্টত: পুনঃ-বিক্রেতা আমার সাথে খারাপ ব্যবহার করেছেন), আমার কাছে স্পষ্টতই নেই কীভাবে এই জাতীয় ডেটা সংক্ষিপ্ত করতে হয় এবং প্রকৃতপক্ষে আপনাকে বিতরণ দেখিয়ে অ্যামাজনকে সর্বাধিক তথ্যবহুল করা যায় imp
চতুর্থ, এবং সবচেয়ে প্রাথমিক কিন্তু সবার মৌলিক, আপনাকে কে বাছাই করছে? কখনও কখনও গড় এবং মাঝারি উভয়ই রিপোর্ট করা উচিত (এবং যেমন বলা হয়েছে, একটি বন্টন গ্রাফও)।