একটি হোমওয়ার্ক প্রশ্নের অংশ হিসাবে, আমাকে সবচেয়ে ছোট এবং বৃহত্তম পর্যবেক্ষণ মুছে ফেলে একটি ডেটাসেটের জন্য ছাঁটাই করা গড় গণনা করতে এবং ফলাফলটি ব্যাখ্যা করতে বলা হয়েছিল। ছাঁটাই করা গড়টি নিরবচ্ছিন্ন গড়ের চেয়ে কম ছিল।
আমার ব্যাখ্যাটি হ'ল এটি হ'ল কারণ অন্তর্নিহিত বিতরণটি ইতিবাচকভাবে আঁকানো ছিল, তাই বাম লেজটি ডান লেজের চেয়ে স্বল্প। এই তীব্রতার ফলস্বরূপ, একটি উচ্চ ডাতাম অপসারণ নীচের অংশটিকে নীচের দিকে টানিয়ে দেওয়ার চেয়েও কম টেনে নিয়ে যায়, কারণ, অনানুষ্ঠানিকভাবে বলতে গেলে, আরও কম ডেটা রয়েছে "এটির স্থান গ্রহণের অপেক্ষায়।" (এটা কি যুক্তিসঙ্গত?)
তারপরে আমি ভাবতে শুরু করি যে ছাঁটাই শতাংশ কীভাবে এটি প্রভাবিত করে, তাই আমি বিভিন্ন গড় । আমি একটি আকর্ষণীয় প্যারাবোলিক আকার পেয়েছি:

আমি কীভাবে এটি ব্যাখ্যা করব তা সম্পর্কে আমি নিশ্চিত নই। Intuitively, মনে গ্রাফ ঢাল মত (সমানুপাতিক) মধ্যে বিতরণের অংশ নেতিবাচক বক্রতা হওয়া উচিত মধ্যমা ডাটা পয়েন্ট। (এই হাইপোথিসিসটি আমার ডেটাগুলি পরীক্ষা করে দেখায় তবে আমার কেবল , তাই আমি খুব আত্মবিশ্বাসী নই।)
এই ধরণের গ্রাফের কোনও নাম আছে বা এটি সাধারণত ব্যবহৃত হয়? এই গ্রাফ থেকে আমরা কী তথ্য সংগ্রহ করতে পারি? একটি স্ট্যান্ডার্ড ব্যাখ্যা আছে?
রেফারেন্সের জন্য, ডেটাগুলি হ'ল: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80।


