একটি হোমওয়ার্ক প্রশ্নের অংশ হিসাবে, আমাকে সবচেয়ে ছোট এবং বৃহত্তম পর্যবেক্ষণ মুছে ফেলে একটি ডেটাসেটের জন্য ছাঁটাই করা গড় গণনা করতে এবং ফলাফলটি ব্যাখ্যা করতে বলা হয়েছিল। ছাঁটাই করা গড়টি নিরবচ্ছিন্ন গড়ের চেয়ে কম ছিল।
আমার ব্যাখ্যাটি হ'ল এটি হ'ল কারণ অন্তর্নিহিত বিতরণটি ইতিবাচকভাবে আঁকানো ছিল, তাই বাম লেজটি ডান লেজের চেয়ে স্বল্প। এই তীব্রতার ফলস্বরূপ, একটি উচ্চ ডাতাম অপসারণ নীচের অংশটিকে নীচের দিকে টানিয়ে দেওয়ার চেয়েও কম টেনে নিয়ে যায়, কারণ, অনানুষ্ঠানিকভাবে বলতে গেলে, আরও কম ডেটা রয়েছে "এটির স্থান গ্রহণের অপেক্ষায়।" (এটা কি যুক্তিসঙ্গত?)
তারপরে আমি ভাবতে শুরু করি যে ছাঁটাই শতাংশ কীভাবে এটি প্রভাবিত করে, তাই আমি বিভিন্ন গড় । আমি একটি আকর্ষণীয় প্যারাবোলিক আকার পেয়েছি:
আমি কীভাবে এটি ব্যাখ্যা করব তা সম্পর্কে আমি নিশ্চিত নই। Intuitively, মনে গ্রাফ ঢাল মত (সমানুপাতিক) মধ্যে বিতরণের অংশ নেতিবাচক বক্রতা হওয়া উচিত মধ্যমা ডাটা পয়েন্ট। (এই হাইপোথিসিসটি আমার ডেটাগুলি পরীক্ষা করে দেখায় তবে আমার কেবল , তাই আমি খুব আত্মবিশ্বাসী নই।)
এই ধরণের গ্রাফের কোনও নাম আছে বা এটি সাধারণত ব্যবহৃত হয়? এই গ্রাফ থেকে আমরা কী তথ্য সংগ্রহ করতে পারি? একটি স্ট্যান্ডার্ড ব্যাখ্যা আছে?
রেফারেন্সের জন্য, ডেটাগুলি হ'ল: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80।