স্কিউনেসের এক পরিমাপ মিডিয়েন মিডিয়ানের উপর ভিত্তি করে - পিয়ারসনের দ্বিতীয় স্কিউনেস সহগ ।
Skewness এর অন্য একটি পরিমাপ অনুপাত হিসাবে প্রকাশিত আপেক্ষিক চতুর্ভুজ পার্থক্য (Q3-Q2) বনাম (Q2-Q1) উপর ভিত্তি করে
(Q3-Q2) বনাম (Q2-Q1) পরিবর্তে একটি পার্থক্য হিসাবে প্রকাশ করা হয় (বা সমানভাবে মিডহিন্জ-মিডিয়ান), এটি মাত্রাবিহীন করতে হবে (সাধারণত একটি skewness পরিমাপের জন্য সাধারণত প্রয়োজন হয়), আইকিউআর বলে, এখানে ( রেখে )u = 0.25
সর্বাধিক সাধারণ পরিমাপটি অবশ্যই তৃতীয়-মুহুর্তের স্কিউনেস ।
এই তিনটি পদক্ষেপ প্রয়োজনীয়ভাবে সামঞ্জস্যপূর্ণ হওয়ার কোনও কারণ নেই। এগুলির যে কোনও একটি অন্য দুটি থেকে আলাদা হতে পারে।
আমরা "স্কিউনেস" হিসাবে যা বিবেচনা করি তা হ'ল কিছুটা পিচ্ছিল এবং দুষ্টু সংজ্ঞায়িত ধারণা। আরও আলোচনার জন্য এখানে দেখুন ।
যদি আমরা আপনার ডেটাটিকে একটি সাধারণ কিউকিপ্লট দিয়ে দেখি:
[সেখানে চিহ্নিত রেখাটি কেবল প্রথম 6 পয়েন্টের উপর ভিত্তি করে তৈরি করা হয়েছে, কারণ আমি সেখানে প্যাটার্ন থেকে শেষ দুটিটির বিচ্যুতি নিয়ে আলোচনা করতে চাই want]
আমরা দেখতে পাই যে ক্ষুদ্রতম 6 টি পয়েন্ট লাইনে প্রায় পুরোপুরি নিখুঁত।
তারপরে the ম পয়েন্টটি রেখার নীচে রয়েছে (বাম প্রান্ত থেকে একই দ্বিতীয় পয়েন্টের তুলনায় তুলনামূলকভাবে মধ্যের কাছাকাছি), যখন অষ্টম পয়েন্টটি উপরে উঠে গেছে।
7th ম পয়েন্টটি হালকা বাম স্কু, শেষ, শক্তিশালী ডান স্কু প্রস্তাব দেয়। আপনি যদি উভয় বিন্দুটিকে উপেক্ষা করেন তবে স্কিউনেসের ছাপ সম্পূর্ণরূপে অন্য দ্বারা নির্ধারিত হয়।
যদি আমি বলতে পারি এটি একটি বা অন্যটি ছিল তবে আমি তাকে "ডান স্কিউ" বলব তবে আমি আরও উল্লেখ করতে পারি যে ছাপ পুরোপুরি সেই খুব বড় পয়েন্টের প্রভাবের কারণে। এটি ছাড়া সত্যিকারের স্কিউ বলতে কিছু নেই। (অন্যদিকে, পরিবর্তে 7 তম বিন্দু ছাড়া, এটি পরিষ্কারভাবে স্কু বাম নয়))
আমাদের ইমপ্রেশনটি সম্পূর্ণ একক পয়েন্ট দ্বারা নির্ধারিত হলে এবং অবশ্যই একটি পয়েন্ট মুছে ফেলা যায় তবে আমাদের অবশ্যই খুব সতর্কতা অবলম্বন করা উচিত। এটি তেমন কোনও ভিত্তি নয়!
আমি এই ধারণাটি দিয়ে শুরু করি যে আউটলেটকে 'আউটলাইং' তৈরি করে তোলে তা হ'ল মডেল (কোনও মডেলের প্রতি শ্রদ্ধার সাথে একটি আউটরিয়ার কী অন্য মডেলের অধীনে বেশ সাধারণ হতে পারে)।
আমি মনে করি একটি সাধারণ (০.72২ এসডি এসএসএস) এর ০.০১ এর উপরের পার্সেন্টাইল (1/10000) এ একটি পর্যবেক্ষণ হ'ল ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘনিয়ে।।।।। (আমরা যদি তার নিজস্ব সম্ভাবনা ইন্টিগ্রাল ট্রান্সফর্ম দ্বারা কোনও বিতরণকে রূপান্তর করি তবে প্রত্যেকে একই ইউনিফর্মে যাবে)
এমনকি একটি মাঝারিভাবে ডান স্কিউ বিতরণে বক্সপ্লট বিধি প্রয়োগ করার ক্ষেত্রে সমস্যাটি দেখতে, ঘনিষ্ঠভাবে বিতরণ থেকে বড় নমুনাগুলি অনুকরণ করুন।
উদাহরণস্বরূপ, যদি আমরা সাধারণ থেকে 100 মাপের নমুনাগুলি অনুকরণ করি তবে আমরা প্রতি নমুনায় 1 আউটলেটরের তুলনায় কম। যদি আমরা এটি একটি ক্ষতিকারক দিয়ে করি, আমাদের গড় প্রায় 5 হয় But তবে এটির কোনও সত্য ভিত্তি নেই যার ভিত্তিতে বলা যায় যে ঘাতক মানগুলির একটি উচ্চতর অনুপাত "আউটলাইং" হয় যদি না আমরা (সাধারণ) মডেলের সাথে তুলনা করে এটি করি। নির্দিষ্ট পরিস্থিতিতে আমাদের কিছু নির্দিষ্ট ফর্মের আউটরিয়র বিধিবিধানের নির্দিষ্ট কারণ থাকতে পারে, তবে কোনও সাধারণ নিয়ম নেই, যা আমাদের এই উপ-বিভাগের সাথে শুরু করা মত সাধারণ নীতিগুলি দিয়ে চলে যায় - প্রতিটি মডেল / বিতরণকে তার নিজস্ব আলোতে আচরণ করার জন্য (কোনও মান যদি কোনও মডেলের প্রতি শ্রদ্ধার সাথে অস্বাভাবিক না হয় তবে কেন তাকে সেই পরিস্থিতিতে একজন আউটলেটর বলুন?)
শিরোনামে প্রশ্ন ঘুরিয়ে :
যদিও এটি একটি দুর্দান্ত অপরিশোধিত উপকরণ (যার কারণে আমি কিউকিউ-প্লটের দিকে নজর দিয়েছি) সেখানে একটি বক্সপ্লট-এ স্কিউনেসের বেশ কয়েকটি ইঙ্গিত রয়েছে - যদি কমপক্ষে একটি পয়েন্ট যদি একজন আউটলেটর হিসাবে চিহ্নিত থাকে তবে সম্ভাব্য (কমপক্ষে) তিনটি রয়েছে:
এই নমুনা (এন = 100) এ, বাইরের পয়েন্টগুলি (সবুজ) চূড়ান্ত চিহ্নিত করে এবং মধ্যম দিয়ে বাম সঙ্কুচিতির পরামর্শ দেয়। তারপরে বেড়াগুলি (নীল) পরামর্শ দেয় (যখন মধ্যকের সাথে মিলিত হয়) ডান সঙ্কোচনের পরামর্শ দেয়। তারপরে কব্জাগুলি (কোয়ার্টাইলস, ব্রাউন), মধ্যমাটির সাথে মিলিত হয়ে বাম skewness পরামর্শ দেয়।
যেমনটি আমরা দেখছি, সেগুলি সুসংগত হওয়ার দরকার নেই। আপনি যেটির দিকে মনোনিবেশ করবেন তা নির্ভর করে আপনি যে অবস্থাতে রয়েছেন (এবং সম্ভবত আপনার পছন্দগুলি)।
যাইহোক, বক্সপ্লোটটি ঠিক কতটা অসম্পূর্ণ সে সম্পর্কে একটি সতর্কতা । এখানে শেষের দিকে উদাহরণ - যা কীভাবে ডেটা তৈরি করতে পারে তার বিবরণ অন্তর্ভুক্ত - একই বক্সপ্লট দিয়ে চারটি ভিন্ন ভিন্ন বিতরণ দেয়:
আপনি দেখতে পাচ্ছেন যে উপরোক্ত উল্লিখিত সমস্ত সংকেতকে সূক্ষ্ম প্রতিসাম্য দেখানোর সাথে একটি যথেষ্ট স্কিউড বিতরণ রয়েছে।
-
আসুন এটি বিবেচনার দৃষ্টিকোণ থেকে নেওয়া যাক "আপনার শিক্ষক কী উত্তর প্রত্যাশা করেছিলেন, প্রদত্ত যে এটি একটি বক্সপ্লট, যা একটি বহিরাগত হিসাবে একটি পয়েন্ট চিহ্নিত করে?"।
আমরা প্রথমে উত্তর দিয়ে রেখেছি "তারা কী আশা করে যে আপনি এই বিন্দুটি বাদ দিয়ে স্নিগ্ধতা মূল্যায়ন করবেন, বা নমুনায় এটি নিয়ে?" কেউ কেউ এটিকে বাদ দিয়ে দেবে এবং কী থেকে যায় তা থেকে ঝাঁকুনির মূল্যায়ন করবে, যেমন জস্কি অন্য উত্তরে করেছিলেন। যদিও আমি সেই পদ্ধতির বিতর্কিত দিক রয়েছে, আমি এটি ভুল বলতে পারি না - যা পরিস্থিতির উপর নির্ভর করে। কিছু এটি অন্তর্ভুক্ত করবে (কমপক্ষে নয় কারণ সাধারণতার থেকে প্রাপ্ত নিয়মের কারণে আপনার নমুনার 12.5% বাদ দিলে এটি একটি বড় পদক্ষেপ বলে মনে হয় *)।
* জনসংখ্যার বন্টন যা ডান লেজ ব্যতীত প্রতিসামগ্রী হিসাবে কল্পনা করুন (আমি এর উত্তরে এমন একটি নির্মাণ করেছি - সাধারণ তবে চূড়ান্ত ডান লেজ পেরেটো হ'ল - তবে আমার উত্তরে তা উপস্থাপন করিনি)। যদি আমি 8 মাপের নমুনাগুলি আঁকি, তবে প্রায়শই 7 টি পর্যবেক্ষণগুলি স্বাভাবিক দেখায় অংশ থেকে আসে এবং একটি উপরের লেজ থেকে আসে। যদি আমরা সেই ক্ষেত্রে বক্সপ্লট-আউটলিয়ার হিসাবে চিহ্নিত পয়েন্টগুলি বাদ দিয়ে থাকি তবে আমরা যে পয়েন্টটি বলছি এটি বাদ দিচ্ছি যা এটি আসলে স্কিউ! যখন আমরা এটি করি তখন সেই পরিস্থিতিতে থাকা কাটা কাটা বিতরণটি বাম-স্কিউ থাকে এবং আমাদের উপসংহারটি সঠিক সংখ্যার বিপরীত হবে।