আমার মনে হয় মিডিয়ান মানে।
এই ঘটনা কি?
আমার মনে হয় মিডিয়ান মানে।
এই ঘটনা কি?
উত্তর:
এটি একটি অনানুষ্ঠানিক প্রশ্ন (প্রশ্নটি জিজ্ঞাসা করা লোকেদের মনে হয় বলে মনে হয় ততটা তুচ্ছ নয়)।
অসুবিধাটি শেষ পর্যন্ত এই কারণে ঘটেছিল যে আমরা 'স্কিউনেস' বলতে কী বুঝি তা আমরা সত্যই জানি না - অনেক সময় যা প্রকটভাবে প্রকাশিত হয় তবে কখনও কখনও তা আসলে হয় না। অনর্থক ক্ষেত্রে 'অবস্থান' এবং 'স্প্রেড' বলতে আমরা কী বোঝাতে চাইছি তা বোঝাতে অসুবিধা দেওয়া (উদাহরণস্বরূপ, অবস্থানের বিষয়ে কথা বলার সময় আমরা যে অর্থটি বোঝাতে চাইছি তা সর্বদা হয় না), এটি আরও বিস্ময়কর হওয়া উচিত নয় যে আরও সূক্ষ্ম skewness মত ধারণা অন্তত পিচ্ছিল হিসাবে। সুতরাং এটি আমাদের বোঝার বিভিন্ন বীজগণিত সংজ্ঞায়নের চেষ্টা করে এবং এগুলি সর্বদা একে অপরের সাথে একমত হয় না।
1) যদি আপনি দ্বিতীয় পিয়ারসন স্কিউনেস কোটিফিলিটি দ্বারা স্কিউনেস পরিমাপ করেন , তবে গড় ( ) তুলনায় কম হবে ( ie - এই ক্ষেত্রে আপনার এটি পিছনের দিকে রয়েছে)।
(জনসংখ্যা) দ্বিতীয় পিয়ারসনের স্কিউনেস হ'ল rac এবং যখন নেগেটিভ ("বাম স্কু") হবে ।μ < ∼ μ
এই পরিসংখ্যানগুলির নমুনা সংস্করণগুলি একইভাবে কাজ করে।
এই ক্ষেত্রে গড় এবং মিডিয়ানের মধ্যে প্রয়োজনীয় সম্পর্কের কারণ হ'ল সংকীর্ণতা পরিমাপকে এইভাবে সংজ্ঞায়িত করা হয়।
এখানে একটি বাম-স্কিউ ঘনত্ব রয়েছে (দ্বিতীয় পিয়ারসন পরিমাপ এবং নীচে (2) আরও সাধারণ পরিমাপ উভয় দ্বারা):
মাঝারিটি নিম্নতম মার্জিনে সবুজ রঙে চিহ্নিত করা হয়, গড়টি লাল হয়।
সুতরাং তারা আপনাকে যে উত্তরটি দিতে চায় তা আমি আশা করি তা হ'ল মাধ্যমের চেয়ে গড় কম। আমরা সাধারণত নাম দেওয়ার প্রবণতা বিভিন্ন প্রকারের ক্ষেত্রে এটি হয়।
(তবে পড়ুন, এবং দেখুন কেন এটি সাধারণ বিবৃতি হিসাবে আসলে সঠিক নয়))
2) আপনি যদি এটি আরও সাধারণ মানকৃত তৃতীয় মুহুর্তের সাহায্যে পরিমাপ করেন তবে এটি প্রায়শই হয় তবে সর্বদা কোনওভাবেই নয়, গড়টি মধ্যকের চেয়ে কম হবে।
এটি হ'ল যেখানে বিপরীতটি সত্য, বা যেখানে একটি স্কিউনেস পরিমাপ শূন্য এবং অন্যটি শূন্য নয় এমন উদাহরণগুলি তৈরি করা সম্ভব।
যার অর্থ, মধ্যবর্তী স্থান এবং মুহুর্তের সঙ্কোচনের জায়গাগুলির মধ্যে কোনও প্রয়োজনীয় সম্পর্ক নেই ।
উদাহরণস্বরূপ, নিম্নলিখিত নমুনাটি বিবেচনা করুন (একই উদাহরণটি একটি পৃথক সম্ভাব্যতা বন্টন হিসাবে নির্মিত যেতে পারে):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
তবুও (ফিশার, তৃতীয়-মুহুর্ত) স্কিউনেস সহগ negativeণাত্মক (অর্থাত তার আলোকসজ্জার দ্বারা আমরা বাম-স্কু ডেটা রেখেছি) যেহেতু গড় থেকে বিচ্যুতিগুলির কিউবের যোগফলটি নেতিবাচক।
সুতরাং সেই ক্ষেত্রে, বাম-স্কিউ, তবে মানে> মিডিয়ান।
(অন্যদিকে, আপনি যদি উপরের উদাহরণে ২.7 পরিবর্তন করে ৩ এ পরিবর্তন করেন তবে আপনার কাছে এমন একটি উদাহরণ রয়েছে যেখানে মুহুর্তের তীব্রতা শূন্য হয়, তবুও গড়টি মিডিয়াকে ছাড়িয়ে যায় you যদি আপনি এটি ৩.৩ করেন তবে মুহুর্তের সঙ্কোচন ইতিবাচক , এবং গড়টি মিডিয়াকে ছাড়িয়ে যায় - অর্থাৎ শেষ পর্যন্ত 'প্রত্যাশিত' দিকে in
আপনি যদি উপরোক্ত সংজ্ঞাগুলির পরিবর্তে প্রথম পিয়ারসন স্কিউনেস ব্যবহার করেন তবে আপনার ক্ষেত্রে এই একই রকম সমস্যা রয়েছে - স্কিউনেসের দিকটি সাধারণভাবে মধ্যম এবং মধ্যস্থতার সম্পর্ককে সরিয়ে দেয় না।
সম্পাদনা করুন: মন্তব্যে একটি প্রশ্নের উত্তরে - উদাহরণ যেখানে গড় এবং মাঝারি সমান, তবে মুহুর্তের সঙ্কোচটি নেতিবাচক। নিম্নলিখিত ডেটা বিবেচনা করুন (পূর্বের মতো এটিও একটি বিচ্ছিন্ন জনগোষ্ঠীর উদাহরণ হিসাবে গণনা করা; মরার মুখের উপর সংখ্যা লিখতে বিবেচনা করুন)।
1 5 6 6 8 10
গড় এবং মিডিয়ান উভয়ই 6, তবে গড় থেকে বিচ্যুতাকার ঘনকের যোগফলটি নেতিবাচক, সুতরাং তৃতীয় মুহুর্তের সঙ্কোচটি নেতিবাচক।
না। বাম স্কিউড ডেটার বাম দিকে (নিম্ন প্রান্তে) একটি দীর্ঘ লেজ রয়েছে যাতে গড়টি সাধারণত মধ্যকের চেয়ে কম হয়। (তবে একটি ব্যতিক্রমের জন্য @ গ্লেন_ বি এর উত্তর দেখুন)। ঘটনাচক্রে, আমি মনে করি যে বাম স্কিঙ্কের "দেখায়" এমন ডেটাগুলির অর্থ মিডিয়ানগুলির চেয়ে কম হবে।
ডান স্কিউ ডেটা বেশি সাধারণ; উদাহরণস্বরূপ, আয়। সেখানে গড়টি মধ্যকের চেয়ে বড়।
আর কোড
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001