আমি এই সম্প্রদায়ের কাছ থেকে চার ধরণের স্কিউ সম্পর্কে আরও অন্তর্দৃষ্টি পাওয়ার আশা করছি।
আমি যে ধরণের উল্লেখ করি সেগুলি http://www.inside-r.org/packages/cran/e1071/docs/skewness সহায়তা পৃষ্ঠাতে উল্লিখিত হয়েছে ।
সাহায্য পৃষ্ঠায় পুরানো পদ্ধতিটি উল্লেখ করা হয়নি তবে আমি তা সত্ত্বেও এটি অন্তর্ভুক্ত করি।
require(moments)
require(e1071)
x=rnorm(100)
n=length(x)
hist(x)
###############type=1
e1071::skewness(x,type=1)
sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source
m_r=function(x,r) {n=length(x); sum((x - mean(x))^r/n);} ##from e1071::skewness help
g_1=function(x) m_r(x,3)/m_r(x,2)^(3/2)
g_1(x) ##from e1071::skewness help
moments::skewness(x) ##from e1071::skewness help
(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) ##from moments::skewness code, exactly as skewness help page
###############type=2
e1071::skewness(x,type=2)
e1071::skewness(x,type=1) * sqrt(n * (n - 1))/(n - 2) #from e1071::skewness source
G_1=function(x) {n=length(x); g_1(x)*sqrt(n*(n-1))/(n-2);} #from e1071::help
G_1(x)
excel.skew=function(x) { n=length(x); return(n/((n-1)*(n-2))*sum(((x-mean(x))/sd(x))^3));}
excel.skew(x)
###############type=3
e1071::skewness(x,type=3)
e1071::skewness(x,type=1) * ((1 - 1/n))^(3/2) #from e1071::skewness source
b_1=function(x) {n=length(x); g_1(x)*((n-1)/n)^(3/2); } #from e1071::skewness help page
b_1(x);
prof.skew=function(x) sum((x-mean(x))^3)/(length(x)*sd(x)^3);
prof.skew(x)
###############very old method that fails in weird cases
(3*mean(x)-median(x))/sd(x)
#I found this to fail on certain data sets as well...
এখানে e1071 এর লেখক উল্লেখ করেছেন যে: http://onlinelibrary.wiley.com/doi/10.1111/1467-9884.00122/pdf জোয়ানেস এবং সিএ গিল (1998), নমুনা স্কিউনেস এবং কুর্তোসিসের ব্যবস্থাগুলির তুলনা করে।
আমার এই কাগজটি পড়া থেকে তারা পরামর্শ দেয় যে টাইপ # 3 এর মধ্যে কমপক্ষে ত্রুটি রয়েছে।
এখানে উপরের কোড থেকে স্যাঙ্কনেসের উদাহরণ রয়েছে:
e1071::skewness(x,type=1)
-0.1620332
e1071::skewness(x,type=2)
-0.1645113
e1071::skewness(x,type=3)
-0.1596088
#old type:
0.2694532
আমি আরও লক্ষ্য করেছি যে e1071 এর লেখক সহায়তা পৃষ্ঠায় নোট থেকে আলাদা স্কিউ ফাংশনটি লিখেছেন। স্কয়ারটি লক্ষ্য করুন:
sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source
(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) #from moments and e1071 help page
স্কয়ার্ট (এন) প্রথম সমীকরণে কেন কোনও ধারণা? কোন সমীকরণ ওভারফ্লো / আন্ডারফ্লো আরও ভাল পরিচালনা করে? অন্য কোনও ধারণা কেন তারা আলাদা (তবে একই ফলাফল উত্পন্ন করে)?