স্কিউ এর টিমিং ... এত স্কু ফাংশন কেন?


9

আমি এই সম্প্রদায়ের কাছ থেকে চার ধরণের স্কিউ সম্পর্কে আরও অন্তর্দৃষ্টি পাওয়ার আশা করছি।

আমি যে ধরণের উল্লেখ করি সেগুলি http://www.inside-r.org/packages/cran/e1071/docs/skewness সহায়তা পৃষ্ঠাতে উল্লিখিত হয়েছে ।

সাহায্য পৃষ্ঠায় পুরানো পদ্ধতিটি উল্লেখ করা হয়নি তবে আমি তা সত্ত্বেও এটি অন্তর্ভুক্ত করি।

require(moments)
require(e1071)


x=rnorm(100)
n=length(x)
hist(x)


###############type=1
e1071::skewness(x,type=1)
sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source
m_r=function(x,r) {n=length(x); sum((x - mean(x))^r/n);} ##from e1071::skewness help
g_1=function(x) m_r(x,3)/m_r(x,2)^(3/2)
g_1(x) ##from e1071::skewness help
moments::skewness(x) ##from e1071::skewness help
(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) ##from moments::skewness code, exactly as skewness help page


###############type=2
e1071::skewness(x,type=2)
e1071::skewness(x,type=1) * sqrt(n * (n - 1))/(n - 2) #from e1071::skewness source
G_1=function(x) {n=length(x); g_1(x)*sqrt(n*(n-1))/(n-2);} #from e1071::help
G_1(x)
excel.skew=function(x) { n=length(x); return(n/((n-1)*(n-2))*sum(((x-mean(x))/sd(x))^3));}
excel.skew(x)


###############type=3
e1071::skewness(x,type=3)
e1071::skewness(x,type=1) * ((1 - 1/n))^(3/2) #from e1071::skewness source
b_1=function(x) {n=length(x); g_1(x)*((n-1)/n)^(3/2); }  #from e1071::skewness help page
b_1(x);
prof.skew=function(x) sum((x-mean(x))^3)/(length(x)*sd(x)^3);
prof.skew(x)

###############very old method that fails in weird cases
(3*mean(x)-median(x))/sd(x)
#I found this to fail on certain data sets as well...

এখানে e1071 এর লেখক উল্লেখ করেছেন যে: http://onlinelibrary.wiley.com/doi/10.1111/1467-9884.00122/pdf জোয়ানেস এবং সিএ গিল (1998), নমুনা স্কিউনেস এবং কুর্তোসিসের ব্যবস্থাগুলির তুলনা করে।

আমার এই কাগজটি পড়া থেকে তারা পরামর্শ দেয় যে টাইপ # 3 এর মধ্যে কমপক্ষে ত্রুটি রয়েছে।

এখানে উপরের কোড থেকে স্যাঙ্কনেসের উদাহরণ রয়েছে:

e1071::skewness(x,type=1)
-0.1620332
e1071::skewness(x,type=2)
-0.1645113
e1071::skewness(x,type=3)
-0.1596088
#old type:
0.2694532

আমি আরও লক্ষ্য করেছি যে e1071 এর লেখক সহায়তা পৃষ্ঠায় নোট থেকে আলাদা স্কিউ ফাংশনটি লিখেছেন। স্কয়ারটি লক্ষ্য করুন:

sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source

(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) #from moments and e1071 help page

স্কয়ার্ট (এন) প্রথম সমীকরণে কেন কোনও ধারণা? কোন সমীকরণ ওভারফ্লো / আন্ডারফ্লো আরও ভাল পরিচালনা করে? অন্য কোনও ধারণা কেন তারা আলাদা (তবে একই ফলাফল উত্পন্ন করে)?


3
আপনার প্রশ্নে "চার ধরণের স্কিউ" উল্লেখ করা হয়েছে ... তবে তারপরে একটি লিঙ্ক দেয় এবং কোডের গুচ্ছটিতে প্রবেশ করে (কোন ভাষা আপনি উল্লেখ করেন না)। সুতরাং আপনি যা জিজ্ঞাসা করছেন তা আবিষ্কার করার জন্য লোকেদের একটি লিঙ্কটি পড়তে হবে না, এবং যে লোকেরা আর পড়েন না তাদের সুবিধার জন্য এবং যারা বুঝতে পঠনের কোডটি পড়ার কোডকে অসহায় মনে করেন, এটি কোনটি সংজ্ঞায়িত করতে সহায়তা করবে সংকোচনের পদক্ষেপগুলি যা কোডের একটি সোয়েট আগে (বা তার পরিবর্তে পরিবর্তে) বোঝাতে চাইছেন। [যখন আপনি "এই চার" বলার পরিবর্তে "চার" বলছেন, আপনি কেন মনে করেন যে পাঁচ বা সাত বা অন্য কোনও সংখ্যার চেয়ে ঠিক চারটি আছে?]
গ্লেন_বি -রিনস্টেট মনিকা

1
আমি আপনার পোস্টে যে সুনির্দিষ্ট প্রশ্নগুলি পেয়েছি তার জবাব দেওয়ার একটি ফর্ম দেওয়ার চেষ্টা করেছি এবং পথে বেশ কয়েকটি সমস্যা সম্বোধন করেছি, তবে এর বাইরে "আরও অন্তর্দৃষ্টি থাকার আশা" এর প্রতিক্রিয়া জানানো খুব অস্পষ্ট। আপনি কোন জিনিসগুলির বিষয়ে অন্তর্দৃষ্টি চান সেটি আরও পরিষ্কারভাবে চিহ্নিত করতে পারবেন? স্কিউনেস সম্পর্কিত আমাদের সাইটে অনেক প্রশ্ন রয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

ধন্যবাদ গ্লেন, আপনার পোস্টের জন্য। উদাহরণস্বরূপ উদ্দেশ্যে এবং সূত্রগুলি দেখানোর জন্য আমি আরকে অন্তর্ভুক্ত করেছি। এছাড়াও আমি লেটেক্সকে চিনি না। :(
ক্রিস

উত্তর:


10

যাকে আপনি "একটি পুরানো পদ্ধতি" হিসাবে বর্ণনা করেছেন তার সাথে শুরু করা যাক; এটি দ্বিতীয় পিয়ারসন স্কিউনেস বা মিডিয়ান-স্কিউনেস ; প্রকৃতপক্ষে মুহূর্তের স্কিউনেস এবং সেগুলি একইভাবে একই মাপের (মিডিয়েন স্কিউনেস আসলে পিয়ারসনের প্রচেষ্টার পূর্ববর্তী মুহুর্তের তুলনায় কিছুটা ছোট)।

ইতিহাসের কিছুটা আলোচনা এখানে পাওয়া যাবে ; এই পোস্টটি আপনার অন্যান্য কয়েকটি প্রশ্নের উপর কিছুটা আলোকপাত করতে পারে।

আপনি যদি দ্বিতীয় পিয়ারসন স্কিউনেস ব্যবহার করে আমাদের সাইটটি অনুসন্ধান করেন তবে আপনি বেশ কয়েকটি পোস্টকে আঘাত করতে পারবেন যাতে এই পরিমাপের আচরণ সম্পর্কে কিছু আলোচনা রয়েছে।

আমার মনের স্কিউনেস মাপ দেওয়ার মুহুর্তের তুলনায় এটি আসলেই কোনও উদ্বেগজনক নয়; তারা দু'জনেই মাঝে মাঝে এমন কিছু অদ্ভুত কাজ করেন যা লোকদের সঙ্কোচনের পরিমাপের প্রত্যাশার সাথে মেলে না।


এর স্বাভাবিক রূপ 1এখানে উইকিপিডিয়ায় আলোচিত ; যেমনটি বলা হয়েছে, এটি মুহুর্তের অনুমানের একটি পদ্ধতি এবং মানকৃত তৃতীয় মুহুর্তের জনসংখ্যার গণনা প্রদানে একটি প্রাকৃতিক জিনিস।

যদি এক ব্যবহার করে গুলিএন জন্য গুলিএন-1 (অর্থাত্ বেসেল সংশোধন ছাড়াই) আপনি এটি পান 1আপনি উল্লেখ টাইপ; এর মধ্যে যাকে আমি "মুহুর্তের পদ্ধতি" বলি। এটি আমার কাছে স্পষ্ট নয় যে ডিনোমিনেটরকে আনবিয়াস করার অনেক পয়েন্ট রয়েছে যেহেতু এটি অনুপাতটি অবিবেচনা করে না; এটি করার জন্য এটি বোধগম্য হতে পারে যাতে গণনা হাতছাড়া করে যা আশা করতে পারে তার সাথে মেলে।

তবে জনসংখ্যার স্কিউনেস সংজ্ঞায়িত করার জন্য দ্বিতীয় (সমতুল্য) উপায় আছে, সংখ্যার তুলনায় (উপরের উইকিপিডিয়া লিঙ্কটি দেখুন), এবং যদি কোনও নমুনা স্কিউনেসের জন্য আপনি নিরপেক্ষ অনুমান ব্যবহার করেছেন তবে আপনি পাবেন জি1

[আরও মনে রাখবেন যে এর মধ্যে অংকটি গুণ করছে 1 দ্বারা এন2(এন-1)(এন-2)এটি নিষ্ক্রিয় করে, যাতে লোকেরা সেই ফর্মটির দিকে তাকানোর আর একটি কারণ হতে পারে। যদি কেউ তৃতীয় এবং দ্বিতীয় মুহুর্তের গণনা উভয়কেই আনবিয়াস করার চেষ্টা করে তবে কেউ এর মধ্যে কিছুটা আলাদা ফ্যাক্টর অর্জন করেএন,(এন-1) এবং (এন-2) সামনে বেরিয়ে আসছে।]

এগুলির তিনটিই তৃতীয়-মুহুর্তের স্কিউনেসে সামান্য ভিন্ন ভিন্নতা। খুব বড় নমুনায় আপনি ব্যবহার করেন এমন কোনও পার্থক্য নেই। ছোট নমুনায় তাদের সবার কিছুটা ভিন্ন পক্ষপাত এবং বৈকল্পিকতা রয়েছে।


এখানে আলোচনা করা ফর্মগুলি স্কিউনেসের সংজ্ঞাগুলি শেষ করে না (আমি প্রায় এক ডজন দেখেছি, আমি মনে করি - উইকিপিডিয়া নিবন্ধটি বেশ কয়েকটি তালিকাভুক্ত করে, তবে এটি গামুটকেও আবৃত করে না), এমনকি তৃতীয় সম্পর্কিত সংজ্ঞাগুলিও - কিছুক্ষণের স্কিউনেস, যার মধ্যে আমি এখানে আপনি উত্থাপিত তিনটির চেয়ে বেশি দেখেছি।

স্কিউনেসের বহু ব্যবস্থা কেন?

সুতরাং (তৃতীয় মুহুর্তের সমস্ত তাত্পর্যকে এক মুহুর্তের জন্য বিবেচনা করে) কেন এত ভিন্ন ভিন্ন সংশয়? আংশিকভাবে এটি কারণ একটি ধারণা হিসাবে skewness আসলে নিচে পিন করা বেশ কঠিন। এটি পিচ্ছিল জিনিস যা আপনি সত্যিই কোনও সংখ্যায় পিন করতে পারবেন না। ফলস্বরূপ, সমস্ত সংজ্ঞাগুলি কোনওভাবেই পর্যাপ্ত চেয়ে কম, তবে তবুও সাধারণত আমরা কীভাবে একটি স্কিউনেস পরিমাপ করতে হবে তা আমাদের বিস্তৃত বোধের সাথে একমত accord লোকেরা আরও ভাল সংজ্ঞা নিয়ে আসতে চেষ্টা করে, তবে কিউওয়ার্টি কীবোর্ডের মতো পুরানো ব্যবস্থা কোথাও চলছে না।

তৃতীয় মুহুর্তের উপর ভিত্তি করে স্কিউনেসের বিভিন্ন ব্যবস্থা কেন?

তৃতীয়-মুহুর্তের এতগুলি সংকোচনের কারণ কেন, জনসংখ্যা-পরিমাপকে একটি নমুনা পরিমাপে পরিণত করার একাধিক উপায় ছাড়াও এর কারণ। আমরা মুহুর্তের উপর ভিত্তি করে দুটি টি রুট দেখেছি এবং একটি কমোলেটের ভিত্তিতে। আমরা আরও নির্মাণ করতে পারে; আমরা উদাহরণস্বরূপ কিছু বিতরণীয় অনুমানের অধীনে (ছোট-নমুনা) নিরপেক্ষ ব্যবস্থা গ্রহণের চেষ্টা করতে পারি, বা ন্যূনতম-গড়-বর্গক্ষেত্র-ত্রুটির পরিমাপ বা এই জাতীয় কিছু পরিমাণ।

স্কিউনেস আলোকিতকরণ সম্পর্কিত সাইটগুলিতে আপনি কয়েকটি পোস্ট পেতে পারেন; এমন কিছু আছে যা বিতরণের উদাহরণ দেখায় যা প্রতিসম নয় তবে শূন্যের তৃতীয় মুহুর্তের সঙ্কোচ রয়েছে। কিছু আছে যা পিয়ারসন মিডিয়ান-স্কিউনেস দেখায় এবং তৃতীয় মুহুর্তের স্কিউনেসের বিপরীত চিহ্ন থাকতে পারে।

স্কিউনেস সম্পর্কিত কয়েকটি পোস্টের লিঙ্কগুলি এখানে:

এর অর্থ কি = মধ্যমা বোঝায় যে একটি অবিবাহিত বিতরণটি প্রতিসম হয়?

বাম স্কিউড ডেটাতে, মধ্য ও মধ্যবর্তীদের মধ্যে সম্পর্ক কী?

কীভাবে হিস্টোগ্রাম থেকে আউটলিয়ারদের সাথে স্কিউনেস নির্ধারণ করবেন?


গণনা সম্পর্কে আপনার চূড়ান্ত প্রশ্নের সাথে সম্পর্কিত 1:

এনΣ(এক্স-এক্স¯)3(Σ(এক্স-এক্স¯)2)3/2 # থেকে e1071 :: স্কিউনেস উত্স

Σ(এক্স-এক্স¯)3/এন(Σ(এক্স-এক্স¯)2/এন)3/2 # মুহুর্ত এবং e1071 সহায়তা পৃষ্ঠা থেকে

দুটি রূপ বীজগণিতভাবে অভিন্ন; দ্বিতীয়টি স্পষ্টভাবে ফর্মটিতে লেখা হয়েছে "ক্ষণে দ্বিতীয় মুহুর্তে তৃতীয় মুহূর্ত32, যখন প্রথমটি শর্তাবলী বাতিল করে এনএবং বাম অংশগুলি সামনে নিয়ে আসে। আমি মনে করি না এটি ওভারফ্লো / আন্ডারফ্লো এড়ানোর কারণেই করা হয়েছিল; আমি ভাবলাম এটি হয়ে গেছে কারণ এটি আরও দ্রুত হতে পারে বলে মনে করা হয়েছিল। [যদি ওভারফ্লো বা আন্ডারফ্লো কোনও উদ্বেগ হয় তবে সম্ভবত গণনাগুলি অন্যরকমভাবে সাজানো হবে]]

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.