কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য এবং পেরিটো বিতরণ


10

দয়া করে কেউ পেরেটো বিতরণ এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের মধ্যে সম্পর্কের একটি সহজ (সাধারণ ব্যক্তি) ব্যাখ্যা সরবরাহ করতে পারেন (উদাহরণস্বরূপ এটি প্রয়োগ হয়? কেন / কেন নয়?)? আমি নিম্নলিখিত বিবৃতিটি বোঝার চেষ্টা করছি:

"কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য প্রতিটি বিতরণের সাথে কাজ করে না This এটি একটি ছিনতাইয়ের কারণে ঘটে - নমুনা অর্থ যদি বিদ্যমান থাকে তবে অন্তর্নিহিত বিতরণের গড়ের চারপাশে ক্লাস্টার থাকে But তবে কীভাবে কোনও বিতরণের কোনও অর্থ হতে পারে না? ওয়েল, একটি সাধারণ বিতরণ পেরেটো বিতরণটির কোনও অর্থ নেই you আপনি যদি সাধারণ পদ্ধতিগুলি ব্যবহার করে এটি গণনা করার চেষ্টা করেন তবে তা অনন্তের দিকে চলে যাবে ""

উত্তর:


15

বিবৃতিটি সাধারণভাবে সত্য নয় - এর আকৃতি প্যারামিটার ( লিঙ্কের ) 1 এর চেয়ে বেশি হলে পেরেটো বিতরণটির সীমাবদ্ধ অর্থ হয়।α

যখন গড় এবং ভিন্নতা উভয়ই বিদ্যমান থাকে ( ), তখন কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের স্বাভাবিক রূপগুলি - যেমন শাস্ত্রীয়, লায়াপুনভ, লিন্ডবার্গ প্রযোজ্য হবেα>2

শাস্ত্রীয় কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যের বর্ণনা এখানে দেখুন

উদ্ধৃতিটি এক ধরণের অদ্ভুত, কারণ কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (উল্লিখিত কোনও ফর্মের মধ্যে) নমুনাটির অর্থ নিজেই প্রয়োগ হয় না, তবে একটি মানক মানে (এবং যদি আমরা এটির এমন কিছুতে প্রয়োগ করার চেষ্টা করি যার অর্থ এবং ভিন্নতা হয়) সীমাবদ্ধ নয় আমাদের আমরা খুব সাবধানতার সাথে ব্যাখ্যা করতে চাই যে আমরা আসলে কী বিষয়ে কথা বলছি, যেহেতু অংকের এবং ডিনোমিনিটার এমন কিছু বিষয় অন্তর্ভুক্ত করে যার সীমাবদ্ধতা নেই)।

তবুও (কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যগুলি সম্পর্কে কথা বলার জন্য যথাযথভাবে প্রকাশিত না হওয়া সত্ত্বেও) এর অন্তর্নিহিত বিন্দুটির কিছু রয়েছে - নমুনার অর্থ জনসংখ্যায় রূপান্তরিত হবে না ( বড় সংখ্যার দুর্বল আইন ধরে না, যেহেতু অবিচ্ছেদ্য মানে সংজ্ঞা দেওয়া সীমাবদ্ধ নয়)।


যেহেতু কজেটিল যথাযথভাবে মন্তব্যে উল্লেখ করেছেন, যদি আমরা রূপান্তর হারকে ভয়ানক হতে না এড়াতে পারি (অর্থাত এটি প্রয়োগে ব্যবহার করতে সক্ষম হতে পারি), আমাদের "কত দূরে" / "কত দ্রুত" এর উপর কিছুটা আবদ্ধ থাকা দরকার আনুমানিকতা কিক্স ইন করে say (বলুন) এর জন্য পর্যাপ্ত অনুমানের কোনও প্রয়োজন নেই যদি আমরা সাধারণ আনুমানিক থেকে কিছু ব্যবহারিক ব্যবহার চাই wantn>1010100

কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য গন্তব্য সম্পর্কে তবে আমাদের সেখানে কত দ্রুত পৌঁছা যায় সে সম্পর্কে কিছুই জানায় না; তবে বেরি-এসিন উপপাদ্য উপপাদ্যের মতো ফলাফল রয়েছে যা হারকে নির্দিষ্ট করে দেয় (একটি নির্দিষ্ট অর্থে)। বেরি-এসিনের ক্ষেত্রে, এটি তৃতীয় পরম মুহূর্ত ( ) নিরিখে স্ট্যান্ডার্ডাইজড গড় এবং আদর্শ সাধারণ সিডিএফের বিতরণ ফাংশনের মধ্যে সর্বাধিক দূরত্বকে সীমাবদ্ধ করে ।E(|X|3)

সুতরাং Pareto ক্ষেত্রে, যদি , আমরা অন্তত কিছু উপর আবদ্ধ শুধু কিভাবে খারাপ পড়তা কিছু হতে পারে পেতে পারেন , এবং কিভাবে দ্রুত আমরা সেখানে পেয়ে থাকেন। (অন্যদিকে, সিডিএফএসের পার্থক্যের সীমাবদ্ধ করা আবশ্যকভাবে বিশেষভাবে "ব্যবহারিক" জিনিস নয় - যা আপনার আগ্রহী তা লেজের ক্ষেত্রের পার্থক্যের সাথে আবদ্ধ হওয়ার সাথে বিশেষভাবে সম্পর্কিত নাও হতে পারে)। তবুও, এটি কিছু (এবং কমপক্ষে কিছু পরিস্থিতিতে সিডিএফ বাঁধা আরও সরাসরি কার্যকর)।α>3n


2
তবে যদি বৈকল্পিক সবেমাত্র উপস্থিত থাকে, তবে এটি তবে খুব নিকটবর্তী, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি নীতিগতভাবে প্রয়োগ করার সময় খুব খারাপ অনুমানের দিকে নিয়ে যেতে পারে। আনুমানিক মানের উপর কিছুটা নিয়ন্ত্রণ রাখতে আপনার বেরি-এসিন উপপাদ্যের মতো কিছু দরকার, যার তৃতীয় মুহুর্ত প্রয়োজন, that । α>2α>3
কেজেটিল বি হালওয়ারসেন

@ কেজেটিল বেশ তাই; অনুশীলনে আপনার কেবল দ্বিতীয় মুহুর্তের চেয়ে বেশি প্রয়োজন কারণ অভিব্যক্তিটি অকেজোভাবে ধীর হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

1
হ্যাঁ, আমি এটি দেখানোর জন্য একটি উত্তর যুক্ত করব!
কেজেটিল বি হালওয়ারসেন

2
কিছু বিতরণ যা কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি অনুসরণ করে না একটি স্থিতিশীল আইনে রূপান্তরিত করার জন্য মানক করা যেতে পারে।
মাইকেল আর চেরনিক

এখানে দুর্দান্ত আলোচনা। ইচ্ছুক স্ট্যাকএক্সচেঞ্জের লোকদের উত্তর / মন্তব্যগুলি অনুসরণ করার একটি উপায় ছিল;)
চান-হো সুহ

9

আমি একটি উত্তর যুক্ত করব যা দেখিয়েছে যে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (সিএলটি) থেকে অনুমান কতটা খারাপ হতে পারে পেরেটো বিতরণের জন্য, এমনকি সিএলটি-র জন্য অনুমানগুলি পূরণ হয় এমন ক্ষেত্রেও। অনুমানটি হ'ল অবশ্যই একটি সীমাবদ্ধ বৈকল্পিকতা থাকতে হবে, যার অর্থ পেরেটোর অর্থ that । এটি কেন এটির জন্য আরও তাত্ত্বিক আলোচনার জন্য, আমার উত্তর এখানে দেখুন: সীমাবদ্ধ এবং অসীম বৈচিত্রের মধ্যে পার্থক্য কী?α>2

আমি প্যারামিটার distribution সাথে প্যারেটো বিতরণ থেকে ডেটা সিমুলেট করব , যাতে ভেরিয়েন্সটি "সবেমাত্র সবেমাত্র বিদ্যমান" exists পার্থক্যটি দেখতে আমার সিমুলেশনগুলি দিয়ে আবার করুন! এখানে কিছু আর কোড রয়েছে:α=2.1α=3.1

###  Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) #  for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1  #  variance just barely exist
E <-  function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))

R <- 10000
e <-  E(alpha)
sigma  <-  sqrt(VAR(alpha))
sim <-  function(n) {
    replicate(R, {x <- rpareto1(n,alpha,1)
        x <- x-e
        mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...

### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:

sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)

### Now we plot the histograms:
    hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)

এবং এখানে চক্রান্ত:

সিমুলেটেড পেরেটো অর্থ, হিস্টোগ্রাম

কেউ দেখতে পাচ্ছেন যে নমুনা আকারে আমরা সাধারণ আনুমানিকতা থেকে অনেক দূরে। প্রকৃত তাত্ত্বিক বৈকল্পিক তুলনায় অভিজ্ঞতাগত পরিবর্তনগুলি এতটাই কম যে আমাদের চূড়ান্ত ডান পুচ্ছতে বিতরণের অংশগুলি থেকে ভিন্নতার ক্ষেত্রে আমাদের খুব বড় অবদান রয়েছে যা এতে দেখা যায় না that সর্বাধিক নমুনা। এটি সর্বদা প্রত্যাশিত হওয়া উচিত, যখন বৈকল্পিক "সবেমাত্র সবেমাত্র উপস্থিত"n=10000σ2=1। এটি সম্পর্কে ভাবার একটি ব্যবহারিক উপায় নিম্নলিখিত the পেরেটো বিতরণগুলি প্রায়শই আয়ের (বা সম্পদ) বন্টনের মডেল করার প্রস্তাব দেওয়া হয়। আয়ের প্রত্যাশা (বা সম্পদ) খুব কয়েক বিলিয়ন থেকে খুব বড় অবদান থাকবে। ব্যবহারিক নমুনা আকারের সাথে স্যাম্পলিংয়ের নমুনায় কোনও বিলিয়ন ডলার অন্তর্ভুক্ত করার খুব কম সম্ভাবনা থাকবে!


3

আমি ইতিমধ্যে দেওয়া উত্তরগুলি পছন্দ করি তবে মনে করি "ব্যক্তিগত ব্যক্তির ব্যাখ্যা" দেওয়ার জন্য কিছুটা প্রযুক্তিগত রয়েছে তাই আমি আরও স্বজ্ঞাত কিছু চেষ্টা করব (সমীকরণ দ্বারা শুরু করে ...)।

ঘনত্বের এর গড়টি এই হিসাবে সংজ্ঞায়িত করা হয়েছে: সুতরাং গুরুতরভাবে বলতে গেলে, এর অর্থ হল এবং মধ্যে ঘনত্বের মধ্যে পণ্যটির "যোগফল " । যখন অসীমের দিকে ঝোঁক থাকে তখন পর্যাপ্ত পরিমাণে হতে হবে যাতে পণ্য না যায় (এবং ফলস্বরূপ যোগফলও হয়)। যখন পর্যাপ্ত পরিমাণে বিলুপ্ত হয় না, তখন পণ্যটি অনন্তে চলে যায়, অবিচ্ছেদ্য অনন্তে চলে যায়, বিদ্যমান না এবং অবশেষে, এর কোনও অর্থ হয় না। এটি নির্দিষ্ট প্যারামিটার মানগুলির জন্য পেরেটোর ক্ষেত্রে।p

μ=xp(x)dx
xxxxp(x)xp(x)p(x)μp

তারপরে, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটি বোধগম্য গড় এবং অর্থ মধ্যে এবং বিবিধতার একটি ফাংশন হিসাবে দূরত্বের বিতরণ স্থাপন করে সাথে )। আসুন দেখে নেওয়া যাক যে অনুশীলনীগত অর্থ mean গাউসিয়ান ডেনসিটি জন্য এর সংখ্যার ফাংশন হিসাবে আচরণ করে :x¯=1nixiμpnnx¯np

N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()

এখানে চিত্র বর্ণনা লিখুন

এটি একটি সাধারণ উপলব্ধি, নমুনাটির অর্থ ঘনত্বের সাথে রূপান্তরিত হয় পুরোপুরি যথাযথভাবে (এবং গড়পড়তাভাবে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য দ্বারা প্রদত্ত পথে)। কোনও অর্থ ছাড়াই পেরেটো বিতরণের জন্য একই কাজটি করা যাক (পরিবর্তে রনরম (এন, 1,1); পেরেটো দ্বারা (এন, 1.1,1);)

এখানে চিত্র বর্ণনা লিখুন

এই একটি টিপিক্যাল সিমুলেশন, সময়ে সময়ে, দৃঢ়ভাবে কেবল যেমন অবিচ্ছেদ্য সূত্র ব্যবহার করে, পণ্য ব্যাখ্যা beacuse নমুনা গড় বিচ্যুত হয় , উচ্চ মান ফ্রিকোয়েন্সি ক্ষতিপূরণ হয় কোন ছোট যথেষ্ট উচ্চ যে সত্য । সুতরাং গড়ের অস্তিত্ব নেই এবং নমুনাটির অর্থ কোনও আদর্শ মানের সাথে রূপান্তরিত করে না এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির বলার কিছুই নেই।p(x)xxx

পরিশেষে, লক্ষ্য করুন যে কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি অনুশীলনীয় গড়, গড়, নমুনার আকার এবং বৈকল্পিকের সাথে সম্পর্কিত। সুতরাং ভেরিয়েন্স অবশ্যই উপস্থিত থাকতে হবে (বিশদগুলির জন্য কেজিটিল বি হালওয়ারসেন উত্তর দেখুন)।n(xμ)2p(x)dx

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.