দয়া করে কেউ পেরেটো বিতরণ এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের মধ্যে সম্পর্কের একটি সহজ (সাধারণ ব্যক্তি) ব্যাখ্যা সরবরাহ করতে পারেন (উদাহরণস্বরূপ এটি প্রয়োগ হয়? কেন / কেন নয়?)? আমি নিম্নলিখিত বিবৃতিটি বোঝার চেষ্টা করছি:
দয়া করে কেউ পেরেটো বিতরণ এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের মধ্যে সম্পর্কের একটি সহজ (সাধারণ ব্যক্তি) ব্যাখ্যা সরবরাহ করতে পারেন (উদাহরণস্বরূপ এটি প্রয়োগ হয়? কেন / কেন নয়?)? আমি নিম্নলিখিত বিবৃতিটি বোঝার চেষ্টা করছি:
উত্তর:
বিবৃতিটি সাধারণভাবে সত্য নয় - এর আকৃতি প্যারামিটার ( লিঙ্কের ) 1 এর চেয়ে বেশি হলে পেরেটো বিতরণটির সীমাবদ্ধ অর্থ হয়।
যখন গড় এবং ভিন্নতা উভয়ই বিদ্যমান থাকে ( ), তখন কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের স্বাভাবিক রূপগুলি - যেমন শাস্ত্রীয়, লায়াপুনভ, লিন্ডবার্গ প্রযোজ্য হবে
শাস্ত্রীয় কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যের বর্ণনা এখানে দেখুন
উদ্ধৃতিটি এক ধরণের অদ্ভুত, কারণ কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (উল্লিখিত কোনও ফর্মের মধ্যে) নমুনাটির অর্থ নিজেই প্রয়োগ হয় না, তবে একটি মানক মানে (এবং যদি আমরা এটির এমন কিছুতে প্রয়োগ করার চেষ্টা করি যার অর্থ এবং ভিন্নতা হয়) সীমাবদ্ধ নয় আমাদের আমরা খুব সাবধানতার সাথে ব্যাখ্যা করতে চাই যে আমরা আসলে কী বিষয়ে কথা বলছি, যেহেতু অংকের এবং ডিনোমিনিটার এমন কিছু বিষয় অন্তর্ভুক্ত করে যার সীমাবদ্ধতা নেই)।
তবুও (কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যগুলি সম্পর্কে কথা বলার জন্য যথাযথভাবে প্রকাশিত না হওয়া সত্ত্বেও) এর অন্তর্নিহিত বিন্দুটির কিছু রয়েছে - নমুনার অর্থ জনসংখ্যায় রূপান্তরিত হবে না ( বড় সংখ্যার দুর্বল আইন ধরে না, যেহেতু অবিচ্ছেদ্য মানে সংজ্ঞা দেওয়া সীমাবদ্ধ নয়)।
যেহেতু কজেটিল যথাযথভাবে মন্তব্যে উল্লেখ করেছেন, যদি আমরা রূপান্তর হারকে ভয়ানক হতে না এড়াতে পারি (অর্থাত এটি প্রয়োগে ব্যবহার করতে সক্ষম হতে পারি), আমাদের "কত দূরে" / "কত দ্রুত" এর উপর কিছুটা আবদ্ধ থাকা দরকার আনুমানিকতা কিক্স ইন করে say (বলুন) এর জন্য পর্যাপ্ত অনুমানের কোনও প্রয়োজন নেই যদি আমরা সাধারণ আনুমানিক থেকে কিছু ব্যবহারিক ব্যবহার চাই want
কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য গন্তব্য সম্পর্কে তবে আমাদের সেখানে কত দ্রুত পৌঁছা যায় সে সম্পর্কে কিছুই জানায় না; তবে বেরি-এসিন উপপাদ্য উপপাদ্যের মতো ফলাফল রয়েছে যা হারকে নির্দিষ্ট করে দেয় (একটি নির্দিষ্ট অর্থে)। বেরি-এসিনের ক্ষেত্রে, এটি তৃতীয় পরম মুহূর্ত ( ) নিরিখে স্ট্যান্ডার্ডাইজড গড় এবং আদর্শ সাধারণ সিডিএফের বিতরণ ফাংশনের মধ্যে সর্বাধিক দূরত্বকে সীমাবদ্ধ করে ।
সুতরাং Pareto ক্ষেত্রে, যদি , আমরা অন্তত কিছু উপর আবদ্ধ শুধু কিভাবে খারাপ পড়তা কিছু হতে পারে পেতে পারেন , এবং কিভাবে দ্রুত আমরা সেখানে পেয়ে থাকেন। (অন্যদিকে, সিডিএফএসের পার্থক্যের সীমাবদ্ধ করা আবশ্যকভাবে বিশেষভাবে "ব্যবহারিক" জিনিস নয় - যা আপনার আগ্রহী তা লেজের ক্ষেত্রের পার্থক্যের সাথে আবদ্ধ হওয়ার সাথে বিশেষভাবে সম্পর্কিত নাও হতে পারে)। তবুও, এটি কিছু (এবং কমপক্ষে কিছু পরিস্থিতিতে সিডিএফ বাঁধা আরও সরাসরি কার্যকর)।
আমি একটি উত্তর যুক্ত করব যা দেখিয়েছে যে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (সিএলটি) থেকে অনুমান কতটা খারাপ হতে পারে পেরেটো বিতরণের জন্য, এমনকি সিএলটি-র জন্য অনুমানগুলি পূরণ হয় এমন ক্ষেত্রেও। অনুমানটি হ'ল অবশ্যই একটি সীমাবদ্ধ বৈকল্পিকতা থাকতে হবে, যার অর্থ পেরেটোর অর্থ that । এটি কেন এটির জন্য আরও তাত্ত্বিক আলোচনার জন্য, আমার উত্তর এখানে দেখুন: সীমাবদ্ধ এবং অসীম বৈচিত্রের মধ্যে পার্থক্য কী?
আমি প্যারামিটার distribution সাথে প্যারেটো বিতরণ থেকে ডেটা সিমুলেট করব , যাতে ভেরিয়েন্সটি "সবেমাত্র সবেমাত্র বিদ্যমান" exists পার্থক্যটি দেখতে আমার সিমুলেশনগুলি দিয়ে আবার করুন! এখানে কিছু আর কোড রয়েছে:
### Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) # for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1 # variance just barely exist
E <- function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))
R <- 10000
e <- E(alpha)
sigma <- sqrt(VAR(alpha))
sim <- function(n) {
replicate(R, {x <- rpareto1(n,alpha,1)
x <- x-e
mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...
### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:
sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)
### Now we plot the histograms:
hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)
এবং এখানে চক্রান্ত:
কেউ দেখতে পাচ্ছেন যে নমুনা আকারে আমরা সাধারণ আনুমানিকতা থেকে অনেক দূরে। প্রকৃত তাত্ত্বিক বৈকল্পিক তুলনায় অভিজ্ঞতাগত পরিবর্তনগুলি এতটাই কম যে আমাদের চূড়ান্ত ডান পুচ্ছতে বিতরণের অংশগুলি থেকে ভিন্নতার ক্ষেত্রে আমাদের খুব বড় অবদান রয়েছে যা এতে দেখা যায় না that সর্বাধিক নমুনা। এটি সর্বদা প্রত্যাশিত হওয়া উচিত, যখন বৈকল্পিক "সবেমাত্র সবেমাত্র উপস্থিত"। এটি সম্পর্কে ভাবার একটি ব্যবহারিক উপায় নিম্নলিখিত the পেরেটো বিতরণগুলি প্রায়শই আয়ের (বা সম্পদ) বন্টনের মডেল করার প্রস্তাব দেওয়া হয়। আয়ের প্রত্যাশা (বা সম্পদ) খুব কয়েক বিলিয়ন থেকে খুব বড় অবদান থাকবে। ব্যবহারিক নমুনা আকারের সাথে স্যাম্পলিংয়ের নমুনায় কোনও বিলিয়ন ডলার অন্তর্ভুক্ত করার খুব কম সম্ভাবনা থাকবে!
আমি ইতিমধ্যে দেওয়া উত্তরগুলি পছন্দ করি তবে মনে করি "ব্যক্তিগত ব্যক্তির ব্যাখ্যা" দেওয়ার জন্য কিছুটা প্রযুক্তিগত রয়েছে তাই আমি আরও স্বজ্ঞাত কিছু চেষ্টা করব (সমীকরণ দ্বারা শুরু করে ...)।
ঘনত্বের এর গড়টি এই হিসাবে সংজ্ঞায়িত করা হয়েছে: সুতরাং গুরুতরভাবে বলতে গেলে, এর অর্থ হল এবং মধ্যে ঘনত্বের মধ্যে পণ্যটির "যোগফল " । যখন অসীমের দিকে ঝোঁক থাকে তখন পর্যাপ্ত পরিমাণে হতে হবে যাতে পণ্য না যায় (এবং ফলস্বরূপ যোগফলও হয়)। যখন পর্যাপ্ত পরিমাণে বিলুপ্ত হয় না, তখন পণ্যটি অনন্তে চলে যায়, অবিচ্ছেদ্য অনন্তে চলে যায়, বিদ্যমান না এবং অবশেষে, এর কোনও অর্থ হয় না। এটি নির্দিষ্ট প্যারামিটার মানগুলির জন্য পেরেটোর ক্ষেত্রে।
তারপরে, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটি বোধগম্য গড় এবং অর্থ মধ্যে এবং বিবিধতার একটি ফাংশন হিসাবে দূরত্বের বিতরণ স্থাপন করে সাথে )। আসুন দেখে নেওয়া যাক যে অনুশীলনীগত অর্থ mean গাউসিয়ান ডেনসিটি জন্য এর সংখ্যার ফাংশন হিসাবে আচরণ করে :
N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()
এটি একটি সাধারণ উপলব্ধি, নমুনাটির অর্থ ঘনত্বের সাথে রূপান্তরিত হয় পুরোপুরি যথাযথভাবে (এবং গড়পড়তাভাবে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য দ্বারা প্রদত্ত পথে)। কোনও অর্থ ছাড়াই পেরেটো বিতরণের জন্য একই কাজটি করা যাক (পরিবর্তে রনরম (এন, 1,1); পেরেটো দ্বারা (এন, 1.1,1);)
এই একটি টিপিক্যাল সিমুলেশন, সময়ে সময়ে, দৃঢ়ভাবে কেবল যেমন অবিচ্ছেদ্য সূত্র ব্যবহার করে, পণ্য ব্যাখ্যা beacuse নমুনা গড় বিচ্যুত হয় , উচ্চ মান ফ্রিকোয়েন্সি ক্ষতিপূরণ হয় কোন ছোট যথেষ্ট উচ্চ যে সত্য । সুতরাং গড়ের অস্তিত্ব নেই এবং নমুনাটির অর্থ কোনও আদর্শ মানের সাথে রূপান্তরিত করে না এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির বলার কিছুই নেই।
পরিশেষে, লক্ষ্য করুন যে কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি অনুশীলনীয় গড়, গড়, নমুনার আকার এবং বৈকল্পিকের সাথে সম্পর্কিত। সুতরাং ভেরিয়েন্স অবশ্যই উপস্থিত থাকতে হবে (বিশদগুলির জন্য কেজিটিল বি হালওয়ারসেন উত্তর দেখুন)।