পাটিগণিতটি লগ-স্বাভাবিক বিতরণে বিতরণের অর্থের চেয়ে ছোট কেন হয়?


13

সুতরাং, আমার কাছে একটি এলোমেলো প্রক্রিয়া রয়েছে যা লগ-সাধারণত বিতরণ করা এলোমেলো ভেরিয়েবল । এখানে সম্পর্কিত সম্ভাব্যতা ঘনত্ব ফাংশন:X

চিত্রটি কোনও লগনরমাল সম্ভাব্যতার ঘনত্বের কার্যকারিতা উপস্থাপন করে

আমি সেই মূল বিতরণের কয়েক মুহুর্তের বন্টন অনুমান করতে চেয়েছিলাম , আসুন 1 ম মুহুর্তটি: গাণিতিক গড় বলতে চাই। এটি করার জন্য, আমি 100 এলোমেলো ভেরিয়েবলগুলি 10000 বার আঁকে যাতে আমি পাটিগণিত গড়ের 10000 অনুমান গণনা করতে পারি।

এর অর্থ অনুমান করার জন্য দুটি ভিন্ন উপায় আছে (কমপক্ষে, আমি এটিই বুঝতে পেরেছিলাম: আমি ভুল হতে পারি):

  1. পাটিগণিতের স্পষ্ট গণনা করে স্বাভাবিক উপায়::
    X¯=i=1NXiN.
  2. বা প্রথম অন্তর্নিহিত সাধারণ বিতরণ থেকে এবং অনুমান করে : এবং তারপরে গড় হিসাবেμ μ = এন i = 1 লগ ( এক্স আই )σμˉ এক্স =এক্সপ্রেস(μ+1
    μ=i=1Nlog(Xi)Nσ2=i=1N(log(Xi)μ)2N
    X¯=exp(μ+12σ2).

সমস্যাটি হ'ল এই অনুমানের সাথে সম্পর্কিত বিতরণগুলি পদ্ধতিগতভাবে পৃথক:

দুইটি অনুমানকারী ছবিতে দেখানো হিসাবে বিভিন্ন বিতরণ দেয়।

"প্লেইন" অর্থ (লাল ড্যাশযুক্ত লাইন হিসাবে উপস্থাপিত) তাত্পর্যপূর্ণ ফর্ম (সবুজ প্লেইন লাইন) থেকে প্রাপ্ত সাধারণের চেয়ে কম মান সরবরাহ করে। যদিও উভয় মাধ্যম হুবহু একই ডেটাসেটে গণনা করা হয়। দয়া করে মনে রাখবেন যে এই পার্থক্যটি নিয়মতান্ত্রিক।

এই বিতরণগুলি কেন সমান নয়?


এবং জন্য আপনার সত্য পরামিতিগুলি কী কী ? σμσ
ক্রিস্টোফ হ্যাঙ্ক

σ = 1.5μ=3 এবং , তবে দয়া করে নোট করুন যে আমি এই পরামিতিগুলি অনুমান করতে আগ্রহী, সুতরাং এই কাঁচা সংখ্যাগুলি থেকে জিনিসটি গণনা করার পরিবর্তে মন্টে-কার্লো পন্থা। σ=1.5
ডাব্লু

নিশ্চিত, এটি আপনার ফলাফল প্রতিলিপি জন্য।
ক্রিস্টোফ হ্যাঙ্ক

4
মজার বিষয় হল, লজেনরোলটির সাথে এই ঘটনার কোনও যোগসূত্র নেই। লগারিদম সহ ধনাত্মক সংখ্যা দেওয়া , এটি তাদের গণিতের গড় (এএম) well কখনই তাদের জ্যামিতিক গড় (GM) চেয়ে কম নয় । অন্য দিকে, এএম কখনই GM জিএম এর চেয়ে বেশি হয় না যেখানে হ'ল বৈকল্পিক । সুতরাং, বিন্দুযুক্ত লাল বক্ররেখা অবশ্যই যে কোনও পিতামাতাকে বিতরণের জন্য শক্ত সবুজ বক্ররেখার বামে থাকতে হবে (ইতিবাচক এলোমেলো সংখ্যা বর্ণনা করে)। xiyixi/nexp(yi/n)exp(sy2/2)sy2yi
হোবার

যদি এর অর্থের বেশিরভাগ অংশ বিশাল সংখ্যার ক্ষুদ্র সম্ভাবনা থেকে আসে তবে একটি সীমাবদ্ধ নমুনা গাণিতিক গড় উচ্চ সম্ভাবনার সাথে জনসংখ্যাকে কম মূল্য দিতে পারে। (প্রত্যাশায় এটি নিরপেক্ষ, তবে একটি ক্ষুদ্র অবমূল্যায়নের বৃহত সম্ভাবনা এবং বৃহত্তর অনুমানের ক্ষুদ্র সম্ভাবনা রয়েছে)) এই প্রশ্নটি এর সাথে সম্পর্কিতও হতে পারে: stats.stackexchange.com/questions/214733/…
ম্যাথিউ গন

উত্তর:


12

আপনি যে দুটি অনুমানের সাথে তুলনা করছেন তা হ'ল মুহুর্তের অনুমানের পদ্ধতি (1.) এবং এমএলই (2), এখানে দেখুন । উভয়ই সামঞ্জস্যপূর্ণ (সুতরাং বৃহত্তর , তারা একটি নির্দিষ্ট অর্থে সম্ভবত সত্য মানের নিকটবর্তী হতে পারে )।Nexp[μ+1/2σ2]

এমএম অনুমানকারীদের জন্য, এটি একটি বিশাল সংখ্যক আইনের সরাসরি পরিণতি, যা বলে যে । এমএলই-র জন্য, অবিচ্ছিন্ন ম্যাপিং উপপাদ্যটি ইঙ্গিত করে যে হিসাবে as এবং ।X¯pE(Xi)

exp[μ^+1/2σ^2]pexp[μ+1/2σ2],
μ^pμσ^2pσ2

এমএলই অবশ্য পক্ষপাতহীন নয়।

প্রকৃতপক্ষে, জেনসেনের বৈষম্য আমাদের বলে যে জন্য , এমএলই উপরের দিকে পক্ষপাতদুষ্ট হওয়ার প্রত্যাশা করা হয় (নীচের সিমুলেশনটিও দেখুন): এবং (পরবর্তী ক্ষেত্রে প্রায়, , তবে জন্য একটি নগণ্য পক্ষপাতিত্ব সহ , নিরপেক্ষ অনুমানক যেমন দ্বারা বিভক্ত হয়ে পড়েছেন ) এটি একটি সাধারণ বিতরণ- এবং এর পরামিতিগুলির নিরপেক্ষ অনুমানক হিসাবে পরিচিত (আমি অনুমানগুলি নির্দেশ করতে টুপি ব্যবহার করি)।Nμ^σ^2N=100N1μσ2

সুতরাং, । যেহেতু সূচকটি একটি উত্তল ক্রিয়াকলাপ, তাই এর থেকে বোঝা যায় যে E(μ^+1/2σ^2)μ+1/2σ2

E[exp(μ^+1/2σ^2)]>exp[E(μ^+1/2σ^2)]exp[μ+1/2σ2]

কে আরও বড় সংখ্যায় বাড়ানোর চেষ্টা করুন , যা উভয় বিতরণকেই সত্য মানের দিকে কেন্দ্র করে।N=100

আর, জন্য এই মন্টি কার্লো চিত্রটি দেখুন :N=1000

এখানে চিত্র বর্ণনা লিখুন

সঙ্গে তৈরি:

N <- 1000
reps <- 10000

mu <- 3
sigma <- 1.5
mm <- mle <- rep(NA,reps)

for (i in 1:reps){
  X <- rlnorm(N, meanlog = mu, sdlog = sigma)
  mm[i] <- mean(X)

  normmean <- mean(log(X))
  normvar <- (N-1)/N*var(log(X))
  mle[i] <- exp(normmean+normvar/2)
}
plot(density(mm),col="green",lwd=2)
truemean <- exp(mu+1/2*sigma^2)
abline(v=truemean,lty=2)
lines(density(mle),col="red",lwd=2,lty=2)

> truemean
[1] 61.86781

> mean(mm)
[1] 61.97504

> mean(mle)
[1] 61.98256

আমরা লক্ষ্য করেছি যে উভয় বিতরণ এখন (কমবেশি) সত্য মানের ) এর চারদিকে কেন্দ্রীভূত থাকাকালীন , এমএলই, প্রায়শই দেখা যায়, আরও দক্ষ efficientexp(μ+σ2/2)

একজন প্রকৃতপক্ষে স্পষ্ট করে দেখাতে পারেন যে অ্যাসিপটোটিক বৈকল্পের তুলনা করে এটি অবশ্যই হওয়া উচিত। এই খুব সুন্দর সিভি উত্তর আমাদের বলে যে অ্যাসিম্পটোটিক ভেরিয়েন্সটি যখন এমএম অনুমানকারক, স্যাম্পল গড়ের জন্য সিএলটি-র সরাসরি প্রয়োগের মাধ্যমে লগ-সাধারণ বিতরণের , দ্বিতীয়টি প্রথমটির চেয়ে বড় কারণ হিসাবেএবং ।

Vt=(σ2+σ4/2)exp{2(μ+12σ2)},
মেপুঃ{σ2}>1+ +σ2+ +σ4/2,মেপুঃ(এক্স)=Σআমি = 0 এক্সআমি/আমি! σ2>0
exp{2(μ+12σ2)}(exp{σ2}1)
exp{σ2}>1+σ2+σ4/2,
exp(x)=i=0xi/i!σ2>0

এমএলই প্রকৃতপক্ষে ছোট পক্ষপাতদুষ্ট তা দেখতে , আমি সিমুলেশনটি এবং 50,000 প্রতিলিপি পুনরাবৃত্তি করি এবং নিম্নরূপে একটি অনুকরণযুক্ত পক্ষপাত গ্রহণ করি:NN <- c(50,100,200,500,1000,2000,3000,5000)

এখানে চিত্র বর্ণনা লিখুন

আমরা দেখতে পাচ্ছি যে এমএলই প্রকৃতপক্ষে ছোট জন্য গুরুতর পক্ষপাতদুষ্ট । ফাংশন হিসাবে এমএম অনুমানকারকের পক্ষপাতদুটির কিছুটা অনৈতিক আচরণ সম্পর্কে আমি কিছুটা অবাক হয়েছি । এমএম এর জন্য ছোট সিমুলেটেড পক্ষপাতটি সম্ভবত আউটলিয়ারদের দ্বারা ঘটে যা এমএলএর চেয়ে লগ-ইন এমএম অনুমানকারীকে বেশি ভারীভাবে প্রভাবিত করে। এক সিমুলেশন রানের মধ্যে, সবচেয়ে বড় অনুমানটি পরিণত হয়েছিলএন এন = 50NNN=50

> tail(sort(mm))
[1] 336.7619 356.6176 369.3869 385.8879 413.1249 784.6867
> tail(sort(mle))
[1] 187.7215 205.1379 216.0167 222.8078 229.6142 259.8727 

আহ ঠিক আছে. আমার কাছে এটি সত্যিই ঘটেছিল না যে একই পদ্ধতি দেওয়া অন্য পদ্ধতির চেয়ে একটি পদ্ধতি আরও কার্যকর হতে পারে। সুতরাং আমি বলতে পারি যে এমএলই দ্রবণটি সঠিকভাবে বুঝতে পারলে অন্য পদ্ধতির তুলনায় সাথে দ্রুত রূপান্তরিত হয় । ধন্যবাদ! N
ডাব্লু

1
পক্ষপাত সম্পর্কে আমি একটু সম্পাদনা করেছি। জন্য পক্ষপাত প্রকৃতপক্ষে এমএম মূল্নির্ধারক জন্য নেতিবাচক, কিন্তু যে একটি সাধারণ ফলাফলের ভালো বলে মনে হচ্ছে না, এর কার্যকারিতা হিসেবে পক্ষপাত জন্য চক্রান্ত দেখতে । এনN=100N
ক্রিস্টোফ হ্যাঙ্ক

2
ঠিক আছে, আমিও আশ্চর্য হয়েছি যে দুটি পদ্ধতির মধ্যে এত বড় পার্থক্য রয়েছে, তবে " উদাহরণস্বরূপ সামগ্রিক গড়" কেন ভয়ঙ্কর হতে পারে তা প্রমাণ করার জন্য এই উদাহরণটি একেবারে নিখুঁত !
ডাব্লু

1
@ জোহানডাব্লু, কেন এমএলই এর চেয়ে কম তারতম্য নিয়ে আমি একটি বিশ্লেষণাত্মক ব্যাখ্যা যুক্ত করেছি।
ক্রিস্টোফ হ্যাঙ্ক 11

1
পার্থক্যটি এই সত্য থেকেই উদ্ভূত হয় যে পক্ষপাত একটি সীমাবদ্ধ সমস্যা, অর্থাৎ অসীমের দিকে চলে যাওয়ার সাথে সাথে এটি অদৃশ্য হয়ে যায়। অ্যাসিম্পোটিক ভেরিয়েন্স (নাম হিসাবে বলা হয়) তুলনা কেবল হিসাবে সীমাতে কী ঘটে তা দেখায় । এন NN
ক্রিস্টোফ হ্যাঙ্ক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.