লগনরমাল বিতরণের মুহুর্তের অনুমানের বায়াস


25

আমি কিছু সংখ্যক পরীক্ষা নিরীক্ষা করছি যা লগনরমাল ডিস্ট্রিবিউশন নমুনা তৈরি করে এবং দুটি পদ্ধতি দ্বারা মুহুর্তগুলি অনুমান করার চেষ্টা করছি: :XLN(μ,σ)E[Xn]

  1. of নমুনা গড়ের দিকেXn
  2. জন্য নমুনা অর্থ ব্যবহার করে এবং অনুমান করা , এবং তারপরে লগনরমাল বিতরণের জন্য আমাদের কাছে ।μσ2log(X),log2(X)E[Xn]=exp(nμ+(nσ)2/2)

প্রশ্নটি হ'ল :

আমি পরীক্ষামূলকভাবে দেখতে পেলাম যে দ্বিতীয় পদ্ধতিটি আরও ভাল পারফরম্যান্স করে প্রথমটি যখন আমি নমুনার সংখ্যা স্থির রাখি এবং কিছু ফ্যাক্টর টি দ্বারা by বৃদ্ধি করি increase এই কি কোনও সাধারণ ব্যাখ্যা আছে?μ,σ2

আমি এমন একটি চিত্র সংযুক্ত করছি যেখানে x- অক্ষ টি, যখন y অক্ষটি মান the এর সত্যিকারের তুলনা করে অনুমান (কমলা রেখা), আনুমানিক মানগুলিতে। পদ্ধতি 1 - নীল বিন্দু, পদ্ধতি 2 - সবুজ বিন্দু। y- অক্ষ লগ স্কেলে আছে [ এক্স 2 ] = এক্সপ্রেস ( 2 μ + 2 σ 2 )E[X2]E[X2]=exp(2μ+2σ2)

$ Th mathbb {E} [X ^ 2] $ এর জন্য সত্য এবং আনুমানিক মান $  নীল বিন্দুগুলি হ'ল $ \ mathbb {E} [এক্স ^ 2] $ (পদ্ধতি 1) এর জন্য নমুনা অর্থ, যখন সবুজ বিন্দুগুলি পদ্ধতিটি 2 ব্যবহার করে অনুমান করা মান The \ mu $, $ \ থেকে কমলা রেখা গণনা করা হয় পদ্ধতি 2 হিসাবে একই সমীকরণ দ্বারা সিগমা 2. y অক্ষ অক্ষর লগ স্কেল হয়

সম্পাদনা করুন:

আউটপুট সহ এক টি এর ফলাফল তৈরি করার জন্য নীচে একটি ন্যূনতম গণিত কোড রয়েছে:

   ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];

(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];

(*Calculate directly: *)
rmomentSample = Mean[data^n];

(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];

(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}

আউটপুট:

(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}

উপরে, দ্বিতীয় ফলাফলটি এর নমুনা গড় , যা অন্য দুটি ফলাফলের নীচেr2


2
একটি নিরপেক্ষ অনুমানকটি বোঝায় না যে নীল বিন্দুগুলি প্রত্যাশিত মান (কমলা বক্ররেখা) এর কাছাকাছি হওয়া উচিত। কোনও অনুমানকারী পক্ষপাতহীন হতে পারে যদি এটির খুব কম এবং ছোট হওয়ার সম্ভাবনা থাকে (সম্ভবত তুচ্ছভাবে ছোট হয়) তবে খুব উচ্চতর হওয়ার সম্ভাবনা থাকে। এটি টি-এর বেড়ে যাওয়ার সাথে সাথে তারতম্যটি বিশাল আকারের হয়ে যায় (আমার উত্তর দেখুন)।
ম্যাথু গুন

নিরপেক্ষ অনুমানকারী কীভাবে পাওয়া যায় তার জন্য দয়া করে stats.stackexchange.com/questions/105717 দেখুন । এর উত্তর এবং মতামতগুলির গড় এবং বিমূর্ততার UMVUEs দেওয়া আছে।
whuber

উত্তর:


22

সেই ফলাফলগুলিতে কিছুটা অবাক হচ্ছেন is

  1. প্রথম পদ্ধতিটি একটি নিরপেক্ষ অনুমান সরবরাহ করে , যথা এর এর গড় হিসাবে। সুতরাং নীল বিন্দাগুলি প্রত্যাশিত মানের (কমলা বক্ররেখা) কাছাকাছি হওয়া উচিত;1E[X2][এক্স2]
    1Ni=1NXi2
    E[X2]
  2. দ্বিতীয় পদ্ধতিটি একটি পক্ষপাতদুষ্ট অনুমান সরবরাহ করে , যথা যখন এবং যথাক্রমে এবং নিরপেক্ষ অনুমান করে, এবং এইভাবে সবুজ বিন্দুগুলি সারিবদ্ধ হয় তা হয় কমলা বক্ররেখা সঙ্গে।E[X2]
    E[exp(nμ^+n2σ^2/2)]>exp(nμ+(nσ)2/2)
    μ^σ^²μσ²

তবে এগুলি সমস্যার কারণে এবং সংখ্যাগত গণনাগুলির কারণে নয়: আমি আর-তে পরীক্ষার পুনরাবৃত্তি করেছিলাম এবং একই রঙের কোড এবং 's এবং একই ক্রম সহ নীচের ছবিটি পেয়েছি , যা প্রতিটি অনুমানকারীকে বিভক্ত প্রতিনিধিত্ব করে সত্য প্রত্যাশার দ্বারা:μTσT

10⁶ লগ-নরমাল সিমুলেশনের উপর ভিত্তি করে দুটি অভিজ্ঞতামূলক দ্বিতীয় মুহুর্ত

এখানে সম্পর্কিত আর কোডটি দেওয়া হল:

moy1=moy2=rep(0,200)
mus=0.14*(1:200)
sigs=sqrt(0.13*(1:200))
tru=exp(2*mus+2*sigs^2)
for (t in 1:200){
x=rnorm(1e5)
moy1[t]=mean(exp(2*sigs[t]*x+2*mus[t]))
moy2[t]=exp(2*mean(sigs[t]*x+mus[t])+2*var(sigs[t]*x+mus[t]))}

plot(moy1/tru,col="blue",ylab="relative mean",xlab="T",cex=.4,pch=19)
abline(h=1,col="orange")
lines((moy2/tru),col="green",cex=.4,pch=19)

সুতরাং ও বৃদ্ধি হিসাবে দ্বিতীয় অভিজ্ঞতাবাদী মুহুর্তের প্রকৃতপক্ষে একটি পতন ঘটেছে যা আমি দ্বিতীয় দ্বিতীয় অভিজ্ঞতাবাদী মুহুর্তের পরিবর্তনে in এবং বৃদ্ধি হিসাবে বিরাট বৃদ্ধিকে দায়ী করব ।μσμσ

এই অদ্ভুত ঘটনাটি আমার ব্যাখ্যা ছিল যে যখন হয়, অবশ্যই গড় হল , এটি একটি কেন্দ্রীয় মান নয়: আসলে মধ্যমা সমান। যেখানে হিসাবে এলোমেলো পরিবর্তনশীল উপস্থাপন করার সময় এটি স্পষ্ট যে, যখন বড় হয় যথেষ্ট, এলোমেলো পরিবর্তনশীল never প্রায় কখনও নয় । অন্য কথায় যদি হ'লE[X2]X2X2e2μX2exp{2μ+2σϵ}ϵN(0,1)σσϵσ2XLN(μ,σ)

P(X2>E[X2])=P(log{X2}>2μ+2σ2)=P(μ+σϵ>μ+σ2)=P(ϵ>σ)=1Φ(σ)
যা নির্বিচারে ছোট হতে পারে।

1
আমিও হতবাক। আমি ফলাফলগুলির (গণিত) সাথে একটি ন্যূনতম কোড যুক্ত করছি
ব্যবহারকারী 29918

ঠিক আছে. ধন্যবাদ! কিছু নম্বর রেখে, আমি এখন দেখছি যে আমার অপ্রত্যাশিত নমুনা আকারটি সত্যিই এই কাজের জন্য প্রস্তুত ছিল না!
ব্যবহারকারী 29918

2
@ ইউজার ২৯৯১৮: দুঃখিত, আমি নমুনার আকারটিকে সমস্যা হিসাবে দেখছি না বরং অনর্থক হওয়ার কারণ হিসাবে অনন্ত হয়ে ওঠার পরে লগ-নরমালটি খুব স্কিউল হয়ে যায় তা সত্য । σ
শি'আন

2
@ শি'য়ান ভাল জিনিস! । যা আমি সমীকরণগুলিতে ঠিক ক্যাপচার করেছিলাম (আমি বরং কল্পিতভাবে) কথায় কথায় প্রকাশ করার চেষ্টা করছিলাম যে , যেমন বাড়ছে, ততই সম্ভবত এটি বৃদ্ধি (এবং বৃহত , কিছুটা কাছেই) হয়ে উঠেছে যে পর্যবেক্ষণের গড় নীচে রয়েছে। প্রকৃতপক্ষে সম্ভাবনাটি এত বেশি যে সম্ভবত পুরো নমুনাটি গড়ের নীচে রয়েছে! P(X2>E[X2])=1Φ(σ)σσ
ম্যাথু গন

2
এই ধরণের অ্যাসিম্পটোটিক খুব কার্যকর নয় যে আনুমানিক সঠিকভাবে মুহুর্তগুলির জন্য প্রয়োজনীয় সিমুলেশনের সংখ্যা সহ দ্রুততরভাবে দ্রুত বৃদ্ধি পায় । σ
শি'আন

13

আমি ভেবেছিলাম যে আমি কিছু ডুমুর নিক্ষেপ করব যা দেখায় যে ব্যবহারকারী 29918 এবং শি'র প্লট দুটোই সামঞ্জস্যপূর্ণ। চিত্র 1 ব্যবহারকারী 29918 কী করেছে এবং চিত্র 2 (একই তথ্যের উপর ভিত্তি করে), শিয়ান তার চক্রান্তের জন্য যা করেছে তা করে। একই ফলাফল, বিভিন্ন উপস্থাপনা।

কী হচ্ছে যে টি বাড়ার সাথে সাথে বৈচিত্রগুলি বিশাল ধারণ করে এবং অনুমানকারী লোটোর টিকিট কিনে পাওয়ারবল লোটোর জনসংখ্যার গড় অনুমান করার চেষ্টা করার মতো হয়ে যায়! সময়ের একটি বড় শতাংশ, আপনি বেতনটিকে অবমূল্যায়ন করবেন (কারণ কোনও নমুনা পর্যবেক্ষণ জ্যাকপটকে আঘাত করে না) এবং সময়ের একটি ক্ষুদ্র শতাংশ, আপনি ব্যয়কে বহুল পরিমাণে মূল্যায়ন করবেন (কারণ নমুনায় একটি জ্যাকপট বিজয়ী রয়েছে)। নমুনা গড়টি একটি নিরপেক্ষ অনুমান তবে এটি হাজার এবং হাজার হাজার অঙ্কের সাথেও সুনির্দিষ্ট হওয়ার আশা করা যায় না! প্রকৃতপক্ষে, লোটোর জয়ের পক্ষে আরও শক্ত ও শক্ত হওয়ার সাথে সাথে, আপনার নমুনাটির অর্থ জনসংখ্যার নীচে হবে সময়ের বেশিরভাগ অংশ।1nixi2

আরও মন্তব্য:

  1. একটি নিরপেক্ষ অনুমানকারী মানে এই নয় যে অনুমানকারীটি কাছাকাছি থাকবে! নীল বিন্দুগুলি প্রত্যাশার কাছাকাছি হওয়া উচিত নয় । যেমন। এলোমেলোভাবে বেছে নেওয়া একটি পর্যবেক্ষণ জনসংখ্যার একটি নিরপেক্ষ অনুমান দেয় মানে, তবে সেই অনুমানকটি কাছাকাছি হওয়ার আশা করা যায় না।
  2. বৈকল্পিকটি একেবারে জ্যোতির্বিদ্যায় পরিণত হওয়ায় বিষয়টি সামনে আসছে। বৈকল্পিক যেমন ব্যাশহিট যায়, প্রথম পদ্ধতির অনুমানটি চালিত হচ্ছে কেবলমাত্র কয়েকটি পর্যবেক্ষণ। আপনি একটি অন্তঃসত্ত্বা, ক্ষুদ্র, অজানা সংখ্যক সংখ্যার ক্ষুদ্র, ক্ষুদ্র সম্ভাবনা থাকাও শুরু করুন ...
  3. এটি একটি স্বজ্ঞাত ব্যাখ্যা। শি'র আরও একটি আনুষ্ঠানিক বিকাশ রয়েছে। তার ফলাফল বোঝায় যে বড় হওয়ার সাথে সাথে এটি হাজার হাজার পর্যবেক্ষণের পরেও গড়ের উপরে কোনও পর্যবেক্ষণ আঁকতে অবিশ্বাস্যরকম সম্ভাবনা হয়ে যায় । আমার "লোটো জয়ের" ভাষাটি এমন একটি ইভেন্টকে নির্দেশ করে যেখানে । σ এক্স 2 > [P(X2>E[X2])=1Φ(σ)σX2>E[X2]এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.