উদ্দীপনা সম্পর্কিত প্রত্যাশিত মান


12

আমরা আঁকা নমুনা আকার প্রতিটি একটি সাধারন থেকে স্বাধীনভাবে বন্টন।এন ( μ , σ 2 )Nn(μ,σ2)

থেকে নমুনা আমরা কি তবে 2 নমুনা যা সর্বোচ্চ (পূর্ণ) পিয়ারসন একে অপরের সাথে পারস্পরিক সম্পর্ক আছে চয়ন।N

এই পারস্পরিক সম্পর্কের প্রত্যাশিত মান কী?

ধন্যবাদ [পিএস এটি হোমওয়ার্ক নয়]


2
(+1) এটি মোটামুটি চ্যালেঞ্জিং হোমওয়ার্ক প্রশ্ন করবে :-)। আপনার কি সাধারণ উত্তর প্রয়োজন বা আপনি (সম্ভবত) বা এর নির্দিষ্ট মানগুলির প্রতি আপনার দৃষ্টি নিবদ্ধ করতে পারেন ? উদাহরণস্বরূপ, এটা ভালো অনুমান বিকাশ যখন সম্ভব হতে পারে চেয়ে অনেক বড় ; অন্যান্য ক্ষেত্রে বিভিন্ন অনুমানের প্রয়োজন হবে। এন এন এনNnnN
শুক্র

1
আমি একটি সাধারণ উত্তরের জন্য আশা করছি, তবে একটি যেখানে অনুমান ঠিক হবে! এবং এর নির্দিষ্ট মানগুলির জন্য , এটি এত আকর্ষণীয় হবে না, যেমন আমি সিমুলেশন (যেমন আমি এই মুহুর্তে করছি) এর মাধ্যমে নির্দিষ্ট ক্ষেত্রে দেখতে পারি তবে এটি এখনও আগ্রহী হতে পারে। এন এনn>>NNn
পি সেল্লাজ

1
আমি মনে করি যে কোনও বাস্তব উপযোগিতার একটি সাধারণ সমাধান সম্ভবত অসম্ভব, যদিও আমার ভুল হতে পারে। এটি জ্যামিতি এবং লিনিয়ার বীজগণিতের ইন্টারফেসে কিছু উন্মুক্ত সমস্যার সাথে নিবিড়ভাবে সম্পর্কিত। অ্যাপ্লিকেশনগুলিতে, এই জাতীয় পরিমাণগুলির উপর তথ্যের প্রয়োজনীয়তা দেখা দেয়, উদাহরণস্বরূপ, সংকোচিত সংবেদনে।
কার্ডিনাল

1
FWIW, এই একটি সিমুলেশন আমি শুধু চলমান হয়েছে ফল: সাধারন (0,1) ব্যবহার করে, আমি দেখেছি যে গড় পারস্পরিক সম্পর্ক, (1000 সিমিউলেশন), এবং নমুনার সংখ্যা প্রায় দ্বারা সম্পর্কিত হয় জন্য এবং লিনিয়ার রিগ্রেশন মডেল ব্যবহার করে। মডেল ফিট এবং স্বাভাবিক ডায়াগোনস্টিক্স বেশ ভাল ছিল। আমি এটিও দেখতে পেয়েছি যে গড় পারস্পরিক সম্পর্ক প্রায় স্বাভাবিকভাবেই বিতরণ করা হয়েছিল (যদিও সামান্য ডান-স্কু)। N ρ = 0.025 + 0.113 ln ( N ) - 0.008 ln ( N ) 2 এন = 100 4 N nρN
ρ=0.025+0.113ln(N)0.008ln(N)2
n=1004Nn
পি সেলজ 23

উত্তর:


9

আমি নীচের নিবন্ধটি পেয়েছি, যা এই সমস্যার সমাধান করে: জিয়াং, তিফেং (2004)। নমুনা সহকারী ম্যাট্রিক্সের বৃহত্তম এন্ট্রিগুলির এ্যাসেম্পোটিক বিতরণ। ফলিত সম্ভাবনার অ্যানালস, 14 (2), 865-880

জিয়াং পরিসংখ্যানগুলির বিতরণ দেখায়যেখানে মধ্যে কোরিলেশন তম এবং তম দৈর্ঘ্যের র্যান্ডম ভেক্টর (সঙ্গে ), হয়ρ আমি জে আই জে এন আই জেLn=max1i<jN|ρij|ρijijnij

a = lim n n / N N n

limnPr[nLn24logn+log(log(n))y]=exp(1a28πexp(y/2)),
যেখানে কাগজে উপস্থিত রয়েছে এবং ফাংশন ।a=limnn/NNn

স্পষ্টতই এই ফলাফলটি পর্যাপ্ত সংখ্যক মুহুর্ত সহ কোনও বিতরণ বিতরণের জন্য রয়েছে ( সম্পাদনা করুন: নীচে নীচে @ কার্ডিনালের মন্তব্য দেখুন)। জিয়াং দেখায় যে এটি প্রকার 1 চূড়ান্ত মান বিতরণ। অবস্থান এবং স্কেল হয়

σ=2,μ=2log(1a28π).

প্রকার -২ ইভি বিতরণের প্রত্যাশিত মান হ'ল , যেখানে ইউলারের ধ্রুবকটিকে বোঝায়। যাইহোক, মন্তব্যে উল্লিখিত হিসাবে, বিতরণে রূপান্তরটি সীমিত বন্টনের ক্ষেত্রে মাধ্যমের একীকরণের গ্যারান্টি দেয় না এবং নিজেই।γμ+σγγ

যদি আমরা এই ক্ষেত্রে এই জাতীয় ফলাফল দেখাতে পারি, তবেএর asympotic প্রত্যাশিত মানহবেnLn24logn+log(log(n))

limnE[nLn24logn+log(log(n))]=2log(a28π)+2γ.

নোট করুন যে এটি বৃহত্তম স্কোয়ার পারস্পরিক সম্পর্কের asympotic প্রত্যাশিত মান দেবে, অন্যদিকে প্রশ্নটি সবচেয়ে বড় পরম সম্পর্কের প্রত্যাশিত মানের জন্য জিজ্ঞাসা করেছিল। সুতরাং সেখানে 100% নয়, তবে কাছাকাছি।

আমি কয়েকটি সংক্ষিপ্ত সিমুলেশন করলাম যা আমাকে একটি করে ভাবতে পরিচালিত করে 1) আমার সিমুলেশন (সমস্যা), 2) এর সাথে আমার ট্রান্সক্রিপশন / বীজগণিতের সমস্যা আছে (এছাড়াও সম্ভবত), বা 3) এর প্রায় অনুমানটি বৈধ নয় আমি এবং মান ব্যবহার করেছি। সম্ভবত ওপি এই সান্নিধ্যটি ব্যবহার করে কিছু সিমুলেশন ফলাফলের সাথে বিবেচনা করতে পারে?এনnN


2
এবং একপাশে: আমি এই প্রশ্নটি সত্যিই পছন্দ করেছি - আমি এই প্রশ্নটি সম্পর্কে আগেও ভাবছিলাম। আমি টাইপ -1 বিতরণের সংযোগ দেখে অবাক হয়েছি - আমি দেখতে পেয়েছি যে খুব সুন্দর। আমি কেবল ইচ্ছে করেই গণিতটি বুঝতে
পেরেছিলাম

1
(+1) ভাল লাগবে !! আমি মনে করি আমরা ধরে নিতে পারি যে এই এর ধনাত্মক বর্গমূল বৃহত্তম পরম পরস্পরের সম্পর্কের প্রত্যাশিত মানের সমান? প্রত্যাশার জন্য আপনার অভিব্যক্তিতে, আমরা কেবলমাত্র জন্য জড়িত সমস্ত অংশগুলি বের করতে পারি না : ? যাইহোক, আমি এটি আমার সিমুলেশনের সাথে তুলনা করেছি এবং এটি বেশ কাছাকাছি দেখাচ্ছে! আমার আর কোডটি সত্যিই Ln[ এল 2 এনn
E[Ln2]=1n{2log(N2n28π)+2γ+4lognlog(log(n))}
opালু

BTW, কাগজ এখানে থেকে সরাসরি পাওয়া যায় projecteuclid.org/DPubS/Repository/1.0/...
পি Sellaz

3
(+1) এটি একটি খুব সুন্দর কাগজ, এবং আমি কেবল এটি স্কিম করেছিলাম, তবে আমাদের এখানে একটু যত্নবান হওয়া দরকার । কিছু মন্তব্য: ( ) ফলাফলগুলি , সুতরাং ভেক্টরগুলির মাত্রা এই ফলাফলগুলির জন্য বিবেচনায় থাকা ভেক্টর সংখ্যার সাথে আনুপাতিকভাবে আনুপাতিকভাবে বাড়তে হবে ধরে রাখা. ( ) এমনকি এই ক্ষেত্রেও ফলাফলগুলি "কোনও" বিতরণের জন্য থাকে না; প্রকৃতপক্ষে, কাগজের শর্তগুলির জন্য র্যান্ডম ভেরিয়েবলগুলি "প্রায় তাত্পর্যপূর্ণভাবে আবদ্ধ" হওয়া উচিত যাতে আমাদের মূলত 30 তম মুহূর্তটি সীমাবদ্ধ হওয়ার প্রয়োজন হয়! (অবিরত)n/pγ(0,)
কার্ডিনাল

3
(চলছে।) ( 3 ) কনভার্জেন্স বিতরণে করে না সীমিত বন্টন যে উপায়ে গ্যারান্টি অভিসৃতি। যে জন্য, আমরা স্বাভাবিকভাবে সেটের অভিন্ন integrability সদৃশ কিছু ব্যবহার । এটি কাগজে প্রদর্শিত হয়নি এবং যেহেতু চূড়ান্ত-মূল্য বিতরণ নিয়ে কাজ করা ঠিক তত সত্য নয়। আমার এই ঘটনার প্রিয় উদাহরণগুলির মধ্যে একটি এলোমেলো ভেরিয়েবলের ক্রম যা বিতরণকে রূপান্তরিত করে, তবে যে কোনও ধরণের ধ্রুবক ধ্রুবককে বেছে নিতে হতে পারে। χ 2 1{Ln}χ12
কার্ডিনাল

2

@Jmtroos দ্বারা প্রদত্ত উত্তরের নীচে, নীচে আমার সিমুলেশনটির বিশদ বিবরণ এবং @ জেএমট্রোসের জিয়াং (2004) থেকে প্রত্যাশার প্রাপ্তির সাথে তুলনা করা হয়েছে:

E[Ln2]=1n{2log(N2n28π)+2γ+4lognlog(log(n))}

এই প্রত্যাশার মানগুলি ছোট এর সিমুলেটেড মানগুলির থেকে উপরে এবং বড় নীচে বলে মনে হয় এবং বৃদ্ধি পাওয়ায় এগুলি কিছুটা বিভক্ত হতে দেখা যায় । যাইহোক, ক্রম বৃদ্ধি করার জন্য পার্থক্য হ্রাস পায় , যেমনটি আমরা কাগজ হিসাবে প্রত্যাশা করব যে বিতরণটি asyptotic otic আমি বিভিন্ন tried চেষ্টা করেছি । নীচের সিমুলেশনটি ব্যবহার করে । আমি আর তে বেশ নতুন, তাই আমার কোড আরও ভাল করার জন্য যে কোনও ইঙ্গিত বা পরামর্শকে আন্তরিকভাবে স্বাগত জানানো হবে।এন এন এন এন [ 100 , 500 ] এন = 200NNNnn[100,500]n=200

set.seed(1)

ns <- 500
# number of simulations for each N

n <- 200
# length of each vector

mu <- 0
sigma <- 1
# parameters for the distribution we simulate from

par(mfrow=c(5,5))
x<-trunc(seq(from=5,to=n, length=20))
#vector of Ns

y<-vector(mode = "numeric")
#vector to store the mean correlations

k<- 1
#index for y

for (N in x) {
# loop over a range of N

    dt <- matrix(nrow=n,ncol=N)

    J <- vector(mode = "numeric")
    # vector to store the simulated largest absolute 
    # correlations for each N

    for (j in 1:ns) {
    # for each N, simulated ns times    

      for (i in 1:N) {
        dt[,i] <- rnorm(n,mu,sigma)
      }
      # perform the simulation

      M<-matrix(cor(dt),nrow=N,ncol=N)
      m <- M
      diag(m) <- NA
      J[j] <- max(abs(m), na.rm=TRUE)   
      # obtain the largest absolute correlation
      # these 3 lines came from stackoverflow
  }

    hist(J,main=paste("N=",N, " n=",n, " N(0,1)", "\nmean=",round(J[j],4))) 
    y[k]<-mean(J)
    k=k+1
}

lm1 <- lm(y~log(x))
summary(lm1)

logx_sq=log(x)^2
lm2<-lm(y~log(x)+logx_sq)
summary(lm2)
# linear models for these simulations

# Jiang 2004 paper, computation:

gamma = 0.5772
yy <- vector(mode = "numeric")
yy <- sqrt((2*log((x^2)/(sqrt(8*pi)*n^2)) + 2*gamma-(-4*log(n)+log(log(n))))/n)


plot(x,yy)
# plot the simulated correlations
points(x,y,col='red')
# add the points using the expectation

অন্যান্য উত্তরে আমার মন্তব্যগুলি দেখুন, যা আপনার উল্লেখযোগ্য কিছু বৈষম্য ব্যাখ্যা করতে (বা নাও) সহায়তা করতে পারে।
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.