অভিজ্ঞতা অভিজ্ঞতা বিতরণ


13

খয়রাত:

সম্পূর্ণ অনুগ্রহ এমন কাউকে দেওয়া হবে যিনি নীচে অনুমানকারী uses ব্যবহার করে বা উল্লেখ করেছেন এমন কোনও প্রকাশিত কাগজের একটি রেফারেন্স সরবরাহ করে।F~

প্রেরণা:

এই বিভাগটি সম্ভবত আপনার পক্ষে গুরুত্বপূর্ণ নয় এবং আমি সন্দেহ করি এটি অনুগ্রহ পেতে আপনাকে সহায়তা করবে না, তবে যেহেতু কেউ অনুপ্রেরণা সম্পর্কে জিজ্ঞাসা করেছেন, আমি এখানে কী কাজ করছি তা এখানে's

আমি একটি পরিসংখ্যান গ্রাফ তত্ত্ব সমস্যা নিয়ে কাজ করছি। স্ট্যান্ডার্ড ঘন গ্রাফ সীমিতকরণ বস্তু এই অর্থে একটি প্রতিসম ফাংশন । একটি গ্রাফ স্যাম্পলিং ছেদচিহ্ন স্যাম্পলিং যেমন ভাবা যেতে পারে অভিন্ন মূল্যবোধ ইউনিট ব্যবধান উপর ( জন্য ) একজন প্রান্ত সম্ভাবনা এবং তারপর হয় । ফলে অন্তিক ম্যাট্রিক্স বলা যেতে যাক ।W:[0,1]2[0,1]W(u,v)=W(v,u)nnUii=1,,n(i,j)W(Ui,Uj)A

আমরা চিকিৎসা করতে পারে একটি ঘনত্ব যেমন ত যে \ iint ডব্লিউ> 0 । আমরা যদি অনুমান উপর ভিত্তি করে একটি কোনো সীমাবদ্ধতা ছাড়া , তাহলে আমরা একটি সামঞ্জস্যপূর্ণ অনুমান পেতে পারে না। ধারাবাহিকভাবে চ এর অনুমান সম্পর্কে একটি আকর্ষণীয় ফলাফল পেয়েছি যখন সম্ভাব্য ফাংশনের একটি সীমাবদ্ধ সেট থেকে আসে। এই অনুমানক এবং \ যোগফল থেকে , আমরা ডাব্লু অনুমান করতে পারি ।Wf=W/WW>0fAfffAW

দুর্ভাগ্যবশত, পদ্ধতি যে আমি যখন আমরা ঘনত্ব বন্টন থেকে নমুনা দেখায় দৃঢ়তা পাওয়া । পথ নির্মাণ করা হয় প্রয়োজন যে আমি পয়েন্ট একটি গ্রিড নমুনা (যেমন গ্রহণ উল্টোদিকে মূল থেকে স্বপক্ষে )। এই পরিসংখ্যান.এসই প্রশ্নে, আমি কী ঘটতে পারে তার 1 টি মাত্রিক (সরল) সমস্যার জন্য জিজ্ঞাসা করছি যখন আমরা কেবল সরাসরি বন্টন থেকে নমুনা না করে কেবল গ্রিডে নমুনা বার্নোলিসকেই নমুনা দিতে পারি।fAf

গ্রাফ সীমা জন্য রেফারেন্স:

এল। লোভাস এবং বি। ঘন গ্রাফ সিকোয়েন্সের সীমাবদ্ধতা ( আরক্সিভ )।

সি। বর্গস, জে চয়েস, এল। লোভাস, ভি। সোস এবং কে। ভেস্তেরগোম্বি। ঘন গ্রাফের রূপান্তরীয় ক্রম i: উপগ্রাফের ফ্রিকোয়েন্সি, মেট্রিক বৈশিষ্ট্য এবং পরীক্ষার। ( আর্কসিভ )

স্বরলিপি:

সিডিএফ সঙ্গে একটি একটানা বন্টন বিবেচনা এবং PDF যা ব্যবধান ইতিবাচক সমর্থন আছে । ধরুন কোন pointmass আছে, , সর্বত্র differentiable এবং এছাড়াও এর supremum হয় ব্যবধান উপর । যাক গড় যে দৈব চলক বন্টন থেকে নমুনা হয় । আইআইডি ইউনিফর্ম র্যান্ডম ভেরিয়েবল ।Ff[0,1]fFsupz[0,1]f(z)=c<f[0,1]XFXFUi[0,1]

সমস্যা সেট আপ:

প্রায়শই, আমরা দেওয়া যাবে ডিস্ট্রিবিউশনের সাথে র্যান্ডম ভেরিয়েবল হতে চলিত সঙ্গে এবং কাজের গবেষণামূলক বণ্টনের ফাংশনের যেমন যেখানে সূচক ফাংশন। দ্রষ্টব্য যে এই অভিজ্ঞতামূলক বিতরণ নিজেই এলোমেলো (যেখানে স্থির থাকে)।X1,,XnF

F^n(t)=1ni=1nI{Xit}
IF^n(t)t

দুর্ভাগ্যক্রমে, আমি সরাসরি থেকে নমুনা আঁকতে পারছি না । তবে, আমি জানি যে কেবলমাত্র এর ইতিবাচক সমর্থন রয়েছে এবং আমি এলোমেলো ভেরিয়েবলগুলি তৈরি করতে যেখানে সাফল্যের সম্ভাবনা সহ বার্নোলি বন্টন সহ একটি র্যান্ডম ভেরিয়েবল হয় যেখানে উপরে এবং সংজ্ঞায়িত করা হয়েছে। সুতরাং, । এই মানগুলি থেকে আমি অনুমান করার একটি স্পষ্ট উপায় কোথায়Ff[0,1]Y1,,YnYi

pi=f((i1+Ui)/n)/c
cUiYiBern(pi)FYi
F~n(t)=1i=1nYii=1tnYi
সিলিং ফাংশন (এটি কেবল নিকটতম পূর্ণসংখ্যা পর্যন্ত গোলাকার), এবং যদি (শূন্য দ্বারা বিভক্ত হওয়া এবং মহাবিশ্বের পতন এড়াতে) পুনরায় চিত্র তৈরি করা হয়) । মনে রাখবেন যে এলোমেলো পরিবর্তনশীল since এছাড়াও একটি এলোমেলো পরিবর্তনশীলi=1nYi=0F~(t)Yi

প্রশ্নাবলী:

সবচেয়ে কঠিন থেকে সহজ (যা আমি মনে করি) হওয়া সহজ।

  1. কেউ কি জানেন যে এই (বা অনুরূপ কিছু) এর একটি নাম আছে? আপনি কি এমন কোনও রেফারেন্স দিতে পারেন যেখানে আমি এর কয়েকটি বৈশিষ্ট্য দেখতে পারি?F~n

  2. হিসাবে হয় একটি সামঞ্জস্যপূর্ণ মূল্নির্ধারক (এবং আপনি এটি প্রমাণ করতে পারেন)?nF~n(t)F(t)

  3. হিসাবে সীমাবদ্ধ বিতরণ কী ?F~n(t)n

  4. আদর্শভাবে, আমি নিম্নলিখিতগুলি - এর ফাংশন হিসাবে আবদ্ধ করতে চাই eg যেমন, , তবে আমি জানি না সত্য কী। ঘোরা সম্ভাব্যতা বিগ হেnOP(log(n)/n)OP

supC[0,1]C|F~n(t)F(t)|dt

কিছু ধারণা এবং নোট:

  1. এটি অনেকটা গ্রিড ভিত্তিক স্তরের সাথে গ্রহণযোগ্যতা-প্রত্যাখ্যানের নমুনার মতো দেখায় । দ্রষ্টব্য যে এটি এর কারণ নয় কারণ সেখানে আমরা প্রস্তাবটি প্রত্যাখ্যান করলে আমরা আর একটি নমুনা আঁকিনা।

  2. আমি নিশ্চিত যে এই পক্ষপাতদুষ্ট। আমি মনে করি বিকল্প নিরপেক্ষ, তবে এতে অপ্রীতিকর সম্পত্তি রয়েছে যা ।F~n

    F~n(t)=cni=1tnYi
    P(F~(1)=1)<1
  3. আমি প্লাগ-ইন অনুমানকারী হিসাবে ব্যবহার করতে আগ্রহী । আমি এটি দরকারী তথ্য বলে মনে করি না, তবে এটি হতে পারে এমন কোনও কারণ সম্ভবত আপনি জানেন।F~n

আর এর উদাহরণ

আপনি যদি সাথে অভিজ্ঞতা অভিজ্ঞতা ভাগ করতে চান তবে কিছু আর কোড । দুঃখিত কিছু ইনডেন্টেশন ভুল ... আমি কীভাবে এটি ঠিক করব তা দেখছি না।F~n

# sample from a beta distribution with parameters a and b
a <- 4 # make this > 1 to get the mode right
b <- 1.1 # make this > 1 to get the mode right
qD <- function(x){qbeta(x, a, b)} # inverse
dD <- function(x){dbeta(x, a, b)} # density
pD <- function(x){pbeta(x, a, b)} # cdf
mD <- dbeta((a-1)/(a+b-2), a, b) # maximum value sup_z f(z)


# draw samples for the empirical distribution and \tilde{F}
draw <- function(n){ # n is the number of observations
  u <- sort(runif(n)) 
  x <- qD(u) # samples for empirical dist
  z <- 0 # keep track of how many y_i == 1
  # take bernoulli samples at the points s
  s <- seq(0,1-1/n,length=n) + runif(n,0,1/n) 
  p <- dD(s) # density at s
  while(z == 0){ # make sure we get at least one y_i == 1
    y <- rbinom(rep(1,n), 1, p/mD) # y_i that we sampled
    z <- sum(y)
  }
  result <- list(x=x, y=y, z=z)
  return(result)
}

sim <- function(simdat, n, w){
  # F hat -- empirical dist at w
  fh <- mean(simdat$x < w) 
  # F tilde
  ft <- sum(simdat$y[1:ceiling(n*w)])/simdat$z
  # Uncomment this if we want an unbiased estimate.
  # This can take on values > 1 which is undesirable for a cdf.
  ### ft <- sum(simdat$y[1:ceiling(n*w)]) * (mD / n)
  return(c(fh, ft))
}


set.seed(1) # for reproducibility

n <- 50 # number observations
w <- 0.5555 # some value to test this at (called t above)
reps <- 1000 # look at this many values of Fhat(w) and Ftilde(w)
# simulate this data
samps <- replicate(reps, sim(draw(n), n, w))

# compare the true value to the empirical means
pD(w) # the truth 
apply(samps, 1, mean) # sample mean of (Fhat(w), Ftilde(w))
apply(samps, 1, var)  # sample variance of (Fhat(w), Ftilde(w))
apply((samps - pD(w))^2, 1, mean) # variance around truth


# now lets look at what a single realization might look like
dat <- draw(n)
plot(NA, xlim=0:1, ylim=0:1, xlab="t", ylab="empirical cdf",
     main="comparing ECDF (red), Ftilde (blue), true CDF (black)")
s <- seq(0,1,length=1000)
lines(s, pD(s), lwd=3) # truth in black
abline(h=0:1)
lines(c(0,rep(dat$x,each=2),Inf),
     rep(seq(0,1,length=n+1),each=2),
     col="red")
lines(c(0,rep(which(dat$y==1)/n, each=2),1),
      rep(seq(0,1,length=dat$z+1),each=2),
      col="blue")

উপরের তথ্য থেকে আউটপুট

সম্পাদনাগুলি:

সম্পাদনা 1 -

আমি @ হুঁশিয়ার মন্তব্যগুলিকে সম্বোধন করতে এটি সম্পাদনা করেছি।

সম্পাদনা 2 -

আমি আর কোড যুক্ত করেছি এবং এটি আরও কিছুটা পরিষ্কার করেছি। আমি পঠনযোগ্যতার জন্য স্বরলিপিটি কিছুটা পরিবর্তন করেছি, তবে এটি মূলত একই। আমি অনুমতি পাওয়ার সাথে সাথে এটিতে একটি অনুগ্রহ দেওয়ার পরিকল্পনা করছি, সুতরাং আপনি আরও স্পষ্টতা চান কিনা দয়া করে আমাকে জানান।

সম্পাদনা 3 -

আমি মনে করি আমি @ কার্ডিনালের মন্তব্যগুলিকে সম্বোধন করেছি। আমি টাইপগুলি মোট ভ্যারিয়েশন স্থির করেছিলাম। আমি একটি অনুগ্রহ যোগ করছি।

সম্পাদনা 4 -

@ কার্ডিনাল এর জন্য একটি "অনুপ্রেরণা" বিভাগ যুক্ত করা হয়েছে।


1
আপনি অপরিজ্ঞাত অবজেক্টগুলিকে উল্লেখ করার মুহুর্তে এবং আপনার কিছু আইডিসিঙ্ক্র্যাটিক স্বরলিপি ব্যবহার করার জন্য আপনার প্রশ্নটি দ্ব্যর্থক হতে শুরু করেছে। উদাহরণস্বরূপ, প্রথম দিকে উপস্থিত হয় তবে সাথে এর কোন আপাত সংযোগ নেই এবং এটি কেবল আরও পড়ার মাধ্যমে আমরা শিখি যে আপনি এটি "একটি বিচ্ছিন্ন বিতরণ নয়" হিসাবে ভাবছেন - তবে এটি কোন ধরণের অবজেক্ট? গভীরভাবে, কি " মানে কি?" "সাধারণত এর অর্থ supremum কিন্তু হয়ত এটা একটা বিতরণের অপরিহার্য সমর্থনে কি কিছু আছে? কারণ প্রশ্নে সবকিছু এসব বলতে চাচ্ছি, আমি জানার জন্য না পারেন উপর নির্ভর করে প্রশ্নটিfFsupzf(z)sup
হুবহু

1
আপনার মন্তব্যের জন্য @ শুভ ধন্যবাদ যদি সংশোধিত প্রশ্নটি এখনও বিভ্রান্ত হয় তবে দয়া করে আমাকে জানান।
ব্যবহারকারী 1448319

1
আহা! এটিই আমি প্রথম ইঙ্গিত দিয়ে দেখেছি যে স্থির নয় এবং আপনি অ্যাসিম্পটোটিকগুলিতে আগ্রহী। যদি এটি সত্য হয় যে আপনি নির্বাচন করার নমনীয়তা রেখেছেন, তবে কি নমুনা পয়েন্টগুলির অভিযোজিত পছন্দগুলির (যেমন একটি নির্দিষ্ট গ্রিডে সীমাবদ্ধ করার পরিবর্তে ) সম্ভাবনার ধন খুলে যায় না ? এছাড়া স্পষ্ট আপনি unstated অনুমান, যেমন যে উপার্জন করা হয় একটানা আছে (equivalently, হয় একেবারে একটানা )। এই বিশ্লেষণে সহায়তা করতে পারে এমন অন্তর্নিহিত বিতরণ সম্পর্কে আপনি আর কী ধরে নিতে পারেন? nn{i/n}fFF
whuber

2
অন্য কোন প্রশ্ন / মন্তব্য কয়েক: এটা পরোক্ষভাবে কিভাবে আপনি কনস্ট্রাক্ট প্রস্তাব উপর ভিত্তি মনে যে আপনি কি সত্যিই একটি ত্রিকোণ অ্যারের বিবেচনা করা হয় , অভিসৃতি বিশ্লেষণ উদ্দেশ্যে। আপনি কীভাবে নির্মাণ করেন তা থেকে মনে হয় আপনার সাফল্যের শর্তসাপেক্ষ সম্ভাবনা সমেত বার্নুলি র্যান্ডম ভেরিয়েবল (ঠিক তত সহজেই) সক্ষম হওয়া উচিত যেখানে অভিন্ন র্যান্ডম ভেরিয়েবল। এটা কি সত্যি? (আপনার প্রশ্নের সামান্য আরও প্রসঙ্গ সম্ভবত এই প্রশ্নের অনেকগুলি সমাধান করবে)) চিয়ার্স। piYi,ni=1,,npif(U)/cU
কার্ডিনাল

2
এই প্রশ্নটি এত বেশি উন্নত হয়েছে যে আমি বুঝতে না পারছি যতক্ষণ না আমি মন্তব্যগুলি আগে দেখেছি। এটি এখন একটি সত্যিই আকর্ষণীয় এবং আরও অনেক ভাল-লিখিত প্রশ্ন।
গ্লেন_বি -রাইনস্টেট মনিকা

উত্তর:


1

যদিও এই রেফারেন্স

সম্পাদনা: অত্যন্ত সিলিল স্ট্যাটিকের সংশোধিত রেফারেন্স "অসম্পূর্ণ পর্যবেক্ষণ থেকে ননপ্যারমেট্রিক অনুমান" ই এল কাপালান এবং পল মিয়ার, আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল, খণ্ড। 53, নং 282 (জুন, 1958), পৃষ্ঠা 457-481

আপনার ইসিডিএফ-এর মতো অনুমানকারকের নয় তবে আমি বিশ্বাস করি যে এটি বেঁচে থাকা বিশ্লেষণে ব্যবহৃত কাপলান-মেয়ের অনুমানক (যেমন পণ্য সীমা নির্ধারণকারী) এর সমতুল্য, যদিও এটি একটি সময়সীমার ক্ষেত্রে প্রয়োগ করা হয় ।[0,1][0,)

কার্নেল স্মুথিংয়ের মাধ্যমে বিতরণ সম্পর্কে যদি যথাযথভাবে ভাল আচরণ করা হয় তবে (যেমন, উইকিপিডিয়ায় Khmaladze রূপান্তর ) এর বুনিয়াদ অনুমান করার পরে পক্ষপাতিত্ব অনুমান করা সম্ভব ।

আপনার গ্রাফ সমস্যা প্রাক্কলনে bivariate যদি থেকে যদিও একটি তুচ্ছ প্রতিসাম্য বাধ্যতা সঙ্গে জাঁ ডেভিড Fermanian, Dragan Radulovic এবং Marten Wegkamp (2004), এ পদ্ধতির অনুরূপ বলে মনে হয় গবেষণামূলক যোজক দুর্বল অভিসৃতি প্রক্রিয়া , বার্নোল্লি , খণ্ড 10, না। 5, 847–860, যেমন @ কার্ডিনাল "মাল্টিভারিয়েট ডেল্টা পদ্ধতি" নির্দেশ করে।f=W/WA


0

এটি উপরের 2 এবং 3 টি প্রশ্নের উত্তর দেয়। আমি এখনও সত্যই যদিও একটি রেফারেন্স চাই (প্রশ্ন 1 থেকে)।

যখন তখন এটি অ্যাকাউন্টে নেওয়া হয় না ।Yi=0

বিবেচনা করুন , তারপর সাবস্ক্রিপ্টগুলি ডেরাইভেটিভগুলি বোঝায় । পুনরায় স্মরণ করুন । আসুন যাক সুতরাং লক্ষ করুন যে এবং । এছাড়াও, g(A,B)=A/(A+B)

gA(A,B)=(A+B)1+A(A+B)2gB(A,B)=A(A+B)2gAA(A,B)=2B(A+B)3gAB(A,B)=(AB)(A+B)3gBB(B,B)=2A(A+B)3
pi=f((i1+Ui)/n)/c
R=1ni=1ntYi,μR=E(R)=0tp(u)du=c1F(t)S=1nnt+1nYi,μS=E(S)=t1p(u)du=c1(1F(t))
μR+μS=c1F(t)+c1(1F(t))=c1g(μR,μS)=F(t)
 Var(R)=1n2i=1nt Var(Yi)=1n0tf(u)/c(1f(u)/c)du=1nc20tf(u)(cf(u))du Var(S)=1nc2t1f(u)(cf(u))du
নোট করুন যে এস এর স্বাধীনতার দ্বারা । Cov(R,S)=0Yi

এখন, আমরা পেতে একটি টেলর সম্প্রসারণ ব্যবহার করি

E(F~n(t))=E(1i=1nYii=1tnYi)=E(nRnR+nS)=E(RR+S)=E(g(R,S))=g(μR,μS)+12E((RμR)2)gRR(μR,μS)+E((RμR)(SμS))gRS(μR,μS)+12E((SμS)2)gSS(μR,μS)+=F(t)+12E((RμR)2)2μS(μR+μS)3+E((RμR)(SμS))(μRμS)(μR+μS)3+12E((SμS)2)2μR(μR+μS)3+=F(t)+(μR+μS)3(E((RμR)2)μS+E((RμR)(SμS))(μRμS)+E((SμS)2)μR)+=F(t)+c3( Var(R)c(1F(t))+ Cov(R,S)(cF(t)c(1F(t)))+ Var(S)cF(t))+=F(t)+c4((1n0tf(u)(cf(u))du)(1F(t))+(1nt1f(u)(cf(u))du)F(t))+=F(t)+V~F(t)/n+=F(t)+O(n1)
যেখানে বিশেষত, আমরা পাই
V~F(t)=c2(0tf(u)(cf(u))du)(1F(t))+c2(t1f(u)(cf(u))du)F(t)<c2(0tcf(u)du)(1F(t))+c2(t1cf(u)du)F(t)<c32F(t)(1F(t))
n(F~n(t)F(t))dN(0,VF(t))

আপনি যদি এর সাথে কিছু ভুল দেখেন তবে মন্তব্য করুন।

সম্পাদনাগুলি:

সম্পাদনা 1 -

একটি ত্রুটি লক্ষ্য ফিক্সড । প্রশ্ন 4 সম্পর্কে মন্তব্যগুলিতে আপনার পরামর্শের জন্য @ কার্ডিনালকে ধন্যবাদ।VF(t)

সম্পাদনা 2 -

ফিক্সড প্রচুর পরিমাণে: আমার had যেখানে আমার অনেক জায়গায় হওয়া উচিত ছিল । আমার এখনও সম্পর্কে @ কার্ডিনালের প্রতিক্রিয়াটিকে ।c1cYi=0


1
প্রিয় @ ব্যবহারকারী: এটি সঠিক পথে রয়েছে; এখানে কিছু প্রস্তাবনা. ( 1 ) এর গড় বিদ্যমান নেই, যতক্ষণ না আপনি নির্দিষ্ট না হওয়া পর্যন্ত , সুতরাং উত্তরে বিশ্লেষণের সাথে কঠোরভাবে কথা বলা সঠিক নয়। শূন্যের সাথে আচরণটি নির্ধারণ করা স্বাধীনতার কাঠামোটিকে ভেঙে দেবে, তবে সমস্ত ক্ষতি হয় না। ( ) মূলত, আপনি যা করছেন তা হ'ল মাল্টিভিয়ারেট ডেল্টা পদ্ধতি প্রয়োগ করা। নোট করুন যে এর জন্য এর গড় অস্তিত্বের প্রয়োজন নেই , সুতরাং আপনি যদি এই পথে যান তবে এটি পরিষ্কার (এবং আরও সঠিক) হবে। F~n(t)iYi=0F~n(t)
কার্ডিনাল

2
( 3 ) আপনার তালিকার আইটেম 4 নিম্নলিখিত হিসাবে পরিচালনা করা হয়। নোট করুন যেডানদিকে প্রথম পদ, ,সুতরাং, স্পষ্টভাবে । আপনি কেবল মধ্যম মেয়াদকে মোকাবেলা করার জন্য রেখে গেছেন, তবে মার্কোভের অসমতার জেনসেনের পরে সহজেই হন এবং এটি ।
supC[0,1]C|F~F|sup[0,1]|F~F~|+01|F~EF~|+O(n1).
{iYi>0}|1cn1iYi|Op(n1/2)Op(n1/2)
কার্ডিনাল

প্রিয় বিবেচনা না করার বিষয়ে আপনার মন্তব্যটির আরও কিছু দেখতে সহায়ক হবে । আপনি যা বর্ণনা করছেন তা হচ্ছে শর্তযুক্ত নমুনা amp উপর শর্তাধীন হয় না স্বাধীন (অথবা শর্তসাপেক্ষে স্বাধীন), তাই উত্তর (অন্তর্নিহিত) বিশ্লেষণ না রাখা। এটি দেখতে দেখতে সহায়ক হতে পারে (কেবল টেবিলটি আঁকুন )। iYi=0Yi{iYi>0}n=22×2
কার্ডিনাল

অতিরিক্ত সরকারী হিসাবে, এটি লক্ষণীয় যে, তাই এই সংজ্ঞাটি সরল করা যায়। supCC|F~F|=01|F~F|
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.