ভারী লেজ বিতরণ প্রক্রিয়া উল্লেখযোগ্যভাবে উন্নত হয়েছে কিনা তা নির্ধারণ করুন


12

পরিবর্তনের মাধ্যমে প্রক্রিয়াটি উন্নত হয়েছে কিনা তা জানতে, আমি পরিবর্তনের আগে এবং পরে কোনও প্রক্রিয়াজাতকরণের সময় পর্যবেক্ষণ করি। প্রক্রিয়াটির সময়টি হ্রাস করা হলে প্রক্রিয়াটি উন্নত হয়েছে। প্রক্রিয়াজাতকরণের সময় বিতরণ চর্বিযুক্ত, তাই গড়ের ভিত্তিতে তুলনা করা বুদ্ধিমানের নয়। পরিবর্তে আমি জানতে চাই যে পরিবর্তনের পরে কম প্রক্রিয়াকরণের সময়টি পর্যবেক্ষণের সম্ভাবনা উল্লেখযোগ্যভাবে 50% এর উপরে রয়েছে কিনা।

যাক পরিবর্তন এবং পরে প্রক্রিয়াকরণের সময় জন্য দৈব চলক হতে এক আগে। যদি উল্লেখযোগ্যভাবে উপরে তারপর আমি বলতে চাই প্রক্রিয়া উন্নত হয়েছে।XYP(X<Y)0.5

এখন আমি আছে পর্যবেক্ষণ এর এবং পর্যবেক্ষণ এর । পর্যবেক্ষিত সম্ভাবনা হয় ।nxiXmyjYP(X<Y)p^=1nmij1xi<yj

এবং পর্যবেক্ষণের সম্পর্কে আমি কী বলতে পারি ?P(X<Y)xiyj

উত্তর:


12

আপনার অনুমান দ্বারা বিভক্ত মান-হুইটনি পরিসংখ্যানের সমান (ধন্যবাদ, গ্লেন!), এবং তাই উইলকক্সন র‌্যাঙ্ক-যোগ পরিসংখ্যান (উইলকক্সন-মান-হুইটনি স্ট্যাটিস্টিক হিসাবেও পরিচিত ) এর সমতুল্য : , যেখানে নমুনা আকার (কোন সম্পর্ক অভিমানী।) আপনি তাই Wilcoxon পরীক্ষার / টেবিল ব্যবহার করতে পারেন সফ্টওয়্যার ও তাদের কাছে ফিরে রুপান্তর একটি আত্মবিশ্বাস অন্তর বা একটি মূল্য পেতে।p^UmnWW=U+n(n+1)2nyUp

আসুনm নমুনা আকার x , N = m+n । তারপরে, অ্যাসিপোটোটিকভাবে,

W=Wm(N+1)2mn(N+1)12N(0,1)

উত্স: হল্যান্ডার এবং ওল্ফ , ননপ্যারামেট্রিক স্ট্যাটিস্টিকাল মেথডস, মোটামুটি পি। 117, তবে সম্ভবত বেশিরভাগ ননপ্যারমেট্রিকের পরিসংখ্যানের বইগুলি আপনাকে সেখানে পেয়ে যাবে।


@ গ্লেন_বি - ধন্যবাদ, আমি উত্তরটি আপডেট করেছি। ভুলের কারণ সম্পর্কে আপনি সেখানে খুব উদার অনুমান করেছিলেন!
জবোম্যান

13

@jbowman এসটিমেটিং এর সমস্যার একটি (NICE) মান সমাধান প্রদান যা হিসাবে পরিচিত হয় স্ট্রেস-শক্তি মডেল।θ=P(X<Y)

এক্স এবং ওয়াই স্বতন্ত্র ক্ষেত্রে মামলার জন্য বাকলিজি এবং ousদৌস (২০০ 2006) তে আরেকটি ননপ্যারমেট্রিক বিকল্প প্রস্তাব করা হয়েছিল । এটি নীচে বর্ণিত হয়েছে।XY

সংজ্ঞা দ্বারা আমাদের এটি আছে

θ=P(X<Y)=FX(y)fY(y)dy,

যেখানে এর সিডিএফ হয় এক্স এবং ওয়াই ঘনত্ব হয় ওয়াই । তারপর, নমুনা ব্যবহার এক্স এবং ওয়াই আমরা পেতে পারেন কার্নেল estimators এর এফ এক্স এবং ওয়াই এবং পরিণামে এবং মূল্নির্ধারক θFXXfYYXYFXfYθ

θ^=F^X(y)f^Y(y)dy.

এটি গাউসীয় কার্নেল ব্যবহার করে নিম্নলিখিত আর কোডে প্রয়োগ করা হয়েছে।

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

জন্য একটি আত্মবিশ্বাসের ব্যবধান পাওয়ার জন্য আপনি নীচে এই অনুমানকারীর বুটস্ট্র্যাপ নমুনা পেতে পারেন ।θ

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

অন্যান্য ধরণের বুটস্ট্র্যাপ অন্তরগুলিও বিবেচনা করা যেতে পারে।


2
আকর্ষণীয় এবং একটি ভাল কাগজ রেফারেন্স (+1)। আমি আমার পুস্তকে এটি যুক্ত করব!
jboman

0

XiYiP(XiYi<0)=pI{XiYi<0}i=1,2,..,nXXi<Yin p=P(XiYi<0)X/n


2
মাইকেল, এই জুটির ভিত্তি কী?
whuber

ওপি বলেছিল যে "পরিবর্তনের পরে প্রসেসিং সময়ের জন্য এক্সকে র্যান্ডম ভেরিয়েবল হতে দাও এবং ওয়াই এর আগে একটি" তাই শিওর হস্তক্ষেপের পরে এবং ইয়ে এর আগে।
মাইকেল আর চেরনিক

m=nXiYj

1
তুমি ঠিক বলছো. আমি অনুমান করি যে উপরের জাবোম্যান দ্বারা প্রস্তাবিত উইলকক্সন যেমন দুটি নমুনা পরীক্ষা যথাযথ হবে। এটি আকর্ষণীয় যে ম্যান-হুইটনি ফর্ম ওগ পরীক্ষাটি Xis এর সংখ্যা গণনা করে <Yjs।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.