জেমস-স্টেইন অনুমানকারী: এফ্রন এবং মরিস কীভাবে তাদের বেসবলের উদাহরণের জন্য সঙ্কোচন


18

ব্র্যাডলি এফ্রন এবং কার্ল মরিস রচিত "স্ট্যাটিস্টিকসে স্টেইনের প্যারাডক্স" দ্বারা 1977 এর বৈজ্ঞানিক আমেরিকান গবেষণাপত্রে জেমস-স্টেইন সঙ্কোচন ফ্যাক্টর গণনা করার বিষয়ে আমার একটি প্রশ্ন রয়েছে ।

আমি বেসবল খেলোয়াড়দের জন্য ডেটা সংগ্রহ করেছি এবং এটি নীচে দেওয়া হয়েছে:

Name, avg45, avgSeason    
Clemente, 0.400, 0.346    
Robinson, 0.378, 0.298    
Howard, 0.356, 0.276    
Johnstone, 0.333, 0.222    
Berry, 0.311, 0.273    
Spencer, 0.311, 0.270    
Kessinger, 0.289, 0.263    
Alvarado, 0.267, 0.210    
Santo, 0.244, 0.269    
Swoboda, 0.244, 0.230    
Unser, 0.222, 0.264    
Williams, 0.222, 0.256    
Scott, 0.222, 0.303    
Petrocelli, 0.222, 0.264    
Rodriguez, 0.222, 0.226    
Campaneris, 0.200, 0.285    
Munson, 0.178, 0.316    
Alvis, 0.156, 0.200

avg45ব্যাট হাতে পরে গড় 45এবং নিবন্ধে হিসাবে চিহ্নিত করা হয় yavgSeasontheতু গড়ের শেষ।

গড় ( ) এর জন্য জেমস-স্টেইন অনুমানকারী z = ˉ y + c ( y - ˉ y ) দ্বারা সংকোচনের কারণটি সি দিয়েছিলেন (বৈজ্ঞানিক আমেরিকান 1977 নিবন্ধের পৃষ্ঠা 5) সি = 1 - ( কে - 3 ) σ 2z

z=y¯+c(yy¯)
c
c=1(k3)σ2(yy¯)2,

যেখানে হল অজানা মাধ্যমের সংখ্যা। এখানে 18 জন খেলোয়াড় রয়েছে তাই কে = 18 । আমি মানগুলি ব্যবহার করে ( y - ˉ y ) 2 গণনা করতে পারি । তবে আমি কীভাবে 2 ডলার গণনা করতে জানি না । লেখকরা প্রদত্ত ডেটা সেটের জন্য সি = 0.212 বলে ।kk=18(yy¯)2avg45σ2c=0.212

আমি উভয় ব্যবহার করার চেষ্টা এবং σ 2 Y জন্য σ 2 কিন্তু তারা সঠিক উত্তর দিতে না = 0,212σx2σy2σ2c=0.212

এই ডেটা সেটটির জন্য কীভাবে গণনা করতে হবে তা আমাকে জানতে কেউ কি যথেষ্ট সদয় হতে পারেন ?σ2


1
আমি জানি এমএডি ( এন.ইউইকিপিডিয়া.আর / উইকি / মিডিয়ান_বসোলিউট_ডিভেশন ) ওয়েভলেট সঙ্কুচিত করার জন্য প্রচুর ব্যবহৃত হয়।
রবিন গিরার্ড

উত্তর:


19

প্যারামিটার হ'ল ভেক্টর উপাদানগুলির (অজানা) সাধারণ প্রকরণ, যার প্রতিটি আমরা ধরে নিই যে সাধারণত বিতরণ করা হয়। বেসবলের ডেটাগুলির জন্য আমাদের 45 Yib i n o m ( 45 , p i ) রয়েছে , সুতরাং দ্বিপদী বিতরণের স্বাভাবিক আনুমানিকতা দেয় ( ^ p i = Y i )σ245Yibinom(45,pi)pi^=Yi

p^inorm(mean=pi,var=pi(1pi)/45).

σ^2=p^(1p^)45,
p^
p^=11845i=11845Yi=Y¯.

আপনি নিম্নলিখিত আর কোড দিয়ে এটি পরীক্ষা করতে পারেন। এখানে ডেটা:

y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)

σ2

s2 <- mean(y)*(1 - mean(y))/45

σ^20.004332392

1 - 15*s2/(17*var(y))

c0.2123905k2k3


দুর্দান্ত ব্যাখ্যা, আমি দ্বিপদীটির স্বাভাবিক আনুমানিক পছন্দ করি।
চেম্বারলাইন ফঞ্চা

14

c=0.212

ইফ্রন, বি।, এবং মরিস, সি। (1975)। স্টেইনের অনুমানক এবং এর সাধারণীকরণ ব্যবহার করে ডেটা বিশ্লেষণ। আমেরিকান পরিসংখ্যান সমিতির জার্নাল, 70 (350), 311-319 (পিডিএফ-এর লিঙ্ক)

বা আরও বিশদ

ইফ্রন, বি।, এবং মরিস, সি। (1974)। স্টেইনের অনুমানক এবং এর সাধারণীকরণ ব্যবহার করে ডেটা বিশ্লেষণ। আর-1394-ওইও, দ্য র্যান্ড কর্পোরেশন, 1974 (পিডিএফ-এর লিঙ্ক)

পৃষ্ঠা ৩১২ এ, আপনি দেখতে পাবেন যে ইফ্রন এবং মরিস এই ডেটাগুলির একটি আর্ক-পাপ ট্রান্সফর্মেশন ব্যবহার করেছেন, যাতে ব্যাটিং গড়ের পরিবর্তনের পরিমাণ প্রায় একতাবদ্ধ হয়:

> dat <- read.table("data.txt", header=T, sep=",")
> yi  <- dat$avg45
> k   <- length(yi)
> yi  <- sqrt(45) * asin(2*yi-1)
> c   <- 1 - (k-3)*1 / sum((yi - mean(yi))^2)
> c
[1] 0.2091971

z

> zi  <- mean(yi) + c * (yi - mean(yi))
> round((sin(zi/sqrt(45)) + 1)/2,3) ### back-transformation
[1] 0.290 0.286 0.282 0.277 0.273 0.273 0.268 0.264 0.259
[10] 0.259 0.254 0.254 0.254 0.254 0.254 0.249 0.244 0.239

সুতরাং এটি স্টেইন অনুমানকারকের মান। ক্লেমেস্টের জন্য, আমরা .290 পেয়েছি, যা 1977 নিবন্ধ থেকে .294 এর খুব কাছাকাছি is

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.