আর এর জন্য হিস্টডেটা প্যাকেজে ( https://r-forge.r-project.org/R/?group_id=574 ) আমার কাছে লন্ডনে কলেরার প্রকোপের জন স্নো এর মানচিত্রের সাথে সম্পর্কিত ডেটা সেট রয়েছে, 1854। আমি বিশ্বাস করি তারা ওয়াল্টার টোবলারের তত্ত্বাবধানে সাবধানতার সাথে ডিজিটালাইজড হওয়ার পরে এটি অনুমোদিত। এই ডেটা সেটগুলির কিছু বিশদ জন ম্যাকেনজি দ্বারা http://www1.udel.edu/jhnmack/frec480/cholera/cholera2.html তে বর্ণিত হয়েছে ।
দুর্ভাগ্যক্রমে, মৃত্যু, পাম্প এবং রাস্তাগুলির স্থানাঙ্কগুলি একটি স্বেচ্ছাসেবী সমন্বয় ব্যবস্থা ব্যবহার করে, আর জিআইএস অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত মানচিত্রের সমন্বয় বা আর-তে স্থানীয় ম্যাপিং সফ্টওয়্যার নয় (স্থানিক প্যাকেজগুলি, জিজিএম্যাপ ইত্যাদি) not
ইন http://freakonometrics.hypotheses.org/19213 আর্থার Charpentier থেকে জন স্নো ডেটার একটি সংস্করণের সাথে ggmap ব্যবহার
http://www.rtwilson.com/downloads/SnowGIS_v2.zip । Cholera_Deaths.shp
ফাইল, যদিও কেবলমাত্র 489 মৃত্যু, 578 আমি লিপিবদ্ধ না তালিকাবদ্ধ করে HistData::Snow.deaths
।
একটি ধারণা হ'ল (x, y) স্থানাঙ্কের মাধ্যমিক এবং পুনরুদ্ধারের মাধ্যমগুলির মাধ্যম এবং মানক বিচ্যুতির মধ্যে সম্পর্কগুলি খুঁজে পাওয়া, তবে সম্ভবত এর থেকে আরও ভাল উপায় আছে কি?
আমি এ পর্যন্ত চেষ্টা করেছি এখানে
> data(Snow.deaths, package="HistData")
> D <- Snow.deaths[,2:3]
> colMeans(D)
x y
13.03312 11.69721
> var(D)
x y
x 3.8150987 0.3802654
y 0.3802654 2.7213828
কলেরা_ডিথস ফাইলটি পড়ুন
> folder <- "C:/Dropbox/R/data/Snow/SnowGIS_v2/SnowGIS"
> library(maptools)
> deaths <- readShapePoints(file.path(folder, "Cholera_Deaths"))
> head(deaths@coords)
coords.x1 coords.x2
0 529308.7 181031.4
1 529312.2 181025.2
2 529314.4 181020.3
3 529317.4 181014.3
4 529320.7 181007.9
5 529336.7 181006.0
> # deaths has only 250 observations; 489 deaths
> sum(deaths@data$Count)
[1] 489
> # try to relate to Snow.deaths
> X <- deaths@coords
> colnames(X) <- c("x", "y")
>
> XX <- data.frame(X, Freq=deaths@data$Count)
> XX <- vcdExtra::expand.dft(XX)
>
> colMeans(XX)
x y
529414.8 181031.9
> var(XX)
x y
x 10813.816 1521.693
y 1521.693 6227.924
>
ঠিক আছে, তারপরে আমি D
একই উপায় এবং মানক বিচ্যুতিগুলি আবার স্কেল করার চেষ্টা করি XX
, তবে এখানে কিছু সঠিকভাবে কাজ করে না - এর কলামটির অর্থগুলি এর Dscaled
সাথে সমান হওয়া উচিত XX
:
> # scale D to have the same means and standard deviations as XX
> Dscaled <- scale(D, center=TRUE, scale=TRUE)
> Dscaled <- scale(Dscaled, center=colMeans(XX), scale=sqrt(diag(var(XX))))
> colMeans(Dscaled)
x y
-5091.040 -2293.947
>
সম্পাদনা করুন: নতুন ফাংশন দ্বারা অঙ্কিত স্নোয়ের মানচিত্রটি SnowMap(axis.labels=TRUE)
এখন HistData
আর-ফোর্জে (রেভ ১০২) এর বিকাশ সংস্করণে দেখতে এটি সমস্যা হতে পারে । অক্ষ লেবেলগুলি নীচে বাম কোণে স্থানাঙ্ক ব্যবস্থার উত্স দেখায় যেহেতু তারা আমার ডেটা Snow.*
ডেটা সেটে রয়েছে।
Snow.*
ফাইলে স্থানাঙ্কগুলির রৈখিক রূপান্তরটি জিআইএস ভিত্তিক মানচিত্রে দুটি পাম্পের অবস্থানের সাথে বা তিনটি পাম্পের অবস্থানের সাথে সঠিকতা পরীক্ষা করতে পেরেছি obtain দুর্ভাগ্যক্রমে, SnowGIS
ফাইলগুলিতে পাম্পগুলির জন্য কোনও লেবেল নেই , এবং কীভাবে সেগুলি প্লট করা যায় তার কোনও উদাহরণ আমি দেখিনি যাতে আমি তাদের সাথে দৃশ্যত তুলনা করতে পারি।