মোরান এর আমি , স্থানিক autocorrelation একটি পরিমাপ একটি বিশেষভাবে শক্তসমর্থ পরিসংখ্যাত নয় (এটা স্থানিক ডেটা গুণাবলীর স্কিউ ডিস্ট্রিবিউশন সংবেদনশীল হতে পারে)।
স্থানিক স্বতঃসংশোধন পরিমাপের জন্য আরও কয়েকটি শক্ত কৌশল কী কী ? আমি আর এর মতো স্ক্রিপ্টিং ভাষায় সহজেই উপলভ্য / কার্যকরযোগ্য সমাধানগুলিতে বিশেষভাবে আগ্রহী। যদি সমাধান অনন্য পরিস্থিতিতে / ডেটা বিতরণের ক্ষেত্রে প্রয়োগ হয়, দয়া করে আপনার উত্তরে সেগুলি নির্দিষ্ট করুন।
সম্পাদনা : আমি কয়েকটি উদাহরণ দিয়ে প্রশ্নটি প্রসারিত করছি (মূল প্রশ্নের উত্তর / প্রতিক্রিয়াতে)
প্রস্তাব দেওয়া হয়েছে যে ক্রম ছাড়ানোর কৌশলগুলি (যেখানে মন্টে কার্লো পদ্ধতি ব্যবহার করে একটি মরানের আই স্যাম্পলিং বিতরণ উত্পন্ন হয়) একটি শক্ত সমাধান দেয় offers আমার বোধগম্যতা হল যে এই জাতীয় পরীক্ষাটি মুরানের আই বিতরণ সম্পর্কে কোনও অনুমান করার প্রয়োজনকে সরিয়ে দেয় (পরীক্ষার পরিসংখ্যানটি ডেটাসেটের স্থানিক কাঠামোর দ্বারা প্রভাবিত হতে পারে) তবে, আমি জানাতে ব্যর্থ হলাম যে অনুমতি ছাড়াই প্রযুক্তিটি কীভাবে অ-সাধারণভাবে সংশোধন করে ts বিতরণ বৈশিষ্ট্য ডেটা । আমি দুটি উদাহরণ দিচ্ছি: একটি যা স্থানীয় মুরানের আই পরিসংখ্যানগুলিতে স্কিউড ডেটার প্রভাব প্রদর্শন করে, অন্যটি গ্লোবাল মুরানের আই -– এমনকি ক্রমান্বয়ে পরীক্ষার অধীনে।
আমি জাং এট আল ব্যবহার করব । এর (২০০৮) প্রথম উদাহরণ হিসাবে বিশ্লেষণ করে। তাদের গবেষণাপত্রে তারা স্থানীয় মুরানের আইতে অনুক্রম পরীক্ষা (9999 সিমুলেশন) ব্যবহার করে ডেটা বিতরণের প্রভাব দেখায় । মূল তথ্য (বাম প্যানেল) এবং জিওডায় একই তথ্য (ডান প্যানেল) এর লগ রূপান্তর ব্যবহার করে আমি লিড (পিবি) ঘনত্বের জন্য 5% আত্মবিশ্বাসের স্তরের জন্য লেখকের হটস্পট ফলাফলগুলি পুনরুত্পাদন করেছি। আসল এবং লগ-রুপান্তরিত পিবি ঘনত্বের বক্সপ্লটগুলিও উপস্থাপন করা হয়। এখানে, ডেটা রূপান্তরিত হওয়ার সময় উল্লেখযোগ্য হট স্পটের সংখ্যা প্রায় দ্বিগুণ হয়; এই উদাহরণে শো স্থানীয় পরিসংখ্যাত যে হয় অ্যাট্রিবিউট তথ্য বিতরণ সংবেদনশীল - এমনকি মন্টে কার্লো কৌশল ব্যবহার করে!
দ্বিতীয় উদাহরণ (সিমুলেটেড ডেটা) স্কিউড ডেটা বিশ্ব মুরানের আইতে যে প্রভাব ফেলতে পারে তা প্রদর্শন করে , এমনকি ক্রমশক্তি পরীক্ষা ব্যবহার করার সময়ও। একটি উদাহরণ, ইন আর , অনুসরণ:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
পি-মানগুলির মধ্যে পার্থক্যটি নোট করুন। স্কিউড ডেটা ইঙ্গিত দেয় যে 5% তাত্পর্য স্তরে (পি = 0.167) কোনও ক্লাস্টারিং নেই তবে সাধারণত বিতরণ করা ডেটা ইঙ্গিত দেয় যে (পি = 0.013) রয়েছে।
চাওশেং ঝাং, লিন লুও, ওয়েলিন জু, ভ্যালেরি লেডভিথ, আয়ারল্যান্ডের গালওয়ের শহুরে মাটিতে পিবির দূষণ হটস্পটগুলি সনাক্ত করতে স্থানীয় মুরানের আই এবং জিআইএস ব্যবহার, মোট পরিবেশের বিজ্ঞান, খণ্ড 398, সংখ্যা 1–3, 15 জুলাই 2008 , পৃষ্ঠা 212-221