মুরানের আই এর শক্তিশালী বিকল্প


19

মোরান এর আমি , স্থানিক autocorrelation একটি পরিমাপ একটি বিশেষভাবে শক্তসমর্থ পরিসংখ্যাত নয় (এটা স্থানিক ডেটা গুণাবলীর স্কিউ ডিস্ট্রিবিউশন সংবেদনশীল হতে পারে)।

স্থানিক স্বতঃসংশোধন পরিমাপের জন্য আরও কয়েকটি শক্ত কৌশল কী কী ? আমি আর এর মতো স্ক্রিপ্টিং ভাষায় সহজেই উপলভ্য / কার্যকরযোগ্য সমাধানগুলিতে বিশেষভাবে আগ্রহী। যদি সমাধান অনন্য পরিস্থিতিতে / ডেটা বিতরণের ক্ষেত্রে প্রয়োগ হয়, দয়া করে আপনার উত্তরে সেগুলি নির্দিষ্ট করুন।


সম্পাদনা : আমি কয়েকটি উদাহরণ দিয়ে প্রশ্নটি প্রসারিত করছি (মূল প্রশ্নের উত্তর / প্রতিক্রিয়াতে)

প্রস্তাব দেওয়া হয়েছে যে ক্রম ছাড়ানোর কৌশলগুলি (যেখানে মন্টে কার্লো পদ্ধতি ব্যবহার করে একটি মরানের আই স্যাম্পলিং বিতরণ উত্পন্ন হয়) একটি শক্ত সমাধান দেয় offers আমার বোধগম্যতা হল যে এই জাতীয় পরীক্ষাটি মুরানের আই বিতরণ সম্পর্কে কোনও অনুমান করার প্রয়োজনকে সরিয়ে দেয় (পরীক্ষার পরিসংখ্যানটি ডেটাসেটের স্থানিক কাঠামোর দ্বারা প্রভাবিত হতে পারে) তবে, আমি জানাতে ব্যর্থ হলাম যে অনুমতি ছাড়াই প্রযুক্তিটি কীভাবে অ-সাধারণভাবে সংশোধন করে ts বিতরণ বৈশিষ্ট্য ডেটা । আমি দুটি উদাহরণ দিচ্ছি: একটি যা স্থানীয় মুরানের আই পরিসংখ্যানগুলিতে স্কিউড ডেটার প্রভাব প্রদর্শন করে, অন্যটি গ্লোবাল মুরানের আই -– এমনকি ক্রমান্বয়ে পরীক্ষার অধীনে।

আমি জাং এট আল ব্যবহার করব এর (২০০৮) প্রথম উদাহরণ হিসাবে বিশ্লেষণ করে। তাদের গবেষণাপত্রে তারা স্থানীয় মুরানের আইতে অনুক্রম পরীক্ষা (9999 সিমুলেশন) ব্যবহার করে ডেটা বিতরণের প্রভাব দেখায় । মূল তথ্য (বাম প্যানেল) এবং জিওডায় একই তথ্য (ডান প্যানেল) এর লগ রূপান্তর ব্যবহার করে আমি লিড (পিবি) ঘনত্বের জন্য 5% আত্মবিশ্বাসের স্তরের জন্য লেখকের হটস্পট ফলাফলগুলি পুনরুত্পাদন করেছি। আসল এবং লগ-রুপান্তরিত পিবি ঘনত্বের বক্সপ্লটগুলিও উপস্থাপন করা হয়। এখানে, ডেটা রূপান্তরিত হওয়ার সময় উল্লেখযোগ্য হট স্পটের সংখ্যা প্রায় দ্বিগুণ হয়; এই উদাহরণে শো স্থানীয় পরিসংখ্যাত যে হয় অ্যাট্রিবিউট তথ্য বিতরণ সংবেদনশীল - এমনকি মন্টে কার্লো কৌশল ব্যবহার করে!

এখানে চিত্র বর্ণনা লিখুন

দ্বিতীয় উদাহরণ (সিমুলেটেড ডেটা) স্কিউড ডেটা বিশ্ব মুরানের আইতে যে প্রভাব ফেলতে পারে তা প্রদর্শন করে , এমনকি ক্রমশক্তি পরীক্ষা ব্যবহার করার সময়ও। একটি উদাহরণ, ইন আর , অনুসরণ:

library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n  <- length(NB)
set.seed(4956)
x.norm <- rnorm(n) 
rho    <- 0.3          # autoregressive parameter
W      <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value

পি-মানগুলির মধ্যে পার্থক্যটি নোট করুন। স্কিউড ডেটা ইঙ্গিত দেয় যে 5% তাত্পর্য স্তরে (পি = 0.167) কোনও ক্লাস্টারিং নেই তবে সাধারণত বিতরণ করা ডেটা ইঙ্গিত দেয় যে (পি = 0.013) রয়েছে।


চাওশেং ঝাং, লিন লুও, ওয়েলিন জু, ভ্যালেরি লেডভিথ, আয়ারল্যান্ডের গালওয়ের শহুরে মাটিতে পিবির দূষণ হটস্পটগুলি সনাক্ত করতে স্থানীয় মুরানের আই এবং জিআইএস ব্যবহার, মোট পরিবেশের বিজ্ঞান, খণ্ড 398, সংখ্যা 1–3, 15 জুলাই 2008 , পৃষ্ঠা 212-221


1
স্কিউ বিতরণে সংবেদনশীলতার জন্য আপনার কাছে কি কোনও উল্লেখ রয়েছে)? আপনি কি এলোমেলো স্থানিক বিতরণের গ্লোবাল পরীক্ষায় আগ্রহী বা স্থানীয় অস্বাভাবিক বৈশিষ্ট্যগুলি সনাক্ত করতে চান? আগ্রহের ফলাফলের বিতরণ কী হবে (ধনাত্মক গণনা পরিবর্তনশীল?)
অ্যান্ডি ডব্লিউ

1
অ্যান্ডিডাব্লু: ১) পরীক্ষার সংবেদনশীলতার একটি উল্লেখ হ'ল ফোর্টিন এবং ডেলের 'স্পেসিয়াল অ্যানালাইসিস, বাস্তুবিদদের গাইড' (পৃষ্ঠা 125), ২) আমি গ্লোবাল এবং স্থানীয় উভয় পরীক্ষার সমাধানে আগ্রহী, 3) আমার কোনও নির্দিষ্ট নেই মাথায় তথ্য বিতরণ।
ম্যানিজি

1
অ্যান্ডি, যেহেতু মরানের আই ভার্যতম বৈচিত্র এবং সমবায় অনুমানের উপর ভিত্তি করে, সুতরাং এটির অনুমানগুলির মতো বহিরাগতদের প্রতি একই সংবেদনশীলতা থাকবে, যা (যেমনটি সুপরিচিত) যথেষ্ট বিবেচ্য। এই অন্তর্দৃষ্টি মানির সমস্যার অনেকগুলি সম্ভাব্য সমাধানের পথও নির্দেশ করে : একটি শক্তিশালী ওজনের পারস্পরিক সম্পর্ক স্থাপনের জন্য আপনার প্রিয় প্রসারণ এবং সংস্থার অনুমানের শক্তিশালী সংস্করণগুলি প্রতিস্থাপন করুন এবং আপনি বন্ধ হয়ে চলেছেন।
whuber

1
দেখে মনে হচ্ছে আপনি @ অ্যান্ডি এখানে কয়েকটি ধারণাকে বিভ্রান্ত করছেন। প্রথমত, মানি স্বতঃসংশোধন পরিমাপ করতে চান ; অগত্যা তিনি হাইপোথিসিস পরীক্ষা নিচ্ছেন না। দ্বিতীয়ত, হাইপোথিসিস টেস্টিংয়ের প্রশ্নটি দৃust়তার চেয়ে শক্তির দিক থেকে সবচেয়ে ভাল ফ্রেম করা হয়। তবে (তৃতীয়) ধারণাগুলির একটি সংযোগ রয়েছে: একটি শক্তিশালী পরীক্ষার পরিসংখ্যানগুলি বিতরণযোগ্য অনুমানের বিধি লঙ্ঘনের (যেমন বহিরাগতদের দ্বারা দূষণ হিসাবে) বিস্তৃতভাবে তার ক্ষমতা বজায় রাখার প্রবণতা রাখে যেখানে একটি অ-শক্তিশালী পরীক্ষার পরিসংখ্যান বেশিরভাগ বা সমস্তটি হারাতে পারে এই পরিস্থিতিতে তার শক্তি।
হুড়হুড়ি করে

1
@ এফসি ৮৮, আমি গত বছর এই বিষয়টি পুনর্বিবেচনা করেছি এবং প্রস্তাবিত সমাধান লিখেছি । তবে এটি পরীক্ষা করা দরকার। আমি এখানে এক পর্যায়ে উত্তর হিসাবে সেই লেখার একটি (অনেক) হ্রাস করা সংস্করণ দেওয়ার পরিকল্পনা করছি। আমার যা আছে তা থেকে নিখরচায় আপনি কী পারবেন। তবে সাবধানতার সাথে ব্যবহার করুন!
ম্যানিজি

উত্তর:


2

(এটি একটি মন্তব্যে পরিণত করার জন্য এই মুহূর্তে খুব অযৌক্তিক)

এটি স্থানীয় এবং বৈশ্বিক পরীক্ষার ক্ষেত্রে (কোনও নির্দিষ্ট নয়, স্বতঃ-সম্পর্কের নমুনা স্বতন্ত্র পরিমাপ নয়)। আমি প্রশংসা করতে পারি যে নির্দিষ্ট মরানের আমি পরিমাপ করি তা পারস্পরিক সম্পর্কের পক্ষপাতদুষ্ট অনুমান (এটি পিয়ারসন পারস্পরিক সম্পর্ক সহগ হিসাবে একই পদে ব্যাখ্যা করা), আমি এখনও দেখতে পাই না যে ক্রমশক্তি অনুমানের পরীক্ষাটি ভেরিয়েবলের মূল বিতরণে সংবেদনশীল কী ( হয় টাইপ 1 পদে বা টাইপ 2 ত্রুটি)।

আপনি মন্তব্যে প্রদত্ত কোডটি সামান্যভাবে অভিযোজিত (স্থানিক ওজন colqueenঅনুপস্থিত);

library(spdep)
data(columbus)
attach(columbus)

colqueen <- nb2listw(col.gal.nb, style="W") #weights object was missing in original comment
MC1 <- moran.mc(PLUMB,colqueen,999)
MC2 <- moran.mc(log(PLUMB),colqueen,999)
par(mfrow = c(2,2))
hist(PLUMB, main = "Histogram PLUMB")
hist(log(PLUMB), main = "HISTOGRAM log(PLUMB)")
plot(MC1, main = "999 perm. PLUMB")
plot(MC2, main = "999 perm. log(PLUMB)")

যখন কেউ ক্রমবর্ধমান পরীক্ষা পরিচালনা করে (এই উদাহরণে, আমি এটিকে স্থানকে বিশৃঙ্খলা হিসাবে ভাবতে চাই) বৈশ্বিক স্থানিক অটো-পারস্পরিক সম্পর্কের অনুমানের পরীক্ষাটি ভেরিয়েবলের বিতরণ দ্বারা প্রভাবিত হওয়া উচিত নয়, কারণ সিমুলেটেড পরীক্ষার বিতরণ মূলত পরিবর্তিত হবে মূল ভেরিয়েবল বিতরণ সহ। সম্ভবত এটির আরও একটি আকর্ষণীয় সিমুলেশন উপস্থিত হতে পারে তবে আপনি এই উদাহরণে দেখতে পাচ্ছেন যে, পর্যবেক্ষণ করা পরীক্ষার পরিসংখ্যানগুলি মূল এবং লগড উভয়ের জন্য উত্পন্ন বিতরণের বাইরে খুব ভাল (যা একটি সাধারণ বিতরণের অনেক কাছাকাছি) । যদিও আপনি নাল শিফ্টের অধীনে লগড পিলেম্ব পরীক্ষা পরীক্ষা বিতরণ দেখতে পাচ্ছেন প্রায় 0 টি প্রতিসাম্যের কাছে।PLUMBPLUMB

এখানে চিত্র বর্ণনা লিখুন

আমি এটিকে যাইহোক বিকল্প হিসাবে পরামর্শ দিতে যাচ্ছিলাম, বিতরণটিকে প্রায় স্বাভাবিক হিসাবে রূপান্তরিত করে। আমি স্থানিক ফিল্টারিংয়ের জন্য উত্সগুলি অনুসন্ধান করার পরামর্শও দিতে যাচ্ছিলাম (এবং একইভাবে গেটিস-অর্ড স্থানীয় এবং বৈশ্বিক পরিসংখ্যান), যদিও আমি নিশ্চিত নই যে এটি কোনও স্কেল মুক্ত পরিমাপের ক্ষেত্রে সহায়তা করবে (তবে সম্ভবত অনুমানের পরীক্ষার জন্য ফলদায়ক হতে পারে) । আমি পরে আরও আগ্রহী সাহিত্য নিয়ে পোস্ট করব।


আপনার বিস্তারিত অ্যাকাউন্টের জন্য অ্যান্ডি ধন্যবাদ। যদি আমি আপনি সঠিকভাবে বুঝতে, আপনার ইঙ্গিত একটি বিন্যাস পরীক্ষা যে পরীক্ষার পরিসংখ্যান (মোরান এর আমি) পরিবর্তিত হবে না আপেক্ষিক ফলে এমসি বন্টন, কিন্তু এটা আমার পর্যবেক্ষণের সঙ্গে একমত না। উদাহরণস্বরূপ, যদি আমরা একই কলম্বাস ডেটাসেটে HOVAL ভেরিয়েবলটি ব্যবহার করি, ফলাফল এমসির মরানের I পরীক্ষার পি-মানটি 0.029 (মূল স্কিউড ডেটা সহ) থেকে 0.004 (লগ রূপান্তরিত ডেটা সহ) থেকে এমসির মধ্যে বিস্তৃত ব্যবধানকে নির্দেশ করে বিতরণ এবং পরীক্ষার পরিসংখ্যান - যদি আমরা 1% প্রান্তিক স্থাপন করে থাকি তবে তা তুচ্ছ নয়।
ম্যানিজি

1
হ্যাঁ আপনি আমার বক্তব্যটি সঠিকভাবে ব্যাখ্যা করছেন। ফলাফলগুলি পৃথক করে এমন কোনও নির্দিষ্ট রান অবশ্যই পাওয়া সম্ভব। বিভিন্ন পরিস্থিতিতে ত্রুটির হার সমান কিনা তা প্রশ্ন হয়ে ওঠে।
অ্যান্ডি ডাব্লু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.