স্থানিক রেখার নিদর্শনগুলির জন্য পরিসংখ্যান পরীক্ষা?


32

স্থানিক পয়েন্ট নিদর্শনগুলির জন্য প্রচুর পরীক্ষা রয়েছে যা পয়েন্টগুলি এলোমেলোভাবে বিতরণ করা হয় কিনা তা নির্ধারণ করতে ব্যবহার করা যেতে পারে তবে স্থানিক রেখার নিদর্শনগুলির জন্য কি কোনও প্রতিষ্ঠিত পরীক্ষা রয়েছে? (আমি কেবল সূচনা এবং শেষ পয়েন্ট এবং কোনও মধ্যবর্তী নোডের সাথে সোজা লাইনগুলি চিন্তা করছি thinking)

আমি যে ডেটা বিশ্লেষণ করতে চাই তা হ'ল মানব ও প্রাণী চলাচলের ওডি (উত্স-গন্তব্য) লাইন। ( ক্লাস্টারিং পুনঃনির্দেশিত লাইনের উদাহরণের মতো ))

এখনও অবধি, একটি ধারণা 4D পয়েন্টের মতো লাইনগুলি চিকিত্সা করা এবং পয়েন্ট প্যাটার্ন টেস্ট ব্যবহার করা ছিল তবে এটি যথাযথ হলে আমি অনিশ্চিত।

আদর্শ পরীক্ষা লাইনগুলির গুচ্ছ আছে কিনা তা নির্ধারণ করা সম্ভব করবে।

সহজাতভাবে, আমি বলব যে অনেকগুলি লাইন একই উত্স থেকে শুরু হয় তবে সমস্ত ধরণের বিভিন্ন গন্তব্য রয়েছে, এটি একটি ক্লাস্টার হিসাবে বিবেচনা করা উচিত নয়। অন্যদিকে, অনেকগুলি লাইন যা দীর্ঘ সময়ের জন্য সমান্তরালভাবে চলে (খুব কাছাকাছি) একটি ক্লাস্টার হবে। এখানে চিত্র বর্ণনা লিখুন


কি আপনার আচরণ হওয়া উচিত যদি এক লাইন অন্য লাইন কিন্তু 1 থেকে সমান্তরাল) প্রথম লাইন বা 2) "পর্যন্ত" দূরে প্রথম লাইন দিক চেয়ে অনেক খাটো
radouxju

যাদের ক্ষেত্রে @radouxju, আমি তারা একই ক্লাস্টারের অন্তর্গত না বলতে চাই
underdark

উত্তর:


17

এটি একটি কঠিন প্রশ্ন, যেমন লাইন বৈশিষ্ট্যগুলির জন্য স্থানিক প্রক্রিয়া পরিসংখ্যানগুলি বিকাশমান কেবলমাত্র অনেকগুলিই হয়নি। সমীকরণ এবং কোডগুলিতে গুরুত্ব সহকারে খনন না করে পয়েন্ট প্রক্রিয়া পরিসংখ্যানগুলি লিনিয়ার বৈশিষ্ট্যগুলির জন্য সহজেই প্রযোজ্য নয় এবং সুতরাং পরিসংখ্যানগতভাবে অবৈধ। এটি কারণ যে নাল, যে প্রদত্ত প্যাটার্নটির বিরুদ্ধে পরীক্ষা করা হয় তা বিন্দু ইভেন্টের ভিত্তিতে হয় এবং এলোমেলো ক্ষেত্রে লিনিয়ার নির্ভরতা নয়। আমার বলতে হবে যে নুলটি তীব্রতা এবং বিন্যাস / অভিমুখীকরণ আরও জটিল হবে তবে আমি কী জানি না।

আমি এখানে কেবল থুতু-বল করছি তবে, আমি ভাবছি যদি ইউক্লিডিয়ান দূরত্বের সাথে লাইন ঘনত্বের মাল্টি-স্কেল মূল্যায়ন (বা লাইনগুলি জটিল হয় তবে হাউসডর্ফ দূরত্ব) ক্লাস্টারিংয়ের একটানা পরিমাপকে নির্দেশ করে না। এই ডেটাটি লাইন ভেক্টরগুলির সংক্ষিপ্তসার হিসাবে, দৈর্ঘ্যের বৈষম্যের জন্য অ্যাকাউন্টে বৈকল্পিক ব্যবহার করে (থমাস 2011), এবং কে-মানেগুলির মতো একটি পরিসংখ্যান ব্যবহার করে একটি ক্লাস্টারের মান নির্ধারণ করা হয়েছিল। আমি জানি যে আপনি নির্ধারিত ক্লাস্টারের পরে নন তবে ক্লাস্টার মান ক্লাস্টারিংয়ের ডিগ্রি বিভাজন করতে পারে। এটি অবশ্যই স্পষ্টতই কে এর সর্বোত্তম ফিট দরকার, স্বেচ্ছাসেবী ক্লাস্টার নির্ধারিত হয় না। আমি ভাবছি যে গ্রাফ তাত্ত্বিক মডেলগুলিতে প্রান্ত কাঠামোটি মূল্যায়নের ক্ষেত্রে এটি একটি আকর্ষণীয় পন্থা হবে।

এখানে আর এর একটি কাজের উদাহরণ, দুঃখিত, তবে এটি কিউজিসআইএসের উদাহরণ দেওয়ার চেয়ে দ্রুত এবং আরও পুনরুত্পাদনযোগ্য এবং এটি আমার আরামদায়ক অঞ্চলে বেশি :)

লাইব্রেরি যুক্ত করুন এবং স্পটস্যাট থেকে তামার পিএসপি অবজেক্টটি লাইন উদাহরণ হিসাবে ব্যবহার করুন

library(spatstat)
library(raster)
library(spatialEco)

data(copper)
l <- copper$Lines
l <- rotate.psp(l, pi/2)

মানযুক্ত 1 ম এবং 2 য় অর্ডার লাইনের ঘনত্ব গণনা করুন এবং তারপরে রাস্টার শ্রেণি অবজেক্টগুলিতে বাধ্য করুন

d1st <- density(l)
  d1st <- d1st / max(d1st)
  d1st <- raster(d1st)  
d2nd <- density(l, sigma = 2)
  d2nd <- d2nd / max(d2nd)
  d2nd <- raster(d2nd)  

1 ম এবং 2 য় অর্ডার ঘনত্বকে স্কেল-ইন্টিগ্রেটেড ঘনত্বকে মানিক করুন

d <- d1st + d2nd
d <- d / cellStats(d, stat='max')  

মানকৃত উল্টো ইউক্যালিডিয়ান দূরত্ব গণনা করুন এবং রাস্টার শ্রেণিতে বাধ্য করা

euclidean <- distmap(l)
euclidean <- euclidean / max(euclidean)
euclidean <- raster.invert(raster(euclidean))

রাস্টারগুলিতে ব্যবহারের জন্য স্পা স্পটাল লাইনস ডেটা ফ্রেম অবজেক্টকে স্প্রেস্ট্যাট পিএসপি কোরেস করুন

as.SpatialLines.psp <- local({
     ends2line <- function(x) Line(matrix(x, ncol=2, byrow=TRUE))
     munch <- function(z) { Lines(ends2line(as.numeric(z[1:4])), ID=z[5]) }
     convert <- function(x) {
        ends <- as.data.frame(x)[,1:4]
        ends[,5] <- row.names(ends)
        y <- apply(ends, 1, munch)
        SpatialLines(y)
     }
     convert
})
l <- as.SpatialLines.psp(l)
l <- SpatialLinesDataFrame(l, data.frame(ID=1:length(l)) )

প্লটের ফলাফল

par(mfrow=c(2,2))
  plot(d1st, main="1st order line density")
    plot(l, add=TRUE)
  plot(d2nd, main="2nd order line density")
    plot(l, add=TRUE) 
  plot(d, main="integrated line density")
    plot(l, add=TRUE)   
  plot(euclidean, main="euclidean distance")
    plot(l, add=TRUE) 

রাস্টার মানগুলি বের করুন এবং প্রতিটি লাইনের সাথে যুক্ত সারসংক্ষেপের পরিসংখ্যান গণনা করুন

l.dist <- extract(euclidean, l)
l.den <- extract(d, l)
l.stats <- data.frame(min.dist = unlist(lapply(l.dist, min)),
                      med.dist = unlist(lapply(l.dist, median)),
                      max.dist = unlist(lapply(l.dist, max)),
                      var.dist = unlist(lapply(l.dist, var)),
                      min.den = unlist(lapply(l.den, min)),
                      med.den = unlist(lapply(l.den, median)),
                      max.den = unlist(lapply(l.den, max)),
                      var.den = unlist(lapply(l.den, var)))

অনুকূল কে (ক্লাস্টারের সংখ্যা) মূল্যায়নের জন্য ক্লাস্টার সিলুয়েট মান ব্যবহার করুন, সর্বোত্তম.k ফাংশন সহ ক্লাস্টার মানগুলি লাইনগুলিতে নির্ধারণ করুন। তারপরে আমরা প্রতিটি ক্লাস্টারে রঙ এবং ঘনত্বের রাস্টারটির উপরে প্লট নির্ধারণ করতে পারি।

clust <- optimal.k(scale(l.stats), nk = 10, plot = TRUE)                      
  l@data <- data.frame(l@data, cluster = clust$clustering) 

kcol <- ifelse(clust$clustering == 1, "red", "blue")
plot(d)
  plot(l, col=kcol, add=TRUE)

ফলাফলের তীব্রতা এবং দূরত্ব এলোমেলো থেকে তাত্পর্যপূর্ণ হয় যদি এই মুহুর্তে কেউ পরীক্ষার জন্য লাইনের একটি এলোমেলোকরণ করতে পারে could আপনি আপনার লাইনগুলিকে এলোমেলোভাবে পুনরায় তৈরি করতে "rshift.psp" ফাংশনটি ব্যবহার করতে পারেন। আপনি কেবল সূচনা এবং স্টপ পয়েন্টগুলি এলোমেলো করে প্রতিটি লাইনে পুনরায় তৈরি করতে পারেন।

কেউ আশ্চর্য হয় যে "কি হবে" আপনি কেবলমাত্র সূত্রের সূত্রপাত এবং স্টপ পয়েন্টগুলির বিষয়ে অবিবাহিত বা ক্রস অ্যানালাইসিসের পরিসংখ্যান ব্যবহার করে একটি পয়েন্ট প্যাটার্ন বিশ্লেষণ করেছেন performed একটি অবিচ্ছিন্ন বিশ্লেষণে আপনি শুরু এবং স্টপ পয়েন্টগুলির ফলাফলগুলির সাথে তুলনা করবেন যাতে দুটি পয়েন্টের নিদর্শনগুলির মধ্যে ক্লাস্টারিংয়ের মধ্যে সামঞ্জস্যতা রয়েছে কিনা তা দেখুন। এটি কোনও এফ-টুপি, জি-টুপি বা রিপলে-কে-টুপি (চিহ্নযুক্ত পয়েন্ট প্রক্রিয়াগুলির জন্য) এর মাধ্যমে করা যেতে পারে। আরেকটি পদ্ধতির ক্রস বিশ্লেষণ (যেমন, ক্রস-কে) হবে যেখানে দুটি পয়েন্ট প্রক্রিয়াগুলি [স্টার্ট, স্টপ] হিসাবে চিহ্নিত করে একই সাথে পরীক্ষা করা হয়। এটি সূচনা এবং স্টপ পয়েন্টগুলির মধ্যে ক্লাস্টারিং প্রক্রিয়াতে দূরত্বের সম্পর্ককে নির্দেশ করবে। যাহোক, অন্তর্নিহিত তীব্রতা প্রক্রিয়াটির উপর স্থানিক নির্ভরতা (অস্তিত্বহীনতা) এই জাতীয় মডেলগুলিকে সংঘবদ্ধ করে তোলে এবং একটি ভিন্ন মডেলের প্রয়োজন হয় requ হাস্যকরভাবে, অজৈব প্রক্রিয়াটি একটি তীব্রতা ফাংশন ব্যবহার করে মডেল করা হয় যা ক্লাস্টারিংয়ের একটি পরিমাপ হিসাবে স্কেল-ইন্টিগ্রেটেড ঘনত্ব ব্যবহার করার ধারণাকে সমর্থন করে আমাদের পুরো বৃত্তটিকে ঘনত্বের দিকে ফিরিয়ে দেয়।

এখানে যদি একটি রেপলিজ কে (বেসাগস এল) কোনও চিহ্নচিহ্ন বিন্দু প্রক্রিয়াটি স্বতঃসংশ্লিষ্টকরণের জন্য কোনও লাইন বৈশিষ্ট্য বর্গের অবস্থানগুলি থামান, থামানোর জন্য পরিসংখ্যানগুলির একটি দ্রুত কাজের উদাহরণ। সর্বশেষ মডেলটি নামমাত্র চিহ্নিত চিহ্নিত প্রক্রিয়া হিসাবে স্টার্ট এবং স্টপ উভয়ই ব্যবহার করে ক্রস-কে।

library(spatstat)
  data(copper)
  l <- copper$Lines
  l <- rotate.psp(l, pi/2)

Lr <- function (...) {
 K <- Kest(...)
  nama <- colnames(K)
   K <- K[, !(nama %in% c("rip", "ls"))]
   L <- eval.fv(sqrt(K/pi)-bw)
  L <- rebadge.fv(L, substitute(L(r), NULL), "L")
 return(L)
}

### Ripley's K ( Besag L(r) ) for start locations
start <- endpoints.psp(l, which="first")
marks(start) <- factor("start")
W <- start$window
area <- area.owin(W)
lambda <- start$n / area
 ripley <- min(diff(W$xrange), diff(W$yrange))/4
   rlarge <- sqrt(1000/(pi * lambda))
     rmax <- min(rlarge, ripley)
( Lenv <- plot( envelope(start, fun="Lr", r=seq(0, rmax, by=1), nsim=199, nrank=5) ) )

### Ripley's K ( Besag L(r) ) for end locations
stop <- endpoints.psp(l, which="second")
  marks(stop) <- factor("stop")
W <- stop$window
area <- area.owin(W)
lambda <- stop$n / area
 ripley <- min(diff(W$xrange), diff(W$yrange))/4
   rlarge <- sqrt(1000/(pi * lambda))
     rmax <- min(rlarge, ripley)
( Lenv <- plot( envelope(start, fun="Lr", r=seq(0, rmax, by=1), nsim=199, nrank=5) ) )

### Ripley's Cross-K ( Besag L(r) ) for start/stop
sdata.ppp <- superimpose(start, stop)
( Lenv <- plot(envelope(sdata.ppp, fun="Kcross", r=bw, i="start", j="stop", nsim=199,nrank=5, 
                 transform=expression(sqrt(./pi)-bw), global=TRUE) ) )

রেফারেন্স

টমাস জেসিআর (২০১১) কে-মিনের উপর ভিত্তি করে একটি নতুন ক্লাস্টারিং অ্যালগরিদম প্রোটোটাইপ হিসাবে একটি লাইন বিভাগ ব্যবহার করে। ইন: সান মার্টিন সি।, কিম এসডাব্লু। (সংস্করণ) প্যাটার্ন স্বীকৃতি, চিত্র বিশ্লেষণ, কম্পিউটার দৃষ্টি এবং অ্যাপ্লিকেশনগুলিতে অগ্রগতি। সিআইআরপি ২০১১. কম্পিউটার বিজ্ঞানে বক্তৃতা নোট, খণ্ড 7042. স্প্রিন্জার, বার্লিন, হাইডেলবার্গ


14

আপনি ফ্র্যাচেট দূরত্বটি দেখতে চাইতে পারেন । অজগর বাস্তবায়ন সন্ধানের সাম্প্রতিক প্রশ্নের পরে আমি সম্প্রতি এটি সম্পর্কে সন্ধান করেছি।

লিনস্ট্রিংয়ের স্থানিক মিল খুঁজে পাওয়ার জন্য এটি একটি মেট্রিক । এটি হাউসডর্ফ দূরত্বের অনুরূপ ধারণা, বহুভুজের অনুরূপ পরিমাপের সমতুল্য, তবে দিকনির্দেশের অন্তর্বাসগুলির জন্য।

ফ্র্যাচেট দূরত্বটিকে একটি ট্র্যাজেক্টরিতে একটি কুকুরকে তার ট্র্যাকসোলজির সাথে দ্বিতীয় ট্র্যাজেক্টোরির সাথে সংযুক্ত করার জন্য ন্যূনতম দৈর্ঘ্য হিসাবে সংজ্ঞায়িত করা হয়, উভয়ই কখনই পিছনে অগ্রসর হয় না both

এই মেট্রিকের দুটি বক্ররেখার জন্য একটি ছোট মান থাকবে যা কাছাকাছি অবস্থিত, প্রায় সমান্তরাল, একইভাবে সারিবদ্ধ এবং একই দৈর্ঘ্যের সাথে।

যদিও এটি ক্লাস্টার সনাক্তকরণ অংশটির উত্তর দেয় না।

এখানে একটি বিস্তৃত উপস্থাপনা আছে । আপনার পরিস্থিতিটি বিভাগের 46-49-এ উল্লিখিত কিছু ব্যবহারের মতো বলে মনে হচ্ছে

এই মেট্রিকের অনেকগুলি ভূ-জেসোপ্যাটিয়াল ব্যবহার রয়েছে যেমন

  • জিন সিকোয়েন্সিংয়ে সাধারণ সাবপ্যাটার্নগুলি সনাক্ত করা
  • হস্তাক্ষর যাচাই
  • স্টক মূল্য ইতিহাসের মতো সময় সিরিজে পারস্পরিক সম্পর্কযুক্ত পিরিয়ডগুলি সনাক্ত করা

সুতরাং গ্রন্থপুস্তকগুলিতে প্রচুর কাগজপত্র এই বিষয়টিকে কভার করে, তাদের বেশিরভাগ ভূ-স্থানিক নয়। এছাড়াও এই গবেষণাগুলির বেশিরভাগই জিওপ্যাটিয়াল / জিওসিয়েন্সের চেয়ে এলগোরিদিমস / গণিত / কম্পিউটার বিজ্ঞানের আওতায় আসে এবং সে অনুযায়ী লক্ষ্য হয়।

তবে এই কাগজটি আশাব্যঞ্জক বলে মনে হচ্ছে: -

বুচিন, কে।, বুচিন, এম, এবং ওয়াং, ওয়াই (২০০৯)। ফ্র্যাচেট দূরত্বের মাধ্যমে আংশিক বক্রের মিলের জন্য সঠিক অ্যালগরিদম। বিচ্ছিন্ন অ্যালগরিদমের 20 তম এসিএম-সিয়াম সিম্পোজিয়ামের কার্যদিবসে, পৃষ্ঠা 645-654

অন্যান্য কাগজপত্রগুলির মধ্যে কিছু আপনি কী করছেন তার ইচ্ছার সাথে আরও ঘনিষ্ঠভাবে শোনায় - ক্লাস্টার সনাক্তকরণ এবং ক্লাস্টারগুলিতে ট্র্যাজেক্টরিগুলির বরাদ্দ - তবে সেগুলি সময় সিরিজের ডেটা বা অন্য-ভূ-স্থান সংক্রান্ত উদাহরণ ব্যবহার করে চিত্রিত করা হয়েছে। তবে তারা আকর্ষণীয় দিক নির্দেশ করতে পারে।


2
আমি ভাবব ইউক্লিডিয়ান দূরত্বের পরিবর্তে ফ্রেঞ্চ বা হাউসডর্ফ দূরত্ব ব্যবহার করে ন্যূনতম-সংযোগ (বা ডিবিএসসিএন) ক্লাস্টারিং একটি দুর্দান্ত সমাধান হবে।
ডাবস্টন

আমি ভালবাসি যে ফ্রেঞ্চের দূরত্ব বিদ্যমান এবং আমি উপস্থাপনাটি "জেলিবেঁস" এবং "বেলিব্যাটন" এর সাথে তুলনা করি।
ফেজার

5

আমি এখানে বর্ণিত মত অনুরূপ ব্যবহার করার পরামর্শ দিচ্ছি ।

অ্যালগরিথ এবং নামকরণ:

ক) নাম লাইন স্তর NODES। গণনা বিয়ারিংস

খ) স্থানিকভাবে দূরত্ব সহনশীলতা ব্যবহার করে নিজেকে (একের কাছে) যোগ দিন। নাম স্তর লিঙ্ক

গ) লিঙ্কগুলি থেকে সরানো নিজের সাথে যুক্ত হয়, অর্থাৎ NAME = NAME_1

d) লিঙ্কের অভ্যন্তরে "একই" দিকের জোড়া খুঁজে পান find আমি ব্যবহার করতাম:

def theSame(aList,tol):
    maxB=max(aList);minB=min(aList)
    if abs(maxB-minB)<tol:return 1
    if abs(maxB-minB-180)<tol:return 1
    return 0
#-----------
theSame( [!BEARING!, !BEARING_1!],15)

অর্থাৎ অনুমান করা রেখাগুলি দিকের দিক দিয়ে একই রকম হচ্ছে

d) লিঙ্কগুলি থেকে অনুরূপ (0) জোড়া সরিয়ে ফেলুন।

ঙ) লিঙ্কের গণনা গোষ্ঠীগুলি NODES এর মাধ্যমে সংযুক্ত হয়েছে এবং গ্রুপ নম্বরগুলি NODES টেবিলে স্থানান্তর করবে:

এখানে চিত্র বর্ণনা লিখুন

দুর্ভাগ্যবশত:

এখানে চিত্র বর্ণনা লিখুন

তবে গ্রুপের মধ্যে বিয়ারিংয়ের সহজ পরিসংখ্যান, উদাহরণস্বরূপ এর মানক বিচ্যুতি:

abs(tan(bearing))

প্রথম ক্ষেত্রে কোনও বিচ্যুতি এবং দ্বিতীয়টিতে খুব বড় একটি দেখানো হয়নি। একইভাবে দৈর্ঘ্যের পরিসংখ্যান 'দীর্ঘ সময়ের জন্য সমান্তরালভাবে চলতে' সহায়তা করতে পারে।

যদি উপরে আগ্রহ থাকে তবে আমি লিপিগুলির সাথে সংযুক্ত গ্রুপগুলিকে গণনা করে এমন স্ক্রিপ্টের সাথে উত্তর আপডেট করতে পারি। এটি আরকি এবং নেটওয়ার্কএক্স মডিউল ব্যবহার করছে।

বিপরীত দিক থেকে একই পয়েন্ট থেকে যাওয়া জোড় জোড়গুলি কীভাবে আচরণ করবেন তা জানেন না ...


আমি স্ক্রিপ্টটি দেখতে আগ্রহী হব
বর্ণমালা

1
@ রিচার্ডল আমার সমাধানের প্রথম লাইনটিতে লিঙ্কটি অনুসরণ করুন এবং এটি দেখতে নীচে স্ক্রোল করুন। আমার কিছুটা ভাল পালিশ করা সংস্করণ রয়েছে তবে এটি করবে will যুক্তি অত্যন্ত সহজ: এতে লিঙ্ক এবং নোড ব্যবহার করে গ্রাফ তৈরি করুন ২. প্রথম নোড নিন এবং পূর্বপুরুষদের (গোষ্ঠী 0) 3) গ্রাফ থেকে নোডগুলি সরান এবং কোনও নোড না রেখে পুনরাবৃত্তি করুন। উচ্চ গুণমানের কাউন্সিলের / লিনজ ডেটাসেটের জন্য পাইপগুলির সংযোগ বিচ্ছিন্ন গোষ্ঠীগুলি (স্ট্রিম এবং যাই হোক না কেন) ইত্যাদি সন্ধান করতে আমি বারবার এটি ব্যবহার করি
ফেলিক্সআইপি

5

লাইনগুলির সংজ্ঞা নিয়ে আমার চোখে সমস্যা রয়েছে, এটি ব্যবহার করবে কী ব্যবহার করবে তা নির্ধারণ করবে (উপরে বর্ণিত কয়েকটি)। এগুলি যদি ওডি জোড়া হয়, এবং জ্যামিতি কোনও ভূমিকা না রাখে তবে আমি নেটওয়ার্ক ক্লাস্টারিংয়ের উপর ভিত্তি করে এটির কাছে যাব। আপনি বলছেন যে নেটওয়ার্কগুলি একটি নেটওয়ার্ক গঠন করে না - তাই তা হও, তবে সম্ভবত এটির উত্স এবং গন্তব্যগুলি অর্থবহ অঞ্চলে পড়ে এবং আপনি এটি একটি নেটওয়ার্ক হিসাবে বিবেচনা করতে পারেন।

জ্যামিতির যদি কিছু বলার থাকে (এগুলি, জিপিএস ট্রাজেক্টোরিগুলি বলুন এবং আপনি জ্যামিতিটি বিবেচনা করতে চান) এর চেয়ে আপনার সত্যিকার অর্থে কোনও (x, y, t) স্পেসে কাজ করতে হবে - আন্দোলনের পদক্ষেপের অনুরূপ জ্যামিতি তবে আলাদা সময়গুলি একই হিসাবে মূল্যায়ন করা যায় না - এটি প্রশ্নে নির্দিষ্ট করা হয়নি।

আপনি কি দেখতে পারেন কিছু সম্ভাবনা:

  1. আপনার প্রয়োজনের সবচেয়ে কাছাকাছিটি হ'ল ডজ, ওয়েবেল, ফুরুটান (২০০৯), এখানে http://orca.cf.ac.uk/94865/1/PhysicsMovement.pdf
  2. যদি জ্যামিতিটি সরল করা যায়, তবে এখানে বর্ণিত প্যারামিটারগুলি কার্যকর হতে পারে: http://www.tandfonline.com/doi/full/10.1080/17445647.2017.1313788

তবে শেষ অবধি, আপনার প্রাথমিক প্রশ্নটি আবারও পড়ুন, এটি সহজ হতে পারে: আপনি বিভাগগুলির লিনিয়ার এক্সটেনশনের ছেদগুলির মধ্যবর্তী দূরত্ব এবং তাদের নিকটতম পয়েন্টগুলির মধ্যে জোড় করে (বিভাগগুলির মধ্যে) গণনা করতে পারেন, কিছুটা স্বাভাবিক করুন (সম্ভবত দৈর্ঘ্যের উপর ভিত্তি করে) বিভাগটি নিজেই) এবং ম্যাট্রিক্স ক্লাস্টারিং অ্যালগরিদম ব্যবহার করবেন? যুক্তিযুক্ত: খণ্ডগুলি যেগুলি ছেদ করে সেগুলি খুব কাছাকাছি ছেদকৃত তুলনায় আরও সমান (সমান্তরাল)। অঙ্কনগুলিতে, আপনি কীভাবে সহ-রৈখিক, বা সমান্তরাল বিভাগগুলিকে কীভাবে অফসেটে (দীর্ঘ ফ্রাচেট ডিস্ট) অবস্থিত তা চিকিত্সা করবেন না। আমি ধরে নিই যে এটি উপরের সমাধানকে ঝামেলা দেবে। (উপরের "রৈখিক এক্সটেনশন" স্পষ্টভাবে উল্লেখ করে স্বচ্ছতার জন্য সম্পাদিত)

দ্রষ্টব্য (জানুয়ারী 2018): আমি সম্প্রতি এতে হোঁচট খেয়েছি:

  1. কাই, ইউহান এবং রেমন্ড এনজি। "চেবিশেভ বহুবর্ষের সাথে সূচীকরণ স্পাটিও-টেম্পোরাল ট্র্যাজেক্টরিজগুলি" " ডেটা ম্যানেজমেন্ট সম্পর্কিত 2004 এর ACM SIGMOD আন্তর্জাতিক সম্মেলনের কার্যক্রম। এসিএম, 2004

যা ট্রাজেক্টোরির মিলের সাথে সম্পর্কিত এবং এভাবে কিছুটা পরিমাণে মিলের পরিমাণ নির্ধারণ করতে সক্ষম করে। এটি বক্ররেখার বহুপক্ষীয় অনুমানের উপর ভিত্তি করে এবং একটি চেবিশেভ দূরত্ব গণনা করার জন্য is


4

আপনি যে ধরণের ডেটা নিয়ে কাজ করছেন সে সম্পর্কে আপনি কি আরও কিছু বিশদ দিতে পারেন? এগুলি কি কেবল বিচ্ছিন্ন রেখাগুলির একটি সিরিজ বা এগুলি একটি নেটওয়ার্ক গঠন করে? স্থানিক প্যাটার্ন বিশ্লেষণের জন্য আপনি কি কোনও আর্কজিআইএস সরঞ্জাম ব্যবহার করেছেন? অর্কজিআইএস পদ্ধতিতে অনেকগুলি (রিপলির কে, এনএন সূচক, মুরানস আই) অ-পয়েন্ট ডেটা ব্যবহার করার সময় কেবল লাইন / বহুভুজগুলির সেন্ট্রয়েড ব্যবহার করে। তবে এখানে আপনার সেন্ট্রয়েড খুব দূরে থাকার কারণে খুব দীর্ঘ লাইন বিবেচনা না করা এড়াতে আপনার প্রতিটি লাইনকে সমান বিভাগে বিভক্ত করার বিষয়টি বিবেচনা করতে হবে।

অন্য জিনিসটি ভাবার বিষয়টি হ'ল ধারণাগতভাবে লাইনের একটি গুচ্ছটি কী? আপনি একে অপরের কাছাকাছি উত্পন্ন অনেক লাইন থাকতে পারে, কিন্তু তারপরে তাদের শেষ পয়েন্টগুলি ছড়িয়ে দিতে পারে। একইভাবে, আপনি অনেকগুলি লাইন পেতে পারেন যা একে অপরের খুব কাছাকাছি শুরু হয় এবং শেষ হয় তবে তার শুরু / শেষ পয়েন্টগুলির মধ্যে খুব ছড়িয়ে পড়ে।

তবে একটি পদ্ধতির মধ্যে কেবল একটি লাইন ঘনত্ব বিশ্লেষণ করা যেতে পারে যাতে আরও লাইন (যেগুলি কোনও অর্থে ক্লাস্টার হিসাবে বিবেচিত হতে পারে) এর অঞ্চলগুলির উচ্চ গ্রিড মান থাকতে পারে, যেখানে কম ঘনত্বযুক্ত অঞ্চলগুলির মান কম থাকে। সুতরাং আপনি একটি হট স্পট আউটপুট একটি বিট পেতে; তবে এটি আপনাকে মুরানস I বা NNI এর মতো একক পরিসংখ্যান দেয় না। এটি বহু লাইন বনাম একটি খুব অনিয়মিত রেখার (অর্থাত্ একটি টাইট সর্পিল) ফলে ঘনত্বের মধ্যে পার্থক্য করতে পারে না।

দুঃখিত, এটি আপনার সমস্যার পুরো উত্তর নয় তবে আমি মনে করি আপনি যা অর্জন করার চেষ্টা করছেন তার সম্পূর্ণ ধারণাটি পেরেক করা আরও ভাল সমাধান দিতে পারে।

হালনাগাদ

আপনি যে উদাহরণটি দিয়েছেন তার উপর ভিত্তি করে আমি মনে করি যে ফেলিক্সলপির পয়েন্ট প্যাটার্ন ব্যবস্থা সহ ব্যবহার করার জন্য লাইন বিয়ারিং বৈশিষ্ট্য সহ একটি পয়েন্ট তৈরি করার পরামর্শটি সম্ভবত যাওয়ার একটি ভাল উপায়। আমি পয়েন্টগুলি সমান বিভাগে বিভক্ত করতাম এবং প্রতিটি লাইনের শীর্ষবিন্দুতে রেখাটি সহ একটি বিন্দু রাখব। তারপরে আপনাকে এমন ব্যবস্থাগুলি দেখতে হবে যা প্রতিটি পয়েন্টের সান্নিধ্য এবং বিয়ারিংয়ের মধ্যে সাদৃশ্য (যাতে আপনি লম্বগুলি লম্বের কাছাকাছি থাকে তা সনাক্ত করেন)।

সুতরাং গিটিস-অর্ড জিআই (হটস্পট বিশ্লেষণ) ব্যবহার করে ক্লাস্টারগুলি কোথায় রয়েছে তা ভিজ্যুয়ালাইজ করার জন্য একটি ভাল সরঞ্জাম হবে; এবং তারপরে বিশ্বস্তরের ক্লাস্টারিংয়ের মূল্যায়ন করার জন্য একটি গ্লোবাল মোরান আই

আপনি যে রেখাগুলি রেখাগুলি ভাগ করবেন সেই দূরত্বটি অবশ্য পাওয়া ক্লাস্টারিংয়ের ডিগ্রিকে প্রভাবিত করবে। আপনি যদি 1 কিলোমিটার স্কেলগুলিতে গুচ্ছগুলি সন্ধান করছেন তবে আপনাকে তার চারপাশে লাইনগুলি বিভাগ করতে হবে। একইভাবে যদি আপনি 100 মিটার স্কেলগুলিতে গুচ্ছগুলি সন্ধান করে থাকেন তবে আপনাকে সেই অনুযায়ী লাইনগুলি বিভাগ করতে হবে। এটি তাই আপনি লাইনগুলি মিস করবেন না এবং এটিও যাতে আপনি প্রতিটি লাইনকে একটি ক্লাস্টার হিসাবে সনাক্ত করেন না।


লাইনগুলি ট্রিপের উত্স এবং গন্তব্যগুলিকে উপস্থাপন করে। তারা নেটওয়ার্ক গঠন করে না। আমি এখনও অবধি উত্স এবং গন্তব্য পয়েন্টগুলির স্থানিক পয়েন্ট নিদর্শনগুলির জন্য আর পদ্ধতিগুলি ব্যবহার করেছি। আমি লাইন সেন্ট্রয়েডগুলি ব্যবহার করার ধারণার খুব পছন্দ করি না তবে লাইনটি ঘন করা এবং ফলস্বরূপ নোডগুলি বিশ্লেষণ করার চেষ্টা করা উচিত, ধন্যবাদ!
আন্ডার ডার্ক

লাইন ঘনত্ব বিশ্লেষণ একটি পতনের পিছনে সমাধান হতে পারে যদি আমি আরও উপযুক্ত কিছু না পাই।
আন্ডার ডার্ক

প্রাথমিক রেখার একটি নির্দিষ্ট দূরত্বে বাফারিংয়ের পরে বাফার দ্বারা সম্পূর্ণভাবে আবদ্ধ নয় এমন রেখাগুলি জিজ্ঞাসা করা কি সমাধান হতে পারে? সর্বাধিক সম্ভাব্য যাতায়াত রুটটি খুঁজে পেতে আমি এর আগে অনেক কিছু করেছি, তবে ডেটাতে সরল রেখার অংশগুলির চেয়ে মাল্টি নোড পলাইনগুলি রয়েছে।
jbgramm

@jbgramm আমি অনেক পন্থা যে কিছু গনা হবে মনে করতে পারেন কিন্তু আমি পরিসংখ্যানবিদ না এবং আমি তাই প্রতিষ্ঠিত পদ্ধতি খুঁজছি - যদি থাকে থাকবেই
underdark

2
একটি বিন্দু প্রক্রিয়া উপস্থাপন করার জন্য একটি লাইন কেন্দ্র বিন্দু, বা শীর্ষেগুলি ব্যবহার করা কোনও পরিসংখ্যানগতভাবে বৈধ পদ্ধতির নয়। এছাড়াও আপনি স্থানিক প্রক্রিয়ার প্রতিনিধিত্বকে গভীরভাবে পরিবর্তন করছেন। আমি কিছু রেকর্ডেশন পোস্ট করব তবে সত্যই, একমাত্র বৈধ পন্থা সরবরাহকারী একমাত্র হ'ল লাইন ডেনসিটির @unddark পরামর্শ। একটি স্বতঃসংশ্লিষ্ট পরিসংখ্যানের সাথে মিলিয়ে স্কেলগুলি জুড়ে রৈখিক বৈশিষ্ট্যগুলিতে কিছুটা ক্লাস্টারিং ইঙ্গিত হবে।
জেফরি ইভান্স

3

উদাহরণের জন্য ধন্যবাদ।

আপনি যা খুঁজছেন তা গণনা করার জন্য আমি কোনও প্রতিষ্ঠিত পদ্ধতি দেখিনি, তবে এটি আমার পদ্ধতির হবে। এটি একধরনের জাল ফোলা সমাধান।

সর্বনিম্ন বাউন্ডিং আয়তক্ষেত্র গণনা করুন, তারপরে এটিকে একটি স্বেচ্ছাসেবক আকারে প্রসারিত করুন, তবে চারটি কোণার প্রতিটিটিতে সমান পরিমাণে বড় পরিমাণে করুন।

আয়তক্ষেত্র তৈরির ভর কেন্দ্রের কেন্দ্রটি সন্ধান করুন, প্রতিটি লাইনের জন্য ওডি পয়েন্টগুলির জন্য আজিমুথাল এবং দূরত্ব বিতরণ গণনা করুন এবং আপনার সীমানার আয়তক্ষেত্রের কোণগুলি ব্যবহার করে একই সাথে লাইনের অজিমুথগুলি তুলনা করুন।

চারটি কোণ থেকে প্রতিটি রশ্মির শেষে প্রতিটি সমান্তরালতার জন্য পরীক্ষা করুন। ভর কেন্দ্র থেকে প্রতিটি রশ্মির শেষে সমান্তরালতার জন্য পরীক্ষা করুন

এটি করে আপনি কোণ থেকে শেষ পর্যন্ত বিচ্যুতি তুলনা করতে পারেন। উদাহরণস্বরূপ (ক) আপনার কাছে দুটি কোণ থেকে তিনটি লাইন ক্লাস্টারের প্রতিটি সমান্তরাল রেখা থাকবে। আপনার ভরগুলির কেন্দ্র থেকে লাইনগুলির দীর্ঘ প্রান্তের প্রান্তে সমান্তরাল রেখাগুলিও থাকবে।

উদাহরণ (খ) প্রতিটি লাইনের কোণার থেকে শেষ পর্যন্ত গণনা করার সময় আপনার কাছাকাছি সমান্তরাল রেখা থাকবে না তবে লাইনগুলি এলোমেলো মনে হচ্ছে না, তারা সামান্য বিচ্যুতি নিয়ে একে অপরের দিকে নিয়ে যায়।

উদাহরণ (সি) এলোমেলো বলে মনে হচ্ছে

উদাহরণ (d) এলোমেলো নয়, এটি রেডিয়াল।

এটি আরও দেখার জন্য, আমি উপরে বর্ণিত পরীক্ষাগুলি চালাব, পাশাপাশি তৈরি ঘেরের আয়তক্ষেত্রের কোণগুলি থেকে রশ্মির শেষ প্রান্তে ত্রিভুজ সমাধান পরীক্ষা তৈরি করব। অনুরূপ অভ্যন্তর কোণ এবং অঞ্চলগুলি ক্লাস্টারিং যাচাই করতে সহায়তা করবে যদি না ক্লাস্টারের লাইনের একটি লাইন অন্যের চেয়ে উল্লেখযোগ্যভাবে ছোট হয়।

উপরেরটি কেবল একটি বোকামির মতামত, এবং আমি সম্ভবত ভুল।


-1

আপনার সহজাত বিবরণ অনুসরণ করে, 2 লাইন সমান্তরাল হওয়ার মানদণ্ডটি কী?

আপনি প্রাথমিকভাবে সেগুলি শুরু বা শেষের পয়েন্টগুলির জন্য একটি পরীক্ষা করতে পারেন:
এসএক্স = (শুরু_এক্স_লাইন_1 - শুরু_এক্স_লাইন_2),
সি = (শুরু_ই_লাইন_1 - আর্ট_ই_লাইন_2),
এবং প্রাক্তন, এ একই তবে তাদের শেষ পয়েন্টগুলির জন্য।

সুতরাং যদি স্কয়ার্ট (এসএক্স² + সি²) এবং স্কয়ার্ট (এক্সে + এআই) একটি নির্দিষ্ট প্রান্তিক প্রশস্ত হয় তবে আপনি এই রেখাগুলিকে সমান্তরাল হিসাবে বিবেচনা করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.