আমি কীভাবে আমার অজগর কোডটি আরও কার্যকর করা যায় সে সম্পর্কে কিছু পরামর্শ খুঁজছি। সাধারণত দক্ষতা আমার পক্ষে গুরুত্বপূর্ণ নয় তবে আমি এখন মার্কিন অবস্থানগুলির একটি টেক্সট ফাইলের সাথে 1.5 মিলিয়ন পয়েন্ট নিয়ে কাজ করছি। প্রদত্ত সেটআপটির সাথে এক পর্যায়ে অপারেশন চালাতে প্রায় 5 সেকেন্ড সময় লাগবে; আমার এই চিত্রটি নামা দরকার।
আমি তিনটি পৃথক পাইথন জিআইএস প্যাকেজ ব্যবহার করছি পয়েন্টগুলিতে কয়েকটি আলাদা ক্রিয়াকলাপ করতে এবং একটি নতুন সীমিত পাঠ্য ফাইল আউটপুট।
- আমি একটি কাউন্টি সীমানা শেফফিল পড়তে ওজিআর ব্যবহার করি এবং সীমানা জ্যামিতিতে অ্যাক্সেস পাই।
- এই বিন্যাসগুলির মধ্যে কোনওটির মধ্যে কোনও বিন্দু রয়েছে কিনা তা আকৃতির আকারে পরীক্ষা করে দেখুন।
- যদি এটির মধ্যে থাকে তবে আমি সীমানা .dbf থেকে অ্যাট্রিবিউট তথ্য টানতে পাইথন শেফিল লাইব্রেরি ব্যবহার করি।
- আমি তখন উভয় উত্স থেকে একটি পাঠ্য ফাইলে কিছু তথ্য লিখি।
আমি সন্দেহ করি যে অদক্ষতা 2-3 টায়ার্ড লুপ থাকার মধ্যে রয়েছে ... এটি সম্পর্কে কী করা উচিত তা নিশ্চিত নয়। আমি বিশেষত এই 3 টি প্যাকেজের যে কোনওটি ব্যবহার করার ক্ষেত্রে অভিজ্ঞ কাউকে সাহায্যের জন্য সন্ধান করছি, কারণ এর মধ্যে যে কোনওটি ব্যবহার করা আমার প্রথমবার।
import os, csv
from shapely.geometry import Point
from shapely.geometry import Polygon
from shapely.wkb import loads
from osgeo import ogr
import shapefile
pointFile = "C:\\NSF_Stuff\\NLTK_Scripts\\Gazetteer_New\\NationalFile_20110404.txt"
shapeFolder = "C:\NSF_Stuff\NLTK_Scripts\Gazetteer_New"
#historicBounds = "C:\\NSF_Stuff\\NLTK_Scripts\\Gazetteer_New\\US_Counties_1860s_NAD"
historicBounds = "US_Counties_1860s_NAD"
writeFile = "C:\\NSF_Stuff\\NLTK_Scripts\\Gazetteer_New\\NewNational_Gazet.txt"
#opens the point file, reads it as a delimited file, skips the first line
openPoints = open(pointFile, "r")
reader = csv.reader(openPoints, delimiter="|")
reader.next()
#opens the write file
openWriteFile = open(writeFile, "w")
#uses Python Shapefile Library to read attributes from .dbf
sf = shapefile.Reader("C:\\NSF_Stuff\\NLTK_Scripts\\Gazetteer_New\\US_Counties_1860s_NAD.dbf")
records = sf.records()
print "Starting loop..."
#This will loop through the points in pointFile
for row in reader:
print row
shpIndex = 0
pointX = row[10]
pointY = row[9]
thePoint = Point(float(pointX), float(pointY))
#This section uses OGR to read the geometry of the shapefile
openShape = ogr.Open((str(historicBounds) + ".shp"))
layers = openShape.GetLayerByName(historicBounds)
#This section loops through the geometries, determines if the point is in a polygon
for element in layers:
geom = loads(element.GetGeometryRef().ExportToWkb())
if geom.geom_type == "Polygon":
if thePoint.within(geom) == True:
print "!!!!!!!!!!!!! Found a Point Within Historic !!!!!!!!!!!!"
print str(row[1]) + ", " + str(row[2]) + ", " + str(row[5]) + " County, " + str(row[3])
print records[shpIndex]
openWriteFile.write((str(row[0]) + "|" + str(row[1]) + "|" + str(row[2]) + "|" + str(row[5]) + "|" + str(row[3]) + "|" + str(row[9]) + "|" + str(row[10]) + "|" + str(records[shpIndex][3]) + "|" + str(records[shpIndex][9]) + "|\n"))
if geom.geom_type == "MultiPolygon":
for pol in geom:
if thePoint.within(pol) == True:
print "!!!!!!!!!!!!!!!!! Found a Point Within MultiPolygon !!!!!!!!!!!!!!"
print str(row[1]) + ", " + str(row[2]) + ", " + str(row[5]) + " County, " + str(row[3])
print records[shpIndex]
openWriteFile.write((str(row[0]) + "|" + str(row[1]) + "|" + str(row[2]) + "|" + str(row[5]) + "|" + str(row[3]) + "|" + str(row[9]) + "|" + str(row[10]) + "|" + str(records[shpIndex][3]) + "|" + str(records[shpIndex][9]) + "|\n"))
shpIndex = shpIndex + 1
print "finished checking point"
openShape = None
layers = None
pointFile.close()
writeFile.close()
print "Done"