বালোক জিওকোড 20 মিলিয়ন মার্কিন ঠিকানা


34

মার্কিন যুক্তরাষ্ট্রের জন্য কি কোনও নিখরচায় বা যুক্তিসঙ্গত দামের ডাটাবেস রয়েছে যা অনুসন্ধান এবং অক্ষাংশ এবং দ্রাঘিমাংশের তথ্য ফেরত পাওয়া যায়?


দ্রুত ঠিক আছে, তবে নির্ভুলতা সব কিছু। - উইয়াট ইর্প কোনও জিওকোডারের সাথে কথা বলার সময় এমন কিছু রয়েছে (যেমন একটি এই থ্রেডে উল্লেখ করা হয়েছে) যা অনেকগুলি ঠিকানা জিওকোড করার জন্য কম দামের প্রস্তাব করে, তবে আপনি যদি বিভিন্ন অঞ্চলে খুব সূক্ষ্মতার সন্ধান করছেন তবে আপনার সাথে যেতে হবে একটি প্রিমিয়াম জিওকোডার ফলাফলগুলি আরও সুসংগত এবং অসাধারণভাবে নির্ভুল হবে, বিশেষত যখন ডাক ম্যাচটি ঘটে না। সর্বাধিক নির্ভুল জিওকোডিংয়ের ক্ষেত্রে আপনি এতটা প্রতিযোগিতা করতে পারবেন না, অন্যথায় আপনার গণনাগুলি অন্যান্য প্রযুক্তি ব্যবহারকারীদের অফার দেওয়ার ক্ষেত্রে বাধা হয়ে

2
আপনি উচ্চ মানের প্রয়োজন সম্পর্কে আপনার মতামত প্রস্তাব, কিন্তু কোন পরামর্শ। দয়া করে আপনার কয়েকটি পরামর্শ সরবরাহ করুন, অন্যথায় এটি ব্যবহারকারীদের প্রশ্নের উত্তর দিতে সহায়তা করে না।
রায়ানডাল্টন

উত্তর:


30

যে অনেক রেকর্ড জন্য, এমনকি একটি ওয়েব পরিষেবা বিবেচনা করবেন না। আপনি আপনার কাজ শেষ করার আগে তারা গলা টিপে বা কাটাবে।

সুতরাং আপনার বিকল্পটি এটিকে স্থানীয়ভাবে চালানোর জন্য পরিণত হয় এবং এর জন্য আপনার কাছে বেশ কয়েকটি বাণিজ্যিক বা নিখরচায় বিকল্প রয়েছে।

নিখরচায় বিকল্পগুলি শুমারি টাইগার ডেটাসেট ব্যবহার করবে যা আপনাকে একটি স্থানিক ডাটাবেসে লোড করতে হবে। পোস্টগ্রিস বা এমনকি স্ক্লাইটের জন্য টাইগারের বিপরীতে জিওকোড এমন লাইব্রেরিগুলি আপনি খুঁজে পেতে পারেন । হিঙ্ক আপনি এমনকি টাইগার এর বিরুদ্ধে জিওকোড করতে আর্কজিআইএস ব্যবহার করতে পারেন অবশ্যই, আরকজিআইএস নিখরচায় নয়, যা আমাকে পরবর্তী বাণিজ্যিক বিকল্পগুলিতে নিয়ে আসে। যদি আপনার কাছে আরকিজিআইএস লাইসেন্সের সম্ভাবনা থাকে তবে আপনার কাছে একটি টেলিঅ্যাটলাস ( মানে টম টম ) বা নভটেক ডেটাসেটের সাথে স্ট্রিটম্যাপ ডিভিডি রয়েছে । আপনি যদি স্ট্রিটম্যাপ প্রিমিয়াম বান্ডিল পেয়ে থাকেন তা নির্ভর করে । এই দুটি ডাটাসেটের যে কোনওটি সম্ভবত আপনাকে টাইগারের চেয়ে আরও সুসংগত ফলাফল দেবে।

আপনার উপকার করুন এবং একবার আপনার ডেটা লোড হয়ে যাওয়ার পরে এবং রাস্তার ডাটাবেসের বেশ কয়েকটি অনুলিপি তৈরি করুন এবং ইনপুট ডেটার উপসেট সহ বেশ কয়েকটি মেশিনে জিওকোডিং প্রক্রিয়া চালান। এটি কেবল একটি মেশিনে চালানোর চেষ্টা করবেন না বা আপনি এটির অপেক্ষা করতে অপেক্ষা করতে অপেক্ষা করতে অপেক্ষা করতেই পারেন যে আপনি সম্ভবত চালাবেন যে কোনও প্রক্রিয়া সম্ভবত স্মৃতি ফাঁস হবে এবং এটি শেষ হওয়ার আগে বেশ কয়েকবার ক্রাশ হবে। এর অর্থ হল যে আপনি আপনার প্রক্রিয়াটির জন্য আলাদা চেকপয়েন্ট রাখতে চান।


2
আমি ইনপুট এবং ঠিকানার তথ্যগুলি ছোট অংশগুলিতে বিভক্ত করা সুবিধাজনক বলে মনে করেছি (যেমন রাজ্য)। এটি লোকেটারগুলিকে দ্রুতগতিতে ব্যবহার করতে সক্ষম করে এবং প্রক্রিয়াগুলি দীর্ঘকাল চলার পরে লকআপ হওয়ার সম্ভাবনা কম করে। একটি স্থানীয় ভিত্তিক লুপের স্ক্রিপ্ট করা খুব সহজ নয় যা লোকেটার তৈরি করতে এবং একটিতে জিওকোডিংয়ের ঝাপটায় পড়ে যায়।
নাথানাস

26

আমি স্মার্টস্ট্রিটসে (একটি ঠিকানা যাচাইকরণ সংস্থা) কাজ করি। আমাদের পরিষেবা সবার জন্য বিনামূল্যে (প্রাথমিক স্তর পর্যন্ত)। প্রথম বছরের জন্য আমাদের পরিষেবাটি সম্পূর্ণ বিনামূল্যে ব্যবহার করার জন্য সূচনাগুলিও অনুরোধ করতে পারে। সুতরাং আপনি যদি সেই শ্রেণিবিন্যাস মাপসই করেন তবে এক বছরের জন্য আমাদের সীমাহীন পরিষেবার জন্য কোনও মূল্য নেই ..

রাগি একটি ওয়েব-পরিষেবার বিরুদ্ধে পরামর্শ দেয়, তবে, আমাদের এপিআই আপনার পক্ষে প্রায় 5 ঘন্টা (প্রায় প্রতি সেকেন্ডে 1000) আপনার জন্য 20 মিলিয়ন ঠিকানা সহজেই পরিষ্কার, মানক এবং জিওকোড করতে পারে। সেই সময়ের কিছুটা আপনার মেশিনের গতি (আপনার কতগুলি কোর রয়েছে) এবং আপনার নেটওয়ার্ক সংযোগের উপর নির্ভর করবে (3 জি এর মাধ্যমে এটি চেষ্টা করবেন না, তবে একটি স্ট্যান্ডার্ড ব্রডব্যান্ড সংযোগ ঠিক ঠিক করবে)।

কেবল এটি চিহ্নিত করতে চেয়েছিলেন যে এটি একটি ওয়েব সার্ভিস দিয়ে অবশ্যই সম্ভব।

আপডেট: 1 আগস্ট ২০১7 অনুসারে, আমি দূরবর্তীভাবে আমাদের ওয়েব পরিষেবাটি পরীক্ষা করে দেখেছি এবং একটি ওয়্যারলেস নেটওয়ার্কে কেবলমাত্র একটি একক 2015 ম্যাকবুক ব্যবহার করে প্রতি সেকেন্ডে একটি টেকসই 70,000 লকআপ পেয়েছি। হ্যাঁ এটি বেশ দ্রুত। এর অর্থ 20 মিলিয়ন ঠিকানার মতো একটি ছোট তালিকাতে প্রায় 5 মিনিট সময় লাগবে।


2
ঠিক আছে, আপনি যদি তাকে একটি ডাইম চার্জ না করে তাকে 20 মিলিয়ন রেকর্ড জিওকোড করতে চলেছেন এবং প্রতি সেকেন্ডে 1000 / অনুরোধ করতে পারেন (অত্যন্ত চিত্তাকর্ষক), তবে অবশ্যই এটি আপনার নিজের স্ট্যাকটি স্ক্র্যাচ থেকে তৈরি করার চেয়ে ভাল সমাধান।
রাগী ইয়াসের বুড়হুম

1
একেবারে। 1000 / সেকেন্ড সর্বোচ্চ নয়। এটি কেবল একটি ভাল মান। মাল্টিথ্রেডিং, একাধিক কোর এবং দ্রুত নেটওয়ার্ক সংযোগগুলি এমনকি এই থ্রুপুটটিকে বাড়িয়ে তুলতে পারে। আমাদের এক সাম্প্রতিক অলাভজনক গ্রাহক রয়েছে যা 180 মিলিয়ন ঠিকানার প্রক্রিয়া করতে আমাদের পরিষেবাটি ব্যবহার করেছে used জাতীয় নির্বাচনগুলি আসার সাথে সাথে প্রচুর গোষ্ঠী তাদের ঠিকানা পরিষ্কার ও জিওকোড করার চেষ্টা করছে।
জেফ্রি

1
@ রাগ্যায়সারবারহাম নোট করুন যে ক্রিসও "যুক্তিসঙ্গত দামের" সমাধান চাইছেন। অবশ্যই, আপনার স্ক্র্যাচ থেকে নিজের স্ট্যাক তৈরি করা "মুক্ত" হতে পারে তবে আপনি যখন নিজের সুযোগ ব্যয়টি বিবেচনা করেন তখন তা কি সত্যিই হয়? আপনি নিজেই এগুলি করে লাভটি পাবেন: সম্ভাব্য কোনও মূল্য নেই ("ফ্রি")। বিদ্যমান পরিষেবা ব্যবহারের সুবিধা: অনেক ঘন্টা এবং সময় সাশ্রয় করা। এছাড়াও, এক হাজার অনুরোধ / সেকেন্ড সম্ভবত অবিচ্ছিন্ন ট্রাফিক বোঝা মোকাবেলায় আধুনিক ওয়েব আর্কিটেকচার (সমান্তরালকরণ) এর সাথে এই দিনগুলিতে সম্ভবত নিয়মিত। শেষ পর্যন্ত, আমি মনে করি এই বিষয়টির জন্য, "ফ্রি" এবং "যুক্তিসঙ্গত মূল্যবান" পছন্দসই বিষয়।
ম্যাট

1
@ ম্যাট হ্যান্ডস ডাউন "ফ্রি" সর্বদা নিখরচায় থাকে না I আমি তার বিরুদ্ধে তর্ক করব না (আপনার সময়টি অর্থের উপযুক্ত)। আমি ভাল করেই জানি যে বেশিরভাগ ওপেন সোর্স সমাধানের জন্য ব্যয়টি লাইসেন্সের থেকে পরিষেবাগুলিকে সমর্থন করার ক্ষেত্রে ব্যয় মডেলের পরিবর্তন হয়। আমি বিদ্রূপাত্মক হতে চেষ্টা করা হয় নি, আমি যে এই যদি Jeffey বিনামূল্যে (অথবা এমনকি যুক্তিসঙ্গতভাবে দামের) জন্য সমাধান দিতে পারে মনে করেন হয় ভাল সমাধান। স্মার্টস্ট্রিটসের সেরা তালিকাভুক্ত দামে, 20 মিটার পয়েন্টের দাম হবে $ 100,000 আমি নিশ্চিত যে এমনকি বাণিজ্যিক ব্যবহারের ক্ষেত্রেও তারা ব্যয়ের একটি অংশ বিয়োগ করতে পারে।
রাগী ইয়াছার বারহুম

1
এছাড়াও 1000 / req প্রতি সেকেন্ডে, যা সমসাময়িক আর্কিটেকচারের খুব করা সম্ভব হয়, হবে এখনও জন্য কিছু সন্ত্রস্ত ইঞ্জিনিয়ারিং প্রয়োজন geocoding । তারা এটি করার জন্য আমার
প্রপসগুলি পাচ্ছে

8

আমি এই ব্যবহৃত , walkthrough 2010 TigerLine তথ্য ব্যবহার করে একটি postgis geocoder গড়ে তুলতে কিভাবে বর্ণনা। আমি এখনই এটি চালাচ্ছি - এটি দ্রুত নয়, কারণ 2 মিলিয়ন ঠিকানা জিওকোড করতে 3 সপ্তাহ লাগবে।

তবে এটি নিখরচায়, নিখরচায়, এবং ন্যূনতম কোডিং এবং পোস্টগ্র্রেস দক্ষতা সম্পন্ন কাউকে জিওকোডিং শুরু করতে এক (বৃহত্তর) রাষ্ট্রের ডেটা সহ সেট এবং লোড করতে 2 দিনের কম সময় নিয়েছে। আমি সিস্টেমের জন্য কোনও পোস্টগ্র্রেস টিউনিংও করেছি এবং এটি এনএফএস মাউন্টগুলির উপর দিয়ে চলছে, সুতরাং আমার সন্দেহ হয় যে প্রয়োজনের প্রয়োজনে আমি এ থেকে বেরিয়ে আসতে পারব এমন পারফরম্যান্স লাভের এক বা দুটি অর্ডার রয়েছে।

ওয়েব পরিষেবাদি ব্যবহারের পরিবর্তে, আমি আমার সমস্ত ঠিকানা পোস্টগ্রিজ ডাটাবেসে লোড করে দিয়েছিলাম এবং তারপরে আমি একবারে সকলকে জিওকোড করার জন্য একটি দ্রুত এবং নোংরা পার্ল স্ক্রিপ্ট চালাচ্ছি:

perl -e for ($i=1; $i<[max_key_value]; $i+=1) 
   {printf "UPDATE source_addresses
               SET (rating, new_address, lon, lat) 
                     = (g.rating, pprint_addy(g.addy), 
                       ST_X(g.geomout), ST_Y(g.geomout) ) 
              FROM (SELECT DISTINCT ON (address_id) address_id, (g1.geo).* 
                      FROM (SELECT address_id, (geocode(address)) As geo 
                              FROM source_addresses As ag 
                             WHERE ag.rating IS NULL and address_id = $i 
                           ) As g1 
                     ORDER BY address_id, rating LIMIT 1
                   ) As g WHERE g.address_id = source_addresses.address_id;\n"
  } | psql -d geocoder 

(একমাত্র পাঠযোগ্যতার জন্য লাইন বিরতি)

যাতে এটি "এই আইডি মানটির সাথে ঠিকানাটি জিওকোড তৈরি করে এবং সর্বোত্তম ম্যাচটি ব্যবহার করে" আপডেট বিবৃতি দেয় এবং এটি করার জন্য এটি পিএসকিএল-তে পাইপ দেয়। এটি কেবল কোনও রেটিং ছাড়াই ঠিকানার জিওকোড করার চেষ্টা করে - যেমন এটি ইতিমধ্যে জিওকোড করা হয়নি। সুতরাং এটি পুনরায় আরম্ভযোগ্য এবং প্রতিটি স্বতন্ত্রভাবে সম্পন্ন হয়।


আপনি কি 2010 এর টাইগারলাইন ডেটা কিছু ঠিকানার জন্য সঠিক হতে খুঁজে পেয়েছেন?
ক্রিস Muench

এটি কোনও উপায়ে নিখুঁত ডেটা নয়; তবে আমার কাছে থাকা ঠিকানা ডেটা মানের দিক থেকে সেপ্টিক। লিখিত হিসাবে জিওকোডার একটি "রেটিং" ফিল্ড সরবরাহ করে, যেখানে কম ভাল। আমি আমার উত্তরে একটি উদাহরণ যুক্ত করব।
অ্যাডাম মাশ

@ ক্রিসমুঞ্চ: আপনি যদি আমাকে একটি বা দুটি ক্যালিফোর্নিয়ার ঠিকানা দেন তবে আমি আমার জিওকোডারের মাধ্যমে আপনাকে দেখানোর জন্য গুলি করে খুশি হব - এইভাবে আমি তাদের তুলছি না।
অ্যাডাম মাশ

ভাল আমি পোস্টওয়িসের জিওকোডারটি এনওয়াইতে কিছু ঠিকানার জন্য চেষ্টা করেছি এবং তারা 500 ফুট থেকে 1 মাইল দূরে যেতে পারে
ক্রিস মুইঞ্চ

এটি আপনার জন্য খুব দেরি হলেও অন্য কারও পক্ষে এটি দরকারী মনে হতে পারে ... নিশ্চিত হয়ে নিন যে আপনার ঠিকানাটি ভালভাবে পার্স হয়েছে। আমি দেখতে পেলাম যে আমার সাদামাটা "123 ওক সেন্ট যেকোনটাউন এসটি 12345" 550x বৃদ্ধি পেয়ে যখন আমি কমা যুক্ত করেছি: "123 ওক সেন্ট, অ্যানটাউন, এসটি, 12345"
আরিয়নো

3

আমি অনুমান করছি আপনি জিওকোডে যেতে চান তবে এর জন্য কোনও অর্থ প্রদান করেন না? এমন অনেকগুলি পরিষেবা রয়েছে যা আপনি 20 মিলিয়ন রেকর্ডগুলিকে জিওকোড করতে পারেন তবে এটি আপনাকে ব্যয় করবে। এসরি, পিটনি বোয়েস এবং অন্যান্যগুলি সাবস্ক্রিপশনের মাধ্যমে বা এক্স জি জিওকোডে ব্যয় করে এই পরিষেবাগুলি সরবরাহ করে। 20 মিলিয়ন তুচ্ছ নয়, তবে আমি ধরে নিচ্ছি এটির জন্য কোনও ব্যবসায়ের মামলা রয়েছে।


3

আপনার ডেটার অবস্থানটি অত্যন্ত গুরুত্বপূর্ণ কারণ ওয়েব-পরিষেবার মান পরিবর্তনের (যথার্থতা, স্কেল ইত্যাদি ...) আমি গুগল এপি, ফেসবুক এপি এবং আমার জিওডাটাবেস সহ প্রাক্তন সিম্প্লেজিও থেকে আমার ঠিকানা জিওকোড করি।

জিওকোডিংয়ের সময়

http://blog.programmableweb.com/2012/06/21/7-free-geocoding-apis-google-bing-yahoo-and-mapquest/


3

এই পোস্টটি সম্ভবত মূল পোস্টারটি সাহায্য করতে খুব দেরী হয়েছে। তবে, অন্যদের জন্য নিখরচায় বিপুল পরিমাণে ডেটা জিওরফারেন্সের সন্ধানের জন্য আপনি "ইজি জিওরিফারেন্সার" নামক আমার সফ্টওয়্যারটি যা স্বাধীনভাবে তৈরি, ব্যবহার করা সহজ এবং এখনও শক্তিশালী (পোস্টের নীচে স্ক্রিনশট দেখুন) পরীক্ষা করে দেখতে পারেন।

প্রোগ্রামটি ব্যবহারের জন্য সহজ এবং সোজা-এগিয়ে, এবং কোনও এক্সাইপ ফাইল থেকে সরাসরি চালানো হয় যার কোনও ইনস্টলেশন নেই। আপনি জিএনএস বা জিওনাম ডেটাসোর্সের মধ্যে জিওকোড বেছে নিতে পারেন এবং আপনি এখন পর্যন্ত অন্য কোনও জিওকোডার যা করতে পারবেন না তা করতে পারেন, জিএডিএম প্রশাসনিক ইউনিটগুলির ডেটাবেসের ভিত্তিতে জিওকোড প্রদেশগুলি, পাশাপাশি সিএসাপেস ডেটাসেট থেকে জিওকোড historicalতিহাসিক দেশের সীমানা। একমাত্র সতর্কতা হ'ল এটি অ্যাড্রেস ডেটা জিওকোড করে না। সমস্ত আউটপুটগুলি জিআইএস-এ তাত্ক্ষণিক দৃশ্যায়ন / বিশ্লেষণের জন্য শেডফিল হিসাবে প্রস্তুত হয়।

দক্ষতা এবং বৃহত ডেটা হ্যান্ডলিংয়ের বিষয়ে, প্রোগ্রামটি মাত্র 3 ঘন্টার মধ্যে 100 000 রেকর্ডকে জিওকোড করার জন্য পরীক্ষা করা হয়েছে। বৃহত্তর ডেটাসেটগুলির জন্য প্রক্রিয়াকরণের সময়গুলির প্রত্যাশিত বৃদ্ধিটি বক্ররেখা ছাড়তে হবে কারণ দেশের রেফারেন্স ডেটাসেটগুলি লোড হওয়ার সময় প্রসেসিংয়ের বেশিরভাগ সময় কেবলমাত্র প্রাথমিক পর্যায়ে চলে যায়, তবে পরে উঠে যায়। এছাড়াও, বড় ডেটাসেটগুলি জিওকোড করার সময় কারও কাছে ইন্টারনেট বোতল-ঘাড় বা কানেক্টিভিটি সম্পর্কিত সমস্যাগুলির বিষয়ে চিন্তা করার দরকার নেই কারণ সফ্টওয়্যার, রেফারেন্স ডেটাসেট এবং প্রসেসিং সমস্ত স্থানীয় কম্পিউটারের উপর ভিত্তি করে। মিলের হারগুলি 80-90 শতাংশ পর্যন্ত পেতে পারে কারণ এটি বানানের পার্থক্যের জন্য অস্পষ্ট-নামের মিলের অ্যাকাউন্টিংয়ের উপর ভিত্তি করে।

একটি পরিচিতি কাগজ এবং শিক্ষানবিশ এর গাইড সহ আরও বিশদ বিবরণ ডাউনলোড প্যাকেজের অন্তর্ভুক্ত। এটি চেষ্টা করে দ্বিধা করার দরকার নেই, প্রোগ্রামটি একটি সহজ ফাইল যা আপনি আপনার কম্পিউটারের কোনও প্রতিশ্রুতি বা বিশৃঙ্খলা ছাড়াই আপনার ডেস্কটপে রেখে দিতে এবং চালাতে পারেন।

সফ্টওয়্যারটি ডাউনলোড করা যেতে পারে: http://geocodeanything.wordpress.com/ থেকে

আশা করি এইটি কাজ করবে.

এখানে চিত্র বর্ণনা লিখুন


আপনার সর্বদা প্রকাশ করা উচিত যে লেখক / বিকাশকারী এবং / অথবা কোনও সফ্টওয়্যার পণ্য প্রস্তুতকারী সংস্থার পক্ষে কাজ করুন।
রায়ানডাল্টন

@ রায়ানডাল্টন আমি প্রকাশ করেছিলাম যে আমি যখন "আমার তৈরি সফ্টওয়্যার" লিখেছিলাম তখন আমি লেখক ছিলাম, যদিও আমি দেখতে পাচ্ছি যে এটি কীভাবে নজরে চলে গেছে কারণ বাক্যটিতে এটিকে বেশি জোর দেওয়া হয়নি। আমার শব্দটিকে পরিবর্তন করে আশাকরি আরও স্পষ্ট করে তুলুন যে আমি আমার নিজের সফটওয়্যারটি কনডোন করছি।
করিম বাহਗਤ

2

আপনি যেমন মার্কিন ঠিকানাগুলি জিওকোডিং করবেন, আমার মনে হয় ডেটা সায়েন্স টুলকিটের স্ট্রিট অ্যাড্রেস টু কোঅর্ডিনেটস সরঞ্জামটি আপনার পক্ষে ভালভাবে কাজ করা উচিত।

This API takes either a single string representing a postal address, or a JSON-encoded  
array of addresses, and returns a JSON object with a key for every address. The value 
for each key is either null if no information was found for the address, or an object 
containing location information, including country, region, city and latitude/longitude 
coordinates.

আপনি যদিও ভার্চুয়াল মেশিনটি ডাউনলোড করতে এবং এটি নিজের হার্ডওয়্যার থেকে চালাতে চাইতে পারেন । এইভাবে, আপনাকে এপিআই সীমা সম্পর্কে আরও চিন্তা করার দরকার নেই প্লাস আপনি এটিও নিয়ন্ত্রণ করেন। ওহ এবং আমি কি বলেছি যে এটি নিখরচায়? ;-)


বেশ সুন্দর! আমি অবাক হয়েছি এর আগে এর আগে কখনও শুনিনি। এছাড়াও এটি দুর্দান্ত যে আপনি ভিএম ডাউনলোড করতে পারেন এবং এটি ইতিমধ্যে আপনার নিজের সিস্টেমে চালানোর জন্য প্রস্তুত থাকতে পারেন।
রায়ানডাল্টন

এটি ওপেন সোর্সও। :) github.com/petewarden/dstk
আরকে

2

আপনার প্রয়োজনীয় নির্ভুলতার স্তরের কোনও রেফারেন্স আমি দেখিনি তবে আমি ধরে নিচ্ছি যে আপনি ছাদ দীর্ঘ ল্যাট বা এর কাছাকাছি যেতে চান। ইনপুট ঠিকানার মানটিও একটি ফ্যাক্টর হতে পারে। অ্যাড্রেসের একটি পরিষ্কারভাবে পরিষ্কার তালিকা অসম্পূর্ণ বা খারাপ ঠিকানার তালিকার চেয়ে আরও ভাল এবং দ্রুত কোড করবে। এছাড়াও, একটি 90% হিট রেট গ্রহণযোগ্য বা আপনার কোডড সমস্ত 20 মিলিয়ন ঠিকানা প্রয়োজন? আমার কাছে নিখরচায় সমাধান নেই তবে আমি তুলনামূলকভাবে কম ব্যয়বহুল। সেমফোর কর্প থেকে জেডপি 4, http://www.semaphorecorp.com/একটি ঠিকানা স্ক্র্যাবার / জিওকোডার সরবরাহ করে এবং সেইগুলি যুক্ত করে যা ঠিকানাগুলি প্রক্রিয়া করবে এবং একটি পরিষ্কার ঠিকানা ফেরত দেবে, একটি পতাকা যা নির্দেশ করে যে ঠিকানাটি ইউএসপিএস বিতরণযোগ্য কিনা এবং জিপ +4 এর জন্য দীর্ঘ ল্যাট। জিপ + 4 স্পষ্টতা সাধারণত বিল্টআপ অঞ্চলে (রাস্তার ডান দিক এবং সঠিক ব্লকের) ছাদ যথাযথতার কাছাকাছি এবং গ্রামীণ অঞ্চলে খুব কাছাকাছি নয়। 30 দিনের লাইসেন্সের জন্য মূল্য 120 ডলার। সেই সময়ের পরে ঠিকানা স্ক্র্যাবারটি এখনও কাজ করবে তবে ডেলিভারি পয়েন্ট ভ্যালিডেশন (ডিপিভি) এবং জিও রিটার্নগুলি কাজ করবে না। একটি তুলনামূলক দ্রুত কম্পিউটারের সাথে, গত দু'বছরের মধ্যে নির্মিত, এবং স্থানীয়ভাবে এইচটিই ডেটা সংরক্ষণ করা এবং অ্যাক্সেস করা, 20 মিলিয়ন রেকর্ডগুলি প্রায় 10 দিনের মধ্যে করা উচিত। আমি গত 15 বছর ধরে ঠিকানাগুলি জিওকোডিং করছি এবং আমি বেশিরভাগ সময় জেডপি 4 ব্যবহার করছি। তারা দীর্ঘ-ল্যাট বা ডিপিভি দেওয়ার আগে,


2

আমি এখনই 18 মিলিয়ন ঠিকানা জিওকোড করছি তাই আমি আমার সেটআপটি ভাগ করতে চাই।

মূলত আমি পোস্টজিআইএস টাইগার জিওকোডার সার্ভার হিসাবে অ্যামাজন ইসি 2 ইনস্ট্যান্ট সেটআপ করার জন্য একটি উত্তরসূরী প্লেবুক ব্যবহার করেছি, তারপরে জিওকোড ঠিকানাগুলি ব্যাচ করতে স্ক্রিপ্টটি ব্যবহার করব, সেগুলি সেন্সাস ব্লকে ম্যাপ করুন।

অ্যামাজন ইসি 2 এর ব্যয়: সর্বনিম্ন প্রয়োজন 180 জি এসএসডি ব্যয় হয় প্রায় 18 ডলার / মাসে। আমার t2.large উদাহরণ মোট মোট about 90 / মাস।

আপনার যদি এসএসডি> 180 জি সহ একটি লিনাক্স বাক্স থাকে তবে আপনি এটি মূলত বিনামূল্যে ব্যবহার করতে পারেন।

আমার গড় পারফরম্যান্স প্রায় 170 ~ 300 এমএস / ভাল মানের ঠিকানা, 400 ~ 600 এমএস / খারাপ মানের ঠিকানা। খারাপ মানের দ্বারা আমি বোঝাতে চাইছি তাদের মধ্যে বেশিরভাগেরই হারিয়ে গেছে বা ভুল শহর, জিপকোড বা এমনকি ভুল ঠিকানা রয়েছে। এই জাতীয় ঠিকানাটি জিওকোডে অনেক বেশি সময় নেয়, তাই আপনার কার্য সম্পাদন ইনপুটটির মানের উপর নির্ভর করে। আমি যে অ্যামাজন ইসি 2 উদাহরণটি ব্যবহার করেছি তা এক মাসে প্রায় 4 মিলিয়ন সত্যই খারাপ ফর্ম্যাটেড ঠিকানা জিওকোড করতে পারে।

আরও তথ্যের জন্য, সিস্টেম সেটআপ এবং স্ক্রিপ্টগুলি সম্পর্কে আমার ব্লগ পোস্টটি দেখুন


1

এডাব্লুএস-এর এখন বেশ কয়েকটি জিওকোডিং সার্ভার রয়েছে। আপনার নিজের সার্ভার পান এবং আপনার ডেটা সেখানে ফেলে দিন। https://aws.amazon.com/marketplace/search/results/ref=dtl_navgno_search_box?page=1&searchTerms=geocode

https://aws.amazon.com/marketplace/pp/B013CW6HOA

https://aws.amazon.com/marketplace/pp/B0112MQ63Y


1

যদি আপনার কর্মপ্রবাহ পাইথনে থাকে তবে জিওপি একটি দুর্দান্ত সমাধান। আপনি আপনার মৌলিক জিওকোডিং যুক্তিটি বিমূর্তভাবে লিখতে পারেন এবং তারপরে অনেক সরবরাহকারীর মধ্যে থেকে বেছে নিতে পারেন (আরকিজিআইএস, বাইদু, বিং, ডেটাবিসি, জিওকোডফর্ম, গাইকোডারডটাস, জিওনামস, গুগল, আইজিএন ফ্রান্স, লাইভএড্রেস, নাভিডাটা, নোমিনিটিম (ওএসএম), ওপেনক্যাপেস্ট, ইয়াহু বোস প্লেস ফাইন্ডার, হোয়াট 3 ওয়ার্ডস, ইয়ানডেক্স ... ফেইও)। আপনি এমনকি এগুলির সমস্তটি ব্যবহার করতে পারেন এবং শেষ পর্যন্ত এমন পয়েন্টটি বেছে নিতে পারেন যা একাধিক জিওকোডিং পরিষেবাদি দ্বারা বৈধতার মাধ্যমে সঠিক হওয়ার সর্বোচ্চ আত্মবিশ্বাস রয়েছে। এই পরিষেবাগুলির অনেকের জন্য নিবন্ধকরণ প্রয়োজন (তবে সমস্ত নয়)। তারা মার্কিন যুক্তরাষ্ট্রে ব্যবহারের জন্য সমানভাবে উপযুক্ত নাও হতে পারে তবে একটি ঝরঝরে পাইথন ফাংশন দিয়ে এটি করার সুবিধাটি হ'ল এটির জন্য আপনাকে নিয়ন্ত্রণ করতে সক্ষম হওয়া উচিত।

একটি সংক্ষিপ্ত উদাহরণ এখানে:

from geopy.geocoders import Nominatim
geolocator = Nominatim(country_bias='New Zealand', timeout=4)
geocoded = geolocator.geocode('Raglan, Waikato', exactly_one=True)
if geocoded is not None:
    # success
    lat = geocoded.latitude
    lon = geocoded.longitude

https://geopy.readthedocs.org/en/1.10.0/

সত্যই কেবল শক্ত অংশটি নিশ্চিত করছে যে আপনার ঠিকানাগুলি খারাপভাবে গঠন করা হয়নি। 20 মিলিয়ন অবস্থানের জিওকোড করতে সম্ভবত এখনও যথেষ্ট পরিমাণ সময় লাগবে, তবে ... এবং এই ধরণের বোঝা সম্ভবত কারও পরিষেবার শর্তাদি লঙ্ঘন করবে। আশা করি এটি যদিও কাউকে সাহায্য করবে।


আমি কি এটি দিয়ে কোনও সিএসভি ব্যবহার করতে পারি?
সালমান

অবশ্যই, আপনি পাইথন সহ এটি পড়েন।
বর্ণমালা

0

যদি আপনার জিওকোড অনুরোধটি প্রতিদিন ২,০০০ এর বেশি না হয়, আপনি গুগল জিওকোডিং এপিআই ব্যবহার করতে পারেন । আপনার একবার এপিআইয়ের দিকে নজর দেওয়া উচিত, এটি জসন বা এক্সএমএল হিসাবে ফলাফলগুলিতে ফিরে আসতে পারে।

ব্যবহারের সীমা:

গুগল জিওকোডিং এপিআই এর ব্যবহার প্রতিদিন 2,500 জিওলোকেশন অনুরোধের ক্যোরি সীমা সাপেক্ষে। (ব্যবসায়ের জন্য গুগল ম্যাপস এপিআই এর ব্যবহারকারীরা প্রতিদিন 100,000 টির জন্য অনুরোধ সম্পাদন করতে পারে))

উদাহরণ:

http://maps.google.com/maps/geo?key=yourkeyhere&output=json&q=520+3rd+Street+San+Francisco+CA

উদাহরণ ফলাফল:

{
  "name": "520 3rd Street San Francisco CA",
  "Status": {
    "code": 200,
    "request": "geocode"
  },
  "Placemark": [ {
    "id": "p1",
    "address": "520 3rd St, San Francisco, Kaliforniya 94107, Amerika Birleşik Devletleri",
    "AddressDetails": {
   "Accuracy" : 8,
   "Country" : {
      "AdministrativeArea" : {
         "AdministrativeAreaName" : "CA",
         "SubAdministrativeArea" : {
            "Locality" : {
               "LocalityName" : "San Francisco",
               "PostalCode" : {
                  "PostalCodeNumber" : "94107"
               },
               "Thoroughfare" : {
                  "ThoroughfareName" : "520 3rd St"
               }
            },
            "SubAdministrativeAreaName" : "San Francisco"
         }
      },
      "CountryName" : "USA",
      "CountryNameCode" : "US"
   }
},
    "ExtendedData": {
      "LatLonBox": {
        "north": 37.7826364,
        "south": 37.7799384,
        "east": -122.3942267,
        "west": -122.3969247
      }
    },
    "Point": {
      "coordinates": [ -122.3955757, 37.7812874, 0 ]
    }
  } ]
}

এবং আপনি গুগল থেকে জিওকোডিংয়ের জন্য কয়েকটি উদাহরণ লিঙ্কটি পরীক্ষা করতে পারেন:

1. একক কোড

2. জিও কোডিং বিপরীত

৩. গুগল জিও কোডিং দিয়ে শুরু

আমি আশা করি এটি আপনাকে সাহায্য করবে


15
এটি 20 মিলিয়ন অবস্থানের জিওকোড করতে কেবল 22 বছর (8,000 দিন) সময় নেয়। সম্পূর্ণ যুক্তিসঙ্গত সমাধান।
অ্যান্ডি ডব্লু

আমি এটি জানি এবং আমি প্রকাশ করেছি যে যদি তার জিওকোড অনুরোধটি প্রতিদিন ২,৫০০ এর বেশি না হয়, তবে তিনি এটি ব্যবহার করতে পারেন ... যদি কোনও সমাধান না পান তবে এটি একটি বিকল্প
আরাগোন

4
এটি পরিষেবার শর্তাদি লঙ্ঘন করে। যদি আপনি গুগল ম্যাপে ফলাফল প্রদর্শন না করেন এটি ইলিগাল। এমনকি যদি আপনি তা করেন তবে আমি "ক্যাশিং আর্গুমেন্ট" পাই যা কিছু লোক 20 মিলিয়ন বৈশিষ্ট্যের জন্য কিছুটা প্রসারিত ব্যবহার করে!
রাগী ইয়াসের বুড়হুম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.