আমি যখন একটি ঠিকানা যাচাইকরণ সংস্থার জন্য কাজ করেছি তখন আমি এই প্রশ্নটি অনেক দেখেছি। একই প্রশ্নটি দিয়ে চারপাশে অনুসন্ধান করা প্রোগ্রামারদের এটি আরও অ্যাক্সেসযোগ্য করার জন্য আমি এখানে উত্তর পোস্ট করছি। আমি যে সংস্থাটিতে কোটি কোটি ঠিকানা প্রক্রিয়াকরণ করেছি এবং আমরা প্রক্রিয়াটিতে অনেক কিছু শিখেছি।
প্রথমত, আমাদের ঠিকানাগুলি সম্পর্কে কয়েকটি বিষয় বুঝতে হবে।
ঠিকানাগুলি নিয়মিত হয় না
এর অর্থ হ'ল নিয়মিত ভাব প্রকাশের বাইরে। আমি এগুলি সব কিছু দেখেছি, সাধারণ নিয়মিত প্রকাশ থেকে যা খুব নির্দিষ্ট বিন্যাসে ঠিকানার সাথে মেলে, এটিতে:
/ \ S + (\ ঘ {2,5} \ S +) ([একটি | পি]?! মি \ b হল) (([ZA-জেড | \ S +] {1,5}) {1,2}) ? ([\ গুলি |, |।]) (([zA-জেড | \ S +] {1,30}) {1,4})? (আদালত | CT | রাস্তায় | St | ড্রাইভ | ড | গলি | Ln | রাস্তা | য় | Blvd) ([\ গুলি |, | |;।]?) (([zA-জেড | \ S +] {1,30}) {1,2}) ([ \ গুলি |, |।]) \ বি (এ কে |? আওয়ামী লীগ | শিরোণামে | জেড | সিএ | সিও | সিটি | ডিসি | ডেন | এফএল | জি | জি ইউ | হাই | আইএ | আইডি | আইএল | ইন | কে এস | বিভাগ | এলএ | এমএ | এমডি | আমাকে | এমআই | এম এন | এমও | মাইক্রোসফট | এমটি | এনসি | এনডি | এনই | NH, | এনজে | এনএম | এনভি | এনওয়াই | বাড়ি | ঠিক আছে | অথবা | পিএ | সশ্রম | এসসি | এসডি | টি এন | টেক্সাস | কেন্দ্রশাসিত অঞ্চল | ভিএ | ষষ্ঠ |, VT | বিভাগ | ওয়েস্ট ইন্ডিজ | আরো | দেশ অনুযায়ী) ([\ গুলি |, |।] + +) (\ S + \ ঘ {5}) ([\ গুলি |, |।]? + +); / i
... এটি যেখানে 900+ লাইন-শ্রেণীর ফাইলটি আরও বেশি ম্যাচের জন্য ফ্লাইতে একটি সুপারম্যাসিভ নিয়মিত প্রকাশ তৈরি করে। আমি এগুলিকে সুপারিশ করি না (উদাহরণস্বরূপ, এখানে উপরের রেইগেক্সের একটি ঝাঁকুনি, এটি প্রচুর ভুল করে )। এটি কাজ করার সহজ কোনও যাদু সূত্র নেই isn't তত্ত্ব এবং দ্বারা তত্ত্ব, এটি একটি রেগুলার এক্সপ্রেশনের সাথে ঠিকানাগুলির সাথে মেলানোর জন্য সম্ভব নয়।
ইউএসপিএস পাবলিকেশন ২৮ তাদের সমস্ত কীওয়ার্ড এবং ভেরিয়েটনের সাহায্যে ঠিকানার অনেকগুলি ফর্ম্যাট ডকুমেন্ট করে। সবচেয়ে খারাপ, ঠিকানাগুলি প্রায়শই অস্পষ্ট থাকে। শব্দের অর্থ একাধিক জিনিসের অর্থ হতে পারে ("সেন্ট" "সেন্ট" বা "রাস্তার" হতে পারে) এবং এমন শব্দ রয়েছে যা আমি নিশ্চিত যে তারা আবিষ্কার করেছিলেন। (কে জানত যে "স্ট্রেন্যু" একটি রাস্তার প্রত্যয়?)
আপনার এমন কিছু কোডের দরকার যা সত্যিকার অর্থে ঠিকানাগুলি বোঝে এবং যদি সেই কোডটি উপস্থিত থাকে তবে এটি একটি ব্যবসায়ের গোপনীয়তা। আপনি সম্ভবত এটির মধ্যে থাকলে আপনি সম্ভবত নিজের রোল করতে পারেন।
ঠিকানাগুলি অপ্রত্যাশিত আকার এবং আকারে আসে
এখানে কয়েকটি অনুমোদিত (তবে সম্পূর্ণ) ঠিকানা রয়েছে:
1) 102 main street
Anytown, state
2) 400n 600e #2, 52173
3) p.o. #104 60203
এমনকি এগুলি সম্ভবত বৈধ:
4) 829 LKSDFJlkjsdflkjsdljf Bkpw 12345
5) 205 1105 14 90210
স্পষ্টতই, এগুলি মানসম্মত নয়। বিরামচিহ্ন এবং লাইন বিরতি গ্যারান্টিযুক্ত নয়। যা চলছে তা এখানে:
নম্বর 1 সম্পূর্ণ হয়েছে কারণ এতে রাস্তার ঠিকানা এবং একটি শহর এবং রাজ্য রয়েছে। সেই তথ্যের সাথে, ঠিকানাটি সনাক্ত করার পক্ষে যথেষ্ট রয়েছে এবং এটিকে "বিতরণযোগ্য" হিসাবে বিবেচনা করা যেতে পারে (কিছু মানীর সাথে)।
নম্বর 2 সম্পূর্ণ, কারণ এটিতে একটি রাস্তার ঠিকানা (মাধ্যমিক / ইউনিট নম্বর সহ) এবং 5-সংখ্যার জিপ কোডও রয়েছে, যা কোনও ঠিকানা সনাক্ত করার জন্য যথেষ্ট।
3 নম্বর একটি সম্পূর্ণ পোস্ট অফিস বক্স ফর্ম্যাট, কারণ এটিতে একটি জিপ কোড রয়েছে।
৪ নম্বরটিও সম্পূর্ণ, কারণ জিপ কোডটি অনন্য , যার অর্থ একটি ব্যক্তিগত সত্তা বা কর্পোরেশন সেই ঠিকানার জায়গাটি কিনেছে। একটি অনন্য জিপ কোড উচ্চ-ভলিউম বা কেন্দ্রীভূত বিতরণ স্থানগুলির জন্য। জিপ কোড 12345 তে সম্বোধিত যেকোন কিছুই এনওয়াইয়ের স্কেনেকটাডি জেনারেল ইলেকট্রিকের কাছে যায়। এই উদাহরণটি বিশেষত কারও কাছে পৌঁছবে না, তবে ইউএসপিএস এখনও এটি সরবরাহ করতে সক্ষম হবে।
5 নম্বরটিও সম্পূর্ণ, বিশ্বাস করুন বা না করুন। কেবলমাত্র এই সংখ্যাগুলির সাথে, সমস্ত সম্ভাব্য ঠিকানাগুলির একটি ডাটাবেসের বিরুদ্ধে পার্স করার সময় পুরো ঠিকানাটি সন্ধান করা যেতে পারে। অনুপস্থিত দিকনির্দেশক, গৌণ ডিজাইনার এবং জিপ + 4 কোড পূরণ করা তুচ্ছ হয় যখন আপনি প্রতিটি সংখ্যাকে উপাদান হিসাবে দেখেন। এটি দেখতে দেখতে সম্পূর্ণরূপে প্রসারিত এবং মানকৃত হয়েছে:
205 এন 1105 ডাব্লু এপ্ট 14
বেভারলি হিলস সিএ 90210-5221
ঠিকানা ডেটা আপনার নিজস্ব নয়
বেশিরভাগ দেশে যারা লাইসেন্সপ্রাপ্ত বিক্রেতাদের অফিসিয়াল ঠিকানার ডেটা সরবরাহ করে, ঠিকানা ডেটা নিজেই পরিচালনা সংস্থাটির অন্তর্ভুক্ত। মার্কিন যুক্তরাষ্ট্রে ইউএসপিএসের ঠিকানাগুলির মালিকানা রয়েছে। কানাডা পোস্ট, রয়েল মেল এবং অন্যদের ক্ষেত্রেও এটি একই সত্য, যদিও প্রতিটি দেশই মালিকানাটিকে কিছুটা ভিন্নভাবে প্রয়োগ করে বা সংজ্ঞায়িত করে। এটি জানা গুরুত্বপূর্ণ, কারণ এটি সাধারণত ঠিকানা ডাটাবেসটিকে রিভার্স-ইঞ্জিনিয়ারিং করতে নিষেধ করে। কীভাবে ডেটা অর্জন, সঞ্চয় এবং ব্যবহার করতে হয় সে সম্পর্কে আপনাকে সতর্কতা অবলম্বন করতে হবে।
গুগল ম্যাপস দ্রুত ঠিকানা ঠিক করার জন্য সাধারণ পদে পদে পদে পদে পদক্ষেপ গ্রহণ করা যায়, তবে টিওএস বরং প্রতিরোধমূলক; উদাহরণস্বরূপ, আপনি কোনও গুগল ম্যাপ না দেখিয়ে তাদের ডেটা বা এপিআইগুলি ব্যবহার করতে পারবেন না, এবং অ-কমিক্রেটিভ উদ্দেশ্যে কেবল (আপনি অর্থ প্রদান না করে), এবং আপনি ডেটা সংরক্ষণ করতে পারবেন না (অস্থায়ী ক্যাচিং বাদে)। বোধ হয়। গুগলের ডেটা বিশ্বের সেরা কিছু। তবে গুগল ম্যাপস ঠিকানাটি যাচাই করে না । একটি ঠিকানা অস্তিত্ব নেই, এটা এখনও তোমাকে দেখাব যেখানে ঠিকানা হবে যদি এটা হতে করেনি থাকবেই (আপনার নিজের রাস্তায় এটা চেষ্টা; একটি বাড়ি সংখ্যা আপনাকে জানাতে চাই যে অস্তিত্ব নেই ব্যবহার করুন)। এটি কখনও কখনও দরকারী, তবে সে সম্পর্কে সচেতন থাকুন।
নমিনিটিমের ব্যবহার নীতিটি একইভাবে সীমাবদ্ধ, বিশেষত উচ্চ পরিমাণ এবং বাণিজ্যিক ব্যবহারের জন্য, এবং ডেটা বেশিরভাগ বিনামূল্যে উত্স থেকে আঁকা হয়, তাই এটি যথাযথভাবে রক্ষণাবেক্ষণ করা হয় না (যেমন উন্মুক্ত প্রকল্পগুলির প্রকৃতি) - তবে এটি এখনও উপযুক্ত হতে পারে আপনার চাহিদা. এটি একটি দুর্দান্ত সম্প্রদায় দ্বারা সমর্থিত।
ইউএসপিএসের নিজেই একটি এপিআই রয়েছে তবে এটি অনেকটাই নিচে নেমে আসে এবং কোনও গ্যারান্টি বা সমর্থন ছাড়াই আসে। এটি ব্যবহার করাও কঠিন হতে পারে। কিছু লোক কোনও সমস্যা ছাড়াই অল্প পরিমাণে এটি ব্যবহার করে। তবে এটি সহজেই মিস করা যায় যে ইউএসপিএসের প্রয়োজন হয় যে আপনি তাদের এপিআই কেবল তাদের মাধ্যমে শিপিংয়ের জন্য ঠিকানাগুলি নিশ্চিত করার জন্য ব্যবহার করুন।
লোকেরা আশা করে ঠিকানাগুলি শক্ত হবে
দুর্ভাগ্যক্রমে, আমরা আমাদের সমাজকে ঠিকানাগুলি জটিল হওয়ার আশা করার শর্ত দিয়েছি। এটি সম্পর্কে পুরো ইন্টারনেটে কয়েক ডজন ভাল ইউএক্স নিবন্ধ রয়েছে, তবে আসল বিষয়টি হ'ল আপনার যদি পৃথক ক্ষেত্রগুলির সাথে ঠিকানা ফর্ম থাকে তবে এটি ব্যবহারকারীরা প্রত্যাশা করেন, যদিও এটি প্রান্ত-কেস অ্যাড্রেসগুলির পক্ষে শক্ত করে না যা এটি ফিট করে না that ফর্ম্যাটটি ফর্মটি প্রত্যাশা করছে, বা ফর্মটির এমন ক্ষেত্র প্রয়োজন যা এটি করা উচিত নয়। অথবা ব্যবহারকারীরা তাদের ঠিকানার নির্দিষ্ট অংশটি কোথায় রাখবেন তা জানেন না।
আমি এই দিনগুলিতে চেকআউট ফর্মগুলির খারাপ ইউএক্স সম্পর্কে অব্যাহত রাখতে পারলাম, তবে পরিবর্তে আমি কেবল এটিই বলব যে ঠিকানাগুলিকে একটি একক ক্ষেত্রে একত্রিত করা একটি স্বাগত পরিবর্তন হবে - লোকেরা তাদের ঠিকানাকে কীভাবে ফিট করে তা টাইপ করতে সক্ষম হবে বরং আপনার দীর্ঘ ফর্মটি বের করার চেষ্টা করার চেয়ে। যাইহোক, এই পরিবর্তনটি অপ্রত্যাশিত হবে এবং ব্যবহারকারীরা প্রথমে এটি কিছুটা ঝাঁকুনির মতো দেখতে পাবেন। শুধু সচেতন হতে হবে।
দেশের মাঠকে সামনে রেখে, ঠিকানার আগে, এই ব্যথার কিছুটা অংশ হ্রাস করা যায়। যখন তারা প্রথমে দেশের ক্ষেত্রটি পূরণ করে, আপনি কীভাবে আপনার ফর্মটি উপস্থিত করবেন তা জানেন। সম্ভবত আপনার এককক্ষেত্রের মার্কিন ঠিকানাগুলির সাথে ডিল করার ভাল উপায় রয়েছে, সুতরাং যদি তারা মার্কিন যুক্তরাষ্ট্র নির্বাচন করে তবে আপনি আপনার ফর্মটি একটি একক ক্ষেত্রে হ্রাস করতে পারবেন, অন্যথায় উপাদান ক্ষেত্রগুলি দেখান। চিন্তা করার মতো বিষয়গুলি!
এখন আমরা জানি কেন এটি শক্ত; এ ব্যাপারে আপনি কি করতে পারেন?
ইউএসপিএস গ্রাহকদের যাচাই করা ঠিকানা সরবরাহের জন্য CASS ™ শংসাপত্র নামক একটি প্রক্রিয়ার মাধ্যমে বিক্রেতাদের লাইসেন্স দেয়। এই বিক্রেতাদের মাসিক আপডেট হওয়া ইউএসপিএস ডাটাবেসে অ্যাক্সেস রয়েছে। তাদের সফ্টওয়্যারটি অবশ্যই শংসাপত্রের জন্য কঠোর মান মেনে চলতে হবে এবং তাদের প্রায়শই উপরে বর্ণিত সীমাবদ্ধ পদগুলির সাথে চুক্তির প্রয়োজন হয় না।
অনেকগুলি সিএসএস-প্রত্যয়িত সংস্থাগুলি রয়েছে যা তালিকাগুলি প্রক্রিয়াকরণ করতে পারে বা এপিআইগুলি রাখতে পারে: মেলিসা ডেটা, এক্সপেরিয়ান কিউএএস, এবং স্মার্টস্ট্রিস্টের কয়েকটি নাম লেখানোর জন্য।
("বিজ্ঞাপন" এর ঝাঁকুনির কারণে আমি এই মুহুর্তে আমার উত্তরটি কেটে ফেলেছি you আপনার পক্ষে কার্যকর সমাধান খুঁজে পাওয়া আপনার পক্ষে))
সত্য: সত্যই, ভাবেন, আমি এই সংস্থাগুলির কোনওটিতেই কাজ করি না। এটি কোনও বিজ্ঞাপন নয়।