Analyser utilisable Adresse, Ville, État, code Postal à partir d'une chaîne

Problème: j'ai un champ d'adresse à partir d'une base de données Access qui a été converti à Sql Server 2005. Ce domaine a tout dans un seul domaine. J'ai besoin d'analyser les différentes sections de l'adresse dans leurs champs dans une table normalisée. J'ai besoin de faire cela pour environ 4 000 enregistrements, et elle doit être reproductible.

Hypothèses:

  1. Assumer une adresse aux états-unis (pour l'instant)

  2. supposons que la chaîne d'entrée contient parfois un destinataire (la personne traitée) et/ou une deuxième adresse de la rue (c'est à dire de la Suite B)

  3. états peut être abrégée de la

  4. code postal pourrait être de série à 5 chiffres ou zip+4

  5. il y a des fautes de frappe dans certains cas

Mise à JOUR: En réponse aux questions posées, les normes n'ont pas été universellement suivie, j'ai besoin de besoin de stocker les valeurs individuelles, et pas seulement de géocodage et d'erreurs moyen de faute de frappe (corrigé ci-dessus)

Des Données De L'Échantillon:

  • A. P. Croll & Fils 2299 Lewes-Georgetown Autoroute, Georgetown, DE 19947

  • 11522 Shawnee Route, Greenwood DE 19950

  • 144 Route des Rois, s.-o. de Dover, DE 19901

  • Intégré Const. Services 2 Penns Façon Suite 405 New Castle, DE 19720

  • Humes Realty 33 Bride de la Crête de la Cour, Lewes, DE 19958

  • Nichols Excavation 2742 Pulaski l'Autoroute Newark, DE 19711

  • 2284 Bryn Sion de la Route, de Smyrne, DE 19904

  • VEI Douvres Carrefour, LLC 1500 Serpentine Road, Suite 100 Baltimore MD 21

  • 580 Nord Dupont Highway Dover, DE 19901

  • P. O. Box 778 Dover, DE 19903

  • Quelques questions: 1. Les délimiteurs? 2. Qu'est-ce que l'ordre des champs dans la chaîne? 3. Ce comportement voulez-vous, dans le cas d'une erreur de données (E. G. pousser adresse dans un seul champ dans la table SQL, laissez les autres en blanc)
  • Merci pour l'échantillon de données!
  • Bonne question et les réponses très intéressantes. Travailler à rebours à partir de zip semble être un thème commun, mais si vous êtes en données brutes, le zip ne peut pas être exacte. Je suppose que la plupart des sites ont un nombre disproportionné d'adresses dans 90210, par exemple.
  • Oui, parce que vous, les Américains, comme de nous enfermer Canadiens par l'exigence d'une "zip code", et de ne pas accepter nos codes postaux, ainsi, nous forçant à entrer dans certains jibberish de contourner le système.... malheureusement, le seul zip je sais, c'est 90210 🙂 Edit: Nevermind... apparemment vous avez vivent à quelques kilomètres de moi, en colombie-britannique. Vous avez probablement faire la même chose, trop 😛
  • Voir ce DONC, la question en faveur d'un vaste panorama.
InformationsquelleAutor Rob Allen | 2008-08-19