Base de données commune des alias de noms / pseudos des gens
Je suis impliqué avec un SQL /.NET projet de recherche à travers une liste de noms. Je suis à la recherche d'un moyen de retourner des résultats similaires d'abord des noms de personnes. Si la recherche pour "Tom", les résultats comprennent Thom, Thomas, etc. Il n'est pas important que ce soit un fichier ou un service web. Exemple De Conception:
Table "Names" has Name and NameID
Table "Nicknames" has Nickname, NicknameID and NameID
Exemple de sortie:
You searched for "John Smith"
You show results Jon Smith, Jonathan Smith, Johnny Smith, ...
Sont là les bases de données là-bas (public ou payant) adaptés à ce type de tâche à remplir une relation entre des surnoms et noms?
- Pourquoi la clôture des votes? La base est une ressource importante pour ce projet de programmation.
- Questions nous demandant de recommander ou trouver un livre, un outil, une bibliothèque de logiciels, tutoriel ou d'autres hors-site de ressources sont hors sujet pour Stack Overflow car ils ont tendance à attirer les opinions des réponses et le spam. Au lieu de cela, décrire le problème et ce qui a été fait jusqu'à présent pour le résoudre.
Vous devez vous connecter pour publier un commentaire.
Une recherche google sur "Base de données des Surnoms" tourné pdNickName (pour payer).
En outre, je pense que vous avez seulement besoin d'une seule table pour ce travail, non pas de deux, avec NameID, Nom, et MasterNameID. Tous les pseudos aller dans la colonne Nom. Un nom est considéré comme "canoniques" un. Tous les pseudo enregistrements utilisent le MasterNameID colonne de point de retour pour cet enregistrement, avec le nom canonique pointe sur lui-même.
Vos deux schéma de la table contient pas d'informations complémentaires et, selon la façon dont vous remplissez le surnom de table, vous pourriez avoir besoin un code supplémentaire pour gérer les cas canoniques.
Je suis en ajoutant une autre source pour toute personne qui vient à travers cette question par l'intermédiaire de Google. Ce projet fournit une très bonne recherche à cette fin.
https://github.com/carltonnorthern/nickname-and-diminutive-names-lookup
C'est un peu plus simple et moins complète que pdNickName mais d'un autre côté c'est gratuit et facile à utiliser.
Je viens de trouver ce site.
Il semble que vous pouvez script assez facilement.
http://www.behindthename.com/php/extra.php?terms=steve&extra=r&sexe=m
Je souhaite juste que je pourrais auto étroit de ce anglais..
Un autre nom commercial, la base de données correspondant est: http://www.basistech.com/name-indexer/
Il semble tout à fait professionnel (bien que potentiellement coûteux).
Ils prétendent soutenir les langues suivantes:
Anglais, Arabe, Chinois (Simplifié), Chinois (Traditionnel), Persan (Farsi /Dari), Anglais, Coréen, Japonais, Pachtou, Le Russe, Ourdou
Ici est un dépôt github du csv de noms associés, et vous pouvez contribuer en retour:
Les premières lignes montrent la format:
Il y a une base de données appelée pdNicknames (qui se trouve à http://www.peacockdata2.com/products/pdnickname/). Il contient tout ce dont vous avez besoin, à un coût de $500.
Format similaire comme Stan James csv, mais plié en deux façons pour les recherches:
Nom surnom: https://github.com/MrCsabaToth/SOEMPI/blob/master/openempi/conf/name_to_nick.csv
Pseudo: nom: https://github.com/MrCsabaToth/SOEMPI/blob/master/openempi/conf/nick_to_name.csv
Pour sélectionner la ressemblance de nom d'usage: (voir MSDN)