Trouver tous les sites / villes / lieux dans un texte

Si j'ai un texte contenant par exemple un article d'un journal en langue catalane, comment pourrais-je trouver toutes les villes de ce texte?

J'ai été regarder le paquet nltk pour python et j'ai téléchargé le corpus de langue catalane (nltk.le corpus.cess_cat).

Ce que j'ai en ce moment:
J'ai installé tout le nécessaire de nltk.télécharger(). Un exemple de ce que j'ai en ce moment:

te = nltk.word_tokenize('Tots els gats son de Sant Cugat del Valles.')

nltk.pos_tag(te)

La ville est "Sant Cugat del Valles'. Ce que je reçois de la sortie est:

[('Tots', 'NNS'),
 ('els', 'NNS'),
 ('gats', 'NNS'),
 ('son', 'VBP'),
 ('de', 'IN'),
 ('Sant', 'NNP'),
 ('Cugat', 'NNP'),
 ('del', 'NN'),
 ('Valles', 'NNP')]

NNP semble indiquer des noms dont la première lettre est en majuscule. Est-il un moyen de trouver des lieux ou villes, et pas de tous les noms?
Merci

Avez-vous déjà essayé quelque chose? Si oui, où avez-vous coincé?
J'ai installé tout le nécessaire de nltk.télécharger(). Un exemple de ce que j'ai en ce moment: te = nltk.word_tokenize('Tots els agcs fils de Sant Cugat del Valles.') nltk.pos_tag(te) de La ville est "Sant Cugat del Valles'. Ce que je reçois de la sortie est de: [('-', 'NSS'), ('els', 'NSS'), ('chats', 'NSS'), ('fils', 'VBP'), ('de', 'À'), ('Sant', 'NNP'), ('Cugat', 'NNP'), ('del', 'NN'), ('Valles', 'NNP')]
Devrais-je obtenir tous les PNN et qui seront les villes et les lieux? Ou devrais-je envisager d'autres commandes à partir de nltk? - Je répondre à cela parce que NNP semble indiquer uniquement les noms qui commencent par majus.

OriginalL'auteur sardanes | 2015-05-10