Analyser le sens du texte

Je me rends compte c'est un vaste sujet, mais je suis à la recherche d'un bon primer sur l'analyse de la signification du texte, idéalement en Python. Comme un exemple de ce que je cherche à faire, si un utilisateur fait un post de blog comme:

"Manny Ramirez fait son retour pour la Dodgers aujourd'hui contre les Astros de Houston",

ce qui est un poids léger/moyen facile d'obtenir les noms d'une peine? Pour commencer, je pense que je ferais limite pour les noms propres, mais je ne voudrais pas être limitée à ce qui (et je ne veux pas compter sur une simple regex qui n'assume rien de ce Titre Plafonné est un nom propre).

À faire de cette question encore pire, ce sont les choses que je ne demande pas que je devrais être? Ai-je besoin d'un corpus de mots existants pour commencer? Ce que l'analyse lexicale choses que j'ai besoin de savoir pour faire ce travail? Je l'ai fait venir à travers une autre question sur le sujet et je suis creuser par le biais de ces ressources.

source d'informationauteur Tom | 2009-07-17