L'extraction de groupes nominaux à partir d'un fichier texte à l'aide de stanford tapé analyseur
J'ai un texte qui je veux extraire les expressions nominales. Je peux facilement obtenir de l'tapé analyseur syntaxique pour le texte que j'ai, mais vous vous demandez comment je peux extraire le syntagme nominal dans le texte ?
J'ai essayé d'obtenir stanford tapé parser, mais encore à se demander lequel des balises est représenté le syntagme !
U besoin des outils de TALN. cochez cette question stackoverflow.com/questions/1889675/...
Pourquoi êtes-vous à l'aide d'un analyseur de dépendance en premier lieu? Normal arbre d'analyse générateur semble que le chemin à parcourir pour ce que vous voulez.
découvrez mon code pour sortir de la dépendance info. Ça va être un peu différent avec syntaxique, l'analyse, mais vous pouvez le comprendre avec un peu de debug boucles: gist.github.com/2562754
U besoin des outils de TALN. cochez cette question stackoverflow.com/questions/1889675/...
Pourquoi êtes-vous à l'aide d'un analyseur de dépendance en premier lieu? Normal arbre d'analyse générateur semble que le chemin à parcourir pour ce que vous voulez.
découvrez mon code pour sortir de la dépendance info. Ça va être un peu différent avec syntaxique, l'analyse, mais vous pouvez le comprendre avec un peu de debug boucles: gist.github.com/2562754
OriginalL'auteur S Gaber | 2012-06-11
Vous devez vous connecter pour publier un commentaire.
Vous pouvez extraire les expressions nominales de l'Arbre à l'aide de code suivant. Il suppose que vous avez analysé phrase stockées dans analyser (c'est à dire analyser est sortie de LexicalizedParser classe d'appliquer la méthode)
OriginalL'auteur alan turing
Essayer cette lien. Je ne suis pas sûr de savoir si le stanford pos tagger et le tagger disponibles dans la corenlp sont les mêmes ou pas, mais j'ai trouvé ce lien pour être plus utile.
Après le PoS Tagging, vous aurez pour détecter les schémas
(Adjectif | Substantif)* (Nom Préposition)? (Adjectif | Substantif)* Nom
Essayer cette lien pour quelques détails sur la phrase Nominale de détection.
OriginalL'auteur MARK
Vous pouvez utiliser Stanford de Base de la PNL pour les POS tagging. Vous pouvez trouver un exemple de code à http://nlp.stanford.edu/software/corenlp.shtml#Usage qui pourrait être un bon point de départ pour l'expérimentation. Vous devez donner à marquer, split et pos comme les propriétés. Cette fonction génère une liste de jetons avec leurs étiquettes.
L'ensemble de la liste des balises peuvent être viwed à http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html. Tous les le nom des balises serait de commencer avec NN. L'exécution de cette vérification de vous donner le nécessaire jetons.
OriginalL'auteur zingler