Comment faire pour extraire le nom des phrases à l'aide d'Ouvrir la pnl chunking analyseur
Je suis novice pour le traitement du Langage Naturel.J'ai besoin d'extraire le nom des phrases du texte.Jusqu'à présent j'ai utilisé ouvrir la pnl de segmentation de l'analyseur pour l'analyse de mon texte pour obtenir la structure de l'Arbre.Mais je ne suis pas en mesure d'extraire le nom des phrases à partir de la structure de l'arbre, est-il un modèle d'expression régulière en ouvrir la pnl pour que je puisse l'utiliser pour extraire les expressions nominales.
Ci-dessous le code que j'utilise
InputStream is = new FileInputStream("en-parser-chunking.bin");
ParserModel model = new ParserModel(is);
Parser parser = ParserFactory.create(model);
Parse topParses[] = ParserTool.parseLine(line, parser, 1);
for (Parse p : topParses){
p.show();}
Ici, je suis sortie comme
(En HAUT (S (S (ADJP (JJ bienvenue) (PP (POUR) (NP (NNP-Grand) (NNP Données.))))) (S (NP (PRP Nous)) (VP (VP (VBP) le (VP (VBG de travail) (PP (sur) (NP (NNP Naturel) (NNP Langue) (NNP-Traitement.pouvez -))))) (NP (DT certains) CD (un) (NN aider)) (NP (PRP us)) (PP (DANS) (S (VP (VBG extraction) (NP (DT) (NN nom) (NNS phrases)) (PP (À partir de) (NP (DT) (NN arbre) (WP stucture.))))))))))
Peut quelques un s'il vous plaît aidez-moi à obtenir le nom des phrases comme NP,NNP,NN etc.Peut quelqu'un me dire de les faire j'ai besoin d'utiliser d'autres NP Chunker pour obtenir les expressions nominales?Est-il une expression régulière pattern pour atteindre le même.
Merci de m'aider sur ce point.
Merci d'avance
Gouse.
Vous devez vous connecter pour publier un commentaire.
La
Parse
objet est un arbre; vous pouvez utilisergetParent()
etgetChildren()
etgetType()
pour naviguer dans l'arborescence.NP
dans ce domaine ?si vous voulez seulement les expressions nominales, puis utilisez la phrase chunker plutôt que l'arbre de l'analyseur.
le code est quelque chose comme ceci (vous avez besoin pour obtenir le modèle de l'emplacement où vous avez trouvé le modèle d'analyseur)
ensuite, regardez l'étiquette de tableau pour les types que vous voulez
Continuera de votre code lui-même .
Ce programme bloc de fournir tout le syntagme nominal dans la phrase.
Utilisation getTagNodes() méthode pour obtenir les Jetons et ses types