Comment faire pour extraire le nom des phrases à l'aide d'Ouvrir la pnl chunking analyseur

Je suis novice pour le traitement du Langage Naturel.J'ai besoin d'extraire le nom des phrases du texte.Jusqu'à présent j'ai utilisé ouvrir la pnl de segmentation de l'analyseur pour l'analyse de mon texte pour obtenir la structure de l'Arbre.Mais je ne suis pas en mesure d'extraire le nom des phrases à partir de la structure de l'arbre, est-il un modèle d'expression régulière en ouvrir la pnl pour que je puisse l'utiliser pour extraire les expressions nominales.

Ci-dessous le code que j'utilise

    InputStream is = new FileInputStream("en-parser-chunking.bin");
    ParserModel model = new ParserModel(is);
    Parser parser = ParserFactory.create(model);
    Parse topParses[] = ParserTool.parseLine(line, parser, 1);
        for (Parse p : topParses){
                 p.show();}

Ici, je suis sortie comme

(En HAUT (S (S (ADJP (JJ bienvenue) (PP (POUR) (NP (NNP-Grand) (NNP Données.))))) (S (NP (PRP Nous)) (VP (VP (VBP) le (VP (VBG de travail) (PP (sur) (NP (NNP Naturel) (NNP Langue) (NNP-Traitement.pouvez -))))) (NP (DT certains) CD (un) (NN aider)) (NP (PRP us)) (PP (DANS) (S (VP (VBG extraction) (NP (DT) (NN nom) (NNS phrases)) (PP (À partir de) (NP (DT) (NN arbre) (WP stucture.))))))))))

Peut quelques un s'il vous plaît aidez-moi à obtenir le nom des phrases comme NP,NNP,NN etc.Peut quelqu'un me dire de les faire j'ai besoin d'utiliser d'autres NP Chunker pour obtenir les expressions nominales?Est-il une expression régulière pattern pour atteindre le même.

Merci de m'aider sur ce point.

Merci d'avance

Gouse.

InformationsquelleAutor user2024234 | 2013-02-05