stanford de base de la pnl sortie java

Je suis un débutant en Java et Stanford trousse d'outils de la PNL et d'essayer de les utiliser pour un projet. Plus précisément, je suis en train d'utiliser Stanford Corenlp trousse d'outils pour annoter un texte (avec Netbeans et pas de ligne de commande) et j'ai essayé d'utiliser le code fourni sur http://nlp.stanford.edu/software/corenlp.shtml#Usage (à l'Aide de la Stanford CoreNLP API).. la question est: quelqu'un peut me dire comment je peux obtenir le résultat dans un fichier afin que je puisse poursuivre le processus il?

J'ai essayé de l'impression de graphiques et de la phrase à la console, juste pour voir le contenu. Qui fonctionne. En fait ce que j'avais besoin de retourner le document annoté, de sorte que je peux l'appeler de ma classe principale et la sortie d'un fichier texte (si c'est possible). Je suis en train de regarder dans l'API de stanford corenlp, mais je ne sais pas vraiment quelle est la meilleure façon de nous retourner ce genre d'informations, étant donné mon manque d'expérience.

Voici le code:

Properties props = new Properties();
    props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");
    StanfordCoreNLP pipeline = new StanfordCoreNLP(props);

    //read some text in the text variable
    String text = "the quick fox jumps over the lazy dog";

    //create an empty Annotation just with the given text
    Annotation document = new Annotation(text);

    //run all Annotators on this text
    pipeline.annotate(document);

    //these are all the sentences in this document
    //a CoreMap is essentially a Map that uses class objects as keys and has values with custom types
    List<CoreMap> sentences = document.get(SentencesAnnotation.class);

    for(CoreMap sentence: sentences) {
      //traversing the words in the current sentence
      //a CoreLabel is a CoreMap with additional token-specific methods
      for (CoreLabel token: sentence.get(TokensAnnotation.class)) {
        //this is the text of the token
        String word = token.get(TextAnnotation.class);
        //this is the POS tag of the token
        String pos = token.get(PartOfSpeechAnnotation.class);
        //this is the NER label of the token
        String ne = token.get(NamedEntityTagAnnotation.class);       
      }

      //this is the parse tree of the current sentence
      Tree tree = sentence.get(TreeAnnotation.class);

      //this is the Stanford dependency graph of the current sentence
      SemanticGraph dependencies = sentence.get(CollapsedCCProcessedDependenciesAnnotation.class);
    }

    //This is the coreference link graph
    //Each chain stores a set of mentions that link to each other,
    //along with a method for getting the most representative mention
    //Both sentence and token offsets start at 1!
    Map<Integer, CorefChain> graph = 
      document.get(CorefChainAnnotation.class);
  • J'ai essayé de l'impression de graphiques et de la phrase à la console, juste pour voir le contenu. Qui fonctionne. En fait ce que j'avais besoin de retourner le document annoté, de sorte que je peux l'appeler de ma classe principale et la sortie d'un fichier texte (si c'est possible). Je suis en train de regarder dans l'API de stanford corenlp, mais je ne sais pas vraiment quelle est la meilleure façon de nous retourner ce genre d'informations, étant donné mon manque d'expérience.. je vous Remercie à l'avance
  • J'ai ajouté que des informations à la question. Dans l'avenir, n'hésitez pas à faire vous-même en passant par le montage (vous obtenez même un badge!)
  • merci!!!! @SomeKittens
  • pouvez-vous poster le code?
  • Pouvez-vous s'il vous plaît dites-moi comment vous avez exécuté sur netbeans?
InformationsquelleAutor SophieM | 2012-08-06