La génération aléatoire des phrases de texte personnalisé en Python NLTK?

Je vais avoir des ennuis avec la NLTK sous Python, plus précisément le .méthode generate ().

générer(auto, longueur=100)

Impression de texte aléatoire, généré à l'aide d'un modèle de langage trigramme.

Paramètres:

   * length (int) - The length of text to generate (default=100)

Voici une version simplifiée de ce que je cherche.

import nltk

words = 'The quick brown fox jumps over the lazy dog'
tokens = nltk.word_tokenize(words)
text = nltk.Text(tokens)
print text.generate(3)

Ce sera toujours générer

Building ngram index...
The quick brown
None

Plutôt que de construire une phrase aléatoire de mots.

Voici ma sortie quand je fais

print text.generate()

Building ngram index...
The quick brown fox jumps over the lazy dog fox jumps over the lazy
dog dog The quick brown fox jumps over the lazy dog dog brown fox
jumps over the lazy dog over the lazy dog The quick brown fox jumps
over the lazy dog fox jumps over the lazy dog lazy dog The quick brown
fox jumps over the lazy dog the lazy dog The quick brown fox jumps
over the lazy dog jumps over the lazy dog over the lazy dog brown fox
jumps over the lazy dog quick brown fox jumps over the lazy dog The
None

Nouveau départ avec le même texte, mais a ensuite divers. J'ai aussi essayé d'utiliser le premier chapitre, à partir de 1984 d'Orwell. Encore que toujours commence avec le premier 3 jetons (dont l'une est un espace dans ce cas) et puis continue à générer de façon aléatoire texte.

Ce que je fais mal?

OriginalL'auteur James McMahon | 2009-07-19