Installer par programme NLTK corpus / modèles, c'est à dire sans interface graphique downloader?
Mon projet utilise le NLTK. Comment puis-je liste le projet de corpus & modèle d'exigences, de sorte qu'ils peuvent être installés automatiquement? Je ne veux pas à cliquer sur le nltk.download()
GUI, l'installation de paquets un par un.
Aussi, un moyen de figer cette même liste d'exigences (comme pip freeze
)?
Vous devez vous connecter pour publier un commentaire.
La NLTK site ne liste à une interface de ligne de commande pour télécharger les paquets et les collections au bas de cette page :
http://www.nltk.org/data
L'utilisation de lignes de commande varie en fonction de la version de Python que vous utilisez, mais sur mon Python2.6 installer, j'ai remarqué qu'il me manquait le " spanish_grammar modèle et cela a bien fonctionné:
Vous mentionnez inscription du projet corpus et les exigences des modèles et, bien que je ne suis pas sûr de la façon de automagiquement le faire, j'ai pensé que je serait au moins partager.
Pour installer tous les NLTK corps & modèles:
Sinon, sous Linux, vous pouvez utiliser:
Remplacer
all
parpopular
si vous voulez juste pour la liste la plus populaire de corpus & modèles.Vous pouvez également parcourir le corps & par les modèles de la ligne de commande:
En plus de l'option de ligne de commande déjà mentionné, vous pouvez installer par programme NLTK de données dans votre script Python par l'ajout d'un argument à l'
download()
fonction.Voir le
help(nltk.download)
texte, en particulier:Je peux confirmer que cela fonctionne pour le téléchargement d'un package à un moment, ou lorsqu'il est passé d'un
list
outuple
.Vous pouvez également essayer de télécharger une déjà téléchargé un paquet sans problèmes:
Aussi, il semble que la fonction renvoie une valeur booléenne que vous pouvez utiliser pour voir si oui ou non le téléchargement réussi:
J'ai réussi à installer le corpus et les modèles à l'intérieur d'un répertoire personnalisé en utilisant le code suivant:
cela permettra d'installer "tous" corpus/modèles à l'intérieur de
/path/to/dir
, et je sais NLTK où chercher pour elle (data.path.append
).Vous ne pouvez pas «geler» les données dans un fichier, mais vous pouvez ajouter ce code à votre
__init__
en plus de venir de code pour vérifier si les fichiers sont déjà là.