Ressources u'tokenizers/punkt/anglais.pickle " introuvable
Mon Code:
import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
Message d'ERREUR:
[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load
opened_resource = _open(resource_url)
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open
return find(path_, path + ['']).open()
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find
raise LookupError(resource_not_found)
LookupError:
Resource u'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource:
>>>nltk.download()
Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''
J'essaie de l'exécuter ce programme en machine Unix:
Que par le message d'erreur, je me suis connecté en python shell à partir de ma machine unix ensuite, j'ai utilisé les commandes ci-dessous:
import nltk
nltk.download()
et ensuite, j'ai téléchargé toutes les choses à l'aide de d en bas du chargeur et de la l - liste des options, mais le problème persiste.
J'ai essayé de mon mieux pour trouver la solution sur internet, mais j'ai eu la même solution, ce que j'ai fait comme je l'ai mentionné dans mon étapes ci-dessus.
- double possible de Échec de chargement de l'anglais.cornichon avec nltk.les données.charger
Vous devez vous connecter pour publier un commentaire.
À ajouter à alvas réponse, vous pouvez télécharger uniquement les
punkt
corpus:Téléchargement
all
sonne comme exagéré pour moi. À moins que vous le souhaitez.Si vous êtes à la recherche de télécharger le
punkt
modèle:Si vous n'êtes pas certaine de données/modèle dont vous avez besoin, vous pouvez installer le populaire ensembles de données, les modèles et les marqueurs de NLTK:
Avec la commande ci-dessus, il n'est pas nécessaire d'utiliser l'interface graphique pour télécharger les ensembles de données.
J'ai la solution:
une fois le NLTK Downloader commence
d) Télécharger l) de la Liste u) mise à Jour c) Config h) Aider à q) Quitter
Downloader> d
Télécharger le paquet (l=liste; x=annuler)?
Identificateur> punkt
À partir du shell, vous pouvez exécuter la commande:
Si vous souhaitez installer le populaire NLTK corpus/modèles:
Si vous souhaitez installer tous NLTK corpus/modèles:
À la liste des ressources que vous avez téléchargé:
La même chose m'est arrivé récemment, vous avez juste besoin de télécharger le "punkt" package et cela devrait fonctionner.
Lorsque vous exécutez "liste" (l) "après avoir téléchargé toutes les choses", tout est marqué, comme la ligne suivante?:
Si vous voyez cette ligne avec la star, cela signifie que vous avez, et nltk devrait être en mesure de le charger.
Ouvrir l'invite Python et d'exécuter les instructions ci-dessus.
La sent_tokenize fonction utilise une instance de PunktSentenceTokenizer de l'
nltk.marquer.punkt module. Cette instance a déjà été formés et fonctionne bien pour
de nombreuses langues Européennes. De sorte qu'il sait ce que des signes de ponctuation et les caractères marquer la fin d'une
phrase et le début d'une nouvelle phrase.
Allez à la console python en tapant
dans votre terminal. Ensuite, tapez la ligne suivante 2 commandes dans votre interface python pour installer les paquets:
Cela a résolu le problème pour moi.
Mon problème est que j'ai appelé
nltk.download('all')
en tant qu'utilisateur root, mais le processus qui a finalement utilisé nltk était un autre utilisateur qui n'ont pas accès à /root/nltk_data où le contenu a été téléchargé.J'ai donc tout simplement de manière récursive tout copié à partir de l'emplacement de téléchargement de l'un des chemins où NLTK était à la recherche pour le trouver comme ceci:
Exécuter le code suivant:
Après cela, NLTK downloader va sortir.
Simple nltk.télécharger() ne permettra pas de résoudre ce problème. J'ai essayé de le ci-dessous et cela a fonctionné pour moi:
dans le nltk dossier créer un des générateurs de jetons dossier et copie de votre punkt dossier dans des générateurs de jetons dossier.
Cela fonctionne.!
la structure du dossier doit être comme indiqué dans l'image
Vous avez besoin de réorganiser vos dossiers
Déplacez votre
tokenizers
dossier dansnltk_data
dossier.Cela ne fonctionne pas si vous avez
nltk_data
dossier contenantcorpora
dossier contenanttokenizers
dossierPour moi rien de ce qui précède travaillé, donc je viens de télécharger tous les fichiers à la main à partir du site web http://www.nltk.org/nltk_data/ et je les ai mis aussi la main dans un fichier "des générateurs de jetons" à l'intérieur "nltk_data" le dossier. Pas une jolie solution, mais une solution.
J'ai fait face à un même problème. Après le téléchargement de tout, toujours "punkt" erreur était là. J'ai cherché paquet sur ma machine windows à C:\Users\vaibhav\AppData\Roaming\nltk_data\tokenizers et je peux voir 'punkt.zip' y sont présentes. J'ai réalisé que quelque part, le zip n'a pas été extraite en C:\Users\vaibhav\AppData\Roaming\nltk_data\tokenizers\punk.
Une fois, j'ai extrait le zip, il a travaillé comme de la musique.