Faire tesseract reconnaître les chiffres uniquement
Je suis en train d'affiner un ROC prog que j'ai fait pour lire la mise en page d'une certaine image que j'utilise. Maintenant, je voudrais que mon ROC prog de ne reconnaître que les chiffres de 0 à 9.
J'ai essayé de suivre la solution de la question:
Limite de caractères tesseract est à la recherche d'
Mais j'ai été coincé dans la partie où je dois appeler tesseract:
tesseract input.tif output nobatch letters
où cela ne va?
OriginalL'auteur user1397215 | 2012-07-03
Vous devez vous connecter pour publier un commentaire.
J'ai posté quelques choses à propos de tesseract il y a quelques temps dans la: voir Tesseract OCR Apprentissage de Bibliothèque de Polices. Il y a notamment un lien vers tesseract formation qui va vous dire comment maîtriser votre jeu de caractères et de décrire votre ambiguïtés.
OriginalL'auteur Emmanuel
j'ai eu le même problème à l'aide de python, l'esprit de tesseract 3
En supposant en outre que les lecteurs pourront le faire.
à partir d'ici : https://github.com/tesseract-ocr/tesseract/wiki/FAQ#how-do-i-recognize-only-digits
et ici:
https://github.com/madmaze/pytesseract/blob/27fed535bf1eb665ec991313841b177336b50f61/src/pytesseract.py#L91
j'ai réussi en utilisant :
OriginalL'auteur cgte
Répond à cette question sur Tesseract FAQ
Et voici comment vous pouvez obtenir tesseract à reconnaître les chiffres seulement:
Tesseract 2 - AVANT d'appeler une fonction Init ou mettre cela dans un fichier texte appelé tessdata/configs/chiffres:
et puis la ligne de commande devient:
Tesseract 3 - chiffres fichier de config est déjà créé, il suffit donc de lancer un tesseract de commande comme ceci:
OriginalL'auteur valentt
C'est la commande que vous utilisez pour tesseract exécuter en ligne de commande.
Pour une meilleure réponse, nous avons besoin de savoir si vous exécutez tesseract sur la ligne de commande ou en bibliothèque.
OriginalL'auteur ojs