Pytesseract ROC de multiples options de configuration
Je vais avoir quelques problèmes avec pytesseract. J'ai besoin de configurer Tesseract pour qu'il soit configuré pour accepter les simples chiffres tout aussi seulement être en mesure d'accepter les chiffres comme le nombre zéro est souvent confondu avec un "O".
Comme ceci:
target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')
Merci beaucoup,
Niall
OriginalL'auteur Niall Oswald | 2017-06-18
Vous devez vous connecter pour publier un commentaire.
tesseract-4.0.0a
prend en charge ci-dessouspsm
. Si vous voulez avoir un seul de la reconnaissance de caractères, ensemblepsm = 10
. Et si votre texte est composé de chiffres uniquement, vous pouvez définirtessedit_char_whitelist=0123456789
.Voici un exemple d'utilisation de
image_to_string
avec plusieurs paramètres.Espère que cette aide.
pyt.image_to_data(im_gray_res, lang= 'eng', config='--psm 11 --oem 3 -c tessedit_char_whitelist= ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789')
? Je vais avoir beaucoup de problèmes à restreindre le domaine de recherche de caractères.vous devez vous Poser une Question pour votre nouvelle question. Veuillez aussi lire ce Demander.
Ce n'est pas une question nouvelle. Il s'agit d'un suivi de votre solution, qui est directement inférence à partir de ce que vous avez fourni. Il serait utile si vous soin de mentionner la version de tesseract vous utilisez le paramètre de la liste blanche. Merci de lire mon commentaire encore une fois, vous comprendrez.
OriginalL'auteur thewaywewere
La raison pour laquelle vous éprouvez des difficultés est que le caractère de restriction ne fonctionne pas dans la version 4.0. Forcer le mode legacy (oem 0) pour qu'il limite trouvé les personnages. Il y a un bug quelque part dans le tesseract équipe qu'ils n'ont pas encore été traitées.
OriginalL'auteur RALPH BURLESON