Python OCR : Conversion d'une Image Numérisée En Texte Pour le Traitement

Je suis en train de créer une réponse de papier de marquage (question à choix multiples) application en python. La feuille de réponse seront numérisées dans un fichier image (gif,png,jpg,quel que soit le format est nécessaire).

Mon Application a accès à la base de données où toutes les réponses sont stockées.

Donc,il suffit d'un peu de type de données de l'image numérisée afin qu'il puisse comparer la réponse et de calculer les marques.

La feuille de réponses a fixé les dimensions avec le format de tableau comme ceci ( les Réponses seront marquées par un " X " par le candidat d'indiquer leurs réponses):

Python OCR : Conversion d'une Image Numérisée En Texte Pour le Traitement

Après une recherche par le biais de l'internet, j'ai trouvé qu'il y a quelques OCR Api disponibles.

Premier est Pytesser . Il est très facile à utiliser et les résultats sont tout à fait correct. Mais il ne fonctionne que pour les images avec juste une pure textes. Donc, je pense qu'il n'est pas adapté.

Le second que j'ai trouvé est Ocropus. Il semble puissant mais dans la documentation

Windows

OCRopus s'appuie beaucoup sur POSIX noms de chemin d'accès et les systèmes de fichiers.
Vous pouvez être en mesure d'installer OCRopus sur Windows à l'aide . Un moyen plus facile
est d'installer VirtualBox et exécuter OCRopus dans Ubuntu sous VirtualBox.

Donc je pense que c'est surtout pour linux. Je ne pouvais pas trouver un détail guide d'installation pour windows plate-forme. ( Je suis un débutant, donc je peux me tromper)

Le troisième que j'ai trouvé est python-tesseract , un wrapper pour Tesseract OCR. Dans leur page, le guide d'installation est fourni. En gros, j'ai besoin d',

  1. python-tesseract-win32.deb
  2. python-opencv
  3. numpy

mais je n'ai aucune idée sur la façon d'installer .deb fichiers sur la fenêtre. J'ai le opencv et nampy déjà installé.

Donc voici mes questions:

(1) De quelle manière puis-je convertir l'image à la table en données lisibles(est-ce même possible?)?

(2) Est-il utile de ROC Api que je n'ai pas mentionnés ici, qui pourrait être utile?

(3) Enfin, (mon idée stupide) Est-il possible de diviser l'image en petits mandrins(basé sur la taille des cellules de la table - depuis la table dimensions sont connus) à l'aide de PIL et ensuite utiliser pytesser convertir les petites images dans le texte, par la suite, de traiter les données en conséquence?

FYI: j'ai seulement besoin pour Plate-forme Windows, peut-être pour windows xp 32 bits. Je suis à l'aide de python 2.7.5.

  • .deb Linux Deiban/Ubuntu pachage fichiers, vous fondamentalement ne pas les installer sur Windows.
InformationsquelleAutor Chris Aung | 2013-11-20