La bibliothèque à utiliser pour extraire le texte à partir d'images?
Je suis en train d'écrire un programme qui, lorsqu'il est administré une image de faible niveau en mathématiques (ex: 98*13) doit être en mesure de produire la réponse. Les chiffres en noir et le fond blanc. Pas un captcha, juste une image d'un problème de mathématiques.
Les problèmes de maths aurait seulement deux chiffres et un opérateur, et que l'opérateur ne serait que +, -, *,/.
Évidemment, je sais comment faire le calcul 😉 je ne sais pas comment faire passer le texte de l'image.
Un accès gratuit à la bibliothèque serait l'idéal... mais Si je dois écrire le code moi-même, je pourrais sans doute gérer.
Avez-vous Google?
Oui. Je ne pouvais pas trouver quelque chose applicables...
Oui. Je ne pouvais pas trouver quelque chose applicables...
OriginalL'auteur Entity | 2011-02-28
Vous devez vous connecter pour publier un commentaire.
Essayer ce post concernant l'utilisation du C++ Google Tessaract OCR lib en C#
OCR avec le Tesseract interface
OriginalL'auteur Taylor Bird
Vous avez besoin d'OCR. Il est libre de Tesseract bibliothèque de Google, mais c'est du code C. Vous pouvez utiliser en C++/CLI projet et l'accès via .NET.
Cet article donne quelques informations sur la façon de reconnaître les chiffres (pour le Sudoku, mais que votre problème est similaire)
http://sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html
OriginalL'auteur Lou Franco
vous pouvez utiliser Microsoft Office Document Imaging (Interop.MODI.dll) dans visual studio et d'un extrait du texte de photos
OriginalL'auteur user6736260
Pour extraire des mots à partir d'une image, j'utilise le plus précis OCR open source du moteur: Tesseract. Disponible ici ou directement dans vos packages NuGet.
Et c'est ma fonction en C#, qui extrait des mots à partir d'une image passée en
sourceFilePath
. Ensemble EngineMode à TesseractAndCube; il détecte les mots plus que les autres options.J'espère que ça aide.
OriginalL'auteur Loïc Sombart
Voici quelques exemples de code pour C#:
À l'aide de Tesseract: open-source Gratuit OCR application pour le Bureau de Windows - moderne GUI front-end pour le Tesseract OCR engine. L'application inclut également le support pour la lecture et l'OCR avec les fichiers PDF: https://github.com/A9T9/Free-Ocr-Windows-Desktop
À l'aide de Microsoft OCR: open-source Gratuit OCR application sur le Windows Store - moderne GUI front-end pour Microsoft OCR bibliothèque. L'application inclut également le support pour la lecture et l'OCR avec les fichiers PDF: https://github.com/A9T9/Free-OCR-Software
OriginalL'auteur Tienkamp