L'obtention de la boîte englobante de mots reconnus à l'aide de python-tesseract

Je suis à l'aide de python-tesseract pour extraire des mots à partir d'une image. C'est un wrapper python pour tesseract qui est un ROC code.

J'utilise le code suivant pour obtenir les mots:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Cela renvoie seulement les mots et de ne pas leur emplacement/taille/orientation (ou en d'autres termes un cadre de sélection contenant de mer) dans l'image. Je me demandais si il n'y a aucun moyen d'obtenir que ainsi

OriginalL'auteur Abtin Rasoulian | 2013-12-30