Comment extraire du texte d'un PDF?

Peut-on recommander une bibliothèque/API pour extraire le texte et les images à partir d'un PDF?
Nous devons être en mesure d'obtenir au texte qui est contenu dans les pré-connu régions du document, afin de l'API faudra nous donner des informations de position de chaque élément sur la page.

Nous aimerions que les données de sortie dans xml ou json format. Nous sommes actuellement à la recherche à PdfTextStream qui semble assez bonne, mais j'aimerais entendre d'autres peuples des expériences et des suggestions.

Sont il des alternatives (commercial ou libre) pour l'extraction de texte à partir d'un fichier pdf par programmation?

InformationsquelleAutor Budda007 | 2010-09-06