Comment puis-je supprimer toutes les images/dessins à partir d'un fichier PDF et de le laisser uniquement le texte en Java?

J'ai un fichier PDF de sortie à partir d'un ROC processeur, ce ROC processeur reconnaît l'image, ajoute le texte au format pdf, mais à la fin des endroits à faible qualité de l'image à la place de celui d'origine (je n'ai aucune idée de pourquoi quelqu'un voudrait le faire, mais ils font).

Donc, je voudrais obtenir ce PDF, supprimer le flux de l'image et de laisser le texte seul, de sorte que je puisse obtenir et d'importation (à l'aide de la bibliothèque iText page importer) un fichier PDF que je suis en créant moi-même avec l'image réelle.

Et avant que quelqu'un demande, j'ai déjà essayé d'utiliser un autre outil pour extraire les coordonnées de texte (JPedal) mais quand je dessine le texte sur mon PDF, il n'est pas à la même position que celui d'origine.

Je préfère avoir ce fait en Java, mais si un autre outil peut faire mieux, faites le moi savoir. Et il pourrait être l'image que l'enlèvement, je peux vivre avec un PDF avec les dessins.

Dans quel format sont les photos?
JPEG. TIFF, GIF et PNG.

OriginalL'auteur Maurício Linhares | 2011-07-26