Comment faire pour extraire des Notes et mis en évidence Pièces à partir de fichiers PDF

Est-il possible de l'extraire en surbrillance le texte et les notes à partir d'un fichier PDF par programmation? Toute langue est la bienvenue. J'ai trouvé plusieurs bibliothèques avec Python, Java et aussi PHP, mais aucun d'entre eux de faire le travail.

Je ne sais pas si c'est possible ou pas. Je suis également conscient du fait que certains programmes créent des fichiers supplémentaires pour la tenue de ce genre d'information(si je ne me trompe pas Kindle génère un autre fichier.) mais actuellement, ceux-ci sont hors de portée.

Merci pour la réponse. J'ai aussi trouvé un autre moyen de résoudre ce problème en un peu long 🙂 les notes Collantes qui est créé par Adobe Reader est facile à analyser car les notes sont ajoutées à des fichiers pdf avec à la fois un contenu et des informations de position, mais pour les faits saillants, il est à seulement rectangle infromation je dois extraire le texte par emplacement. Donc, je dois écrire un peu de code pour cela. En tant que bibliothèque de base que je peux utiliser PDFMiner, qui fournit des informations sur les postions de textes.

OriginalL'auteur user1183057 | 2012-02-01