Comment faire pour extraire des Notes et mis en évidence Pièces à partir de fichiers PDF
Est-il possible de l'extraire en surbrillance le texte et les notes à partir d'un fichier PDF par programmation? Toute langue est la bienvenue. J'ai trouvé plusieurs bibliothèques avec Python, Java et aussi PHP, mais aucun d'entre eux de faire le travail.
Je ne sais pas si c'est possible ou pas. Je suis également conscient du fait que certains programmes créent des fichiers supplémentaires pour la tenue de ce genre d'information(si je ne me trompe pas Kindle génère un autre fichier.) mais actuellement, ceux-ci sont hors de portée.
Merci pour la réponse. J'ai aussi trouvé un autre moyen de résoudre ce problème en un peu long 🙂 les notes Collantes qui est créé par Adobe Reader est facile à analyser car les notes sont ajoutées à des fichiers pdf avec à la fois un contenu et des informations de position, mais pour les faits saillants, il est à seulement rectangle infromation je dois extraire le texte par emplacement. Donc, je dois écrire un peu de code pour cela. En tant que bibliothèque de base que je peux utiliser PDFMiner, qui fournit des informations sur les postions de textes.
OriginalL'auteur user1183057 | 2012-02-01
Vous devez vous connecter pour publier un commentaire.
Ok, après recherche j'ai trouvé une solution pour l'exportation de texte mis en évidence, à partir d'un fichier pdf vers un fichier texte. N'est pas très dur:
Tout d'abord, vous surlignez votre texte avec l'outil que vous souhaitez utiliser (dans mon cas, je précise bien que je suis en train de lire sur un iPad à l'aide de Goodreader app).
Transfert de votre fichier pdf à un ordinateur et l'ouvrir à l'aide de lait Écrémé (un lecteur de pdf gratuit et facile à trouver sur le web)
Sur FICHIER, choisissez CONVERTIR les NOTES et convertir toutes les notes de votre document à ÉCUMER les NOTES.
C'est tout: il suffit d'aller à EXPORTER, choisissez EXPORTER ÉCRÉMÉ NOTES. Il permettra d'exporter la liste de vos texte en surbrillance. Une fois ouverte, cette liste peut être exportée de nouveau dans un format txt fichier.
Pas beaucoup de travail à faire, et le résultat est fantastique.
OriginalL'auteur Angel