Comment programmer une recherche et remplacement de texte dans les fichiers PDF
Comment serais-je capable de programmation pour rechercher et remplacer du texte dans un grand nombre de fichiers PDF? Je voudrais supprimer une URL qui a été ajouté à un ensemble de fichiers. J'ai été en mesure de supprimer le lien à l'aide de javascript sous Traitement par Lots dans Adobe Pro, mais le texte du lien reste. J'ai vu des recommandations pour l'utilisation de texte, retouche, qui fonctionne manuellement, mais je ne veux pas modifier 1300 fichiers manuellement.
- Je sais que c'est vraiment vieux, mais je suis venu le long de ce problème et que vous êtes le premier résultat sur google. Qu'avez-vous à la fin?
- J'ai utilisé Perl, le CAM::module PDF et l'échantillon changepagestring.pl programme comme le suggère Chris Dolan réponse. C'était une chose une seule fois, donc ne me demandez pas comment faire cela maintenant 😉
Vous devez vous connecter pour publier un commentaire.
Recherche de texte dans un document PDF peut être par nature difficile en raison de la nature graphique de la format de document -- les lettres que vous êtes à la recherche pour ne pas être contigus dans le fichier. Cela dit, CAM::PDF a quelques chercher-remplacer les capacités et les heuristiques. Donner changepagestring.pl de l'essayer et voir si cela fonctionne sur votre Pdf.
J'ai aussi devenir désespérée. Après 10 PDF Editor installations de tous les coûts de l'argent, et sans succès:
pdftk + éditeur suffire:
Remplacer du Texte dans les Fichiers PDF
Utilisation pdftk pour décompresser page PDF
flux
pdftk d'origine.le fichier pdf de sortie d'origine.clair.pdf décompresser
Remplacer le texte (parfois, cela
œuvres, parfois ça ne marche pas).
De réparation de la modifier (et maintenant brisé)
PDF
pdftk d'origine.clair.le fichier pdf de sortie d'origine.clair.fixe.pdf
Pas sûr que je voudrais faire tout le travail pour écrire le code pour modifier votre 1300 fichiers quand il y a un programme qui peut le faire pour vous. L'autre jour, j'ai utilisé la version Professionnelle de Infix pour le lot de modifier près de 100 fichiers à l'aide de son "Rechercher et Remplacer dans des Fichiers" caractéristique. Il fonctionne très bien. J'ai évalué d'autres programmes dans l'espoir de trouver un trouver et remplacer la fonctionnalité similaire à Microsoft Word. Infix est le seul que j'ai trouvé qui peut le faire. Découvrez: http://www.iceni.com/infix-pro.htm
Vous pouvez utiliser la 'rédaction' fonctionnalité dans Adobe Acrobat Pro pour rechercher & remplacer toutes les références dans un document unique, en une seule étape...vous ne savez pas si il peut être automatisée à plusieurs étapes.
http://help.adobe.com/en_US/Acrobat/9.0/Professional/WS5E28D332-9FF7-4569-AFAD-79AD60092D4D.w.html
Je viens de finir d'essayer de infix pour un texte qui est composé de texte écrasé par les signes diacritiques, avec l'espoir de générer un autre texte où les personnages avec lit double et composé de signes diacritiques sont remplacés par d'autres avec un seul des signes diacritiques. Infix est telle certainement une bonne solution pour quelqu'un qui ne se soucie pas pour la peine de comprendre le fonctionnement de des solutions programmatiques. Toute demande de modifications ont été apportées. Reste à comprendre comment l'effet de redistribution de mots qui permet de changer la mise en page de texte.
C'est juste une demi-solution, mais j'ai utilisé Touch combiné avec AppleScript de support pour envoyer des séquences de touches pour remplacer une chaîne de caractères en milliers de cellules d'un tableau. Selon la façon dont vos pages sont mise en page, il pourrait travailler pour vous. Dans mon cas, j'ai eu l'insérer manuellement le curseur au début de chaque table (des dizaines de tables - tout à fait gérable pour un processus manuel), mais après que j'ai remplacé milliers de cellules automatiquement.
La question est pour une solution de programmation, mais je vais quand même partager cet outil en ligne gratuit qui m'a permis de masse remplacer le texte en quelques fichiers PDF:
http://www.pdfdu.com/pdf-replace-text.aspx
Je n'ai pas remarqué les publicités ou autres modifications dans le fichier PDF résultant des fichiers après le remplacement du texte.
Je n'étais pas capable de faire les modifications en local avec le logiciel que j'ai essayé. Je pense que le principal problème était que j'ai été absent de la police utilisée dans le document PDF et il ne fonctionne pas correctement, même avec Acrobat Pro. L'outil en ligne ne se plaignent pas et produit un excellent résultat.
Je vous suggère peut utiliser VeryPDF PDF le Texte de la Poudre de Commande du logiciel de la Ligne de lot de remplacer le texte dans les pages de PDF, vous pouvez l'exécuter pdftr.exe pour remplacer du texte dans les pages de PDF facilement, par exemple,
pdftr.exe -contentreplace "Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -searchandoverlaytext "Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -searchandoverlaytext "Mon Nom=>D:\temp\myname.png*20*20" D:\in.pdf D:\out.pdf
pdftr.exe -pagerange 1-3 -contentreplace "Vieux Texte=>Nouveau Texte||VeryPDF=>VeryDOC||Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -texterecherché "chaîne" C:\in.pdf
pdftr.exe -pagerange 1 -texterecherché "chaîne" C:\in.pdf
pdftr.exe -pagerange 1 -searchandoverlaytext "Vieux Texte=>Nouveau Texte||VeryPDF=>VeryDOC||Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -overlaytextfontname "Arial" -overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext "Vieux Texte=>Nouveau Texte||VeryPDF=>VeryDOC||Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -opw 123 -upw 456 -contentreplace "Vieux Texte=>Nouveau Texte||VeryPDF=>VeryDOC||Mon Nom=>Votre Nom" D:\in.pdf D:\out.pdf
pdftr.exe -searchandoverlaytext "PDFcamp Imprimante=>VeryPDF Imprimante" -overlaytextfontsize 8 D:\in.pdf D:\out.pdf
pdftr.exe -searchandoverlaytext "PDFcamp Imprimante=>VeryPDF Imprimante" -overlaytextfontsize 80% D:\in.pdf D:\out.pdf