Outil pour comparer un grand nombre de fichiers PDF?

J'ai besoin de comparer grand nombre de fichiers PDF pour il optiques de contenu. Parce que des fichiers au format PDF a été créé sur différentes plates-formes et avec différentes versions du logiciel, il existe des différences structurelles. Par exemple:

  • la segmentation de texte peuvent être différents
  • l'ordre d'écriture peuvent être différents
  • la position peut varier de quelques pixels

Il faut comparer le contenu comme un homme et non pas la structure interne. Je veux tester les régressions entre les différentes versions du générateur de PDF que nous avons utilisé.

  • Une partie de la solution serait d'utiliser pdftotext et de comparer le texte contenu.
  • Mais cela va ignorer tous les non texte des informations comme des lignes, des boîtes, des images, des graphiques, etc. Je pense aussi qu'il pas montrer l'optique des postes de texte d'autre de la position structurelle.
  • Je suis d'accord, ce n'est pas un critère suffisant. D'autre part, il est un critère nécessaire, par conséquent, il est approprié qu'un test unitaire.
  • N'a jamais vraiment été dans votre situation, mais j'ai essayé ExamDiff Pro pour comparer des fichiers Pdf et il a travaillé pour moi.
  • Vous pouvez toujours ajouter une meilleure unité de test plus tard!
  • Si il y a des images sur les pages, et que vous voulez un homme-comme l'évaluation, pour ceux qui, il n'ya pas beaucoup que vous pouvez faire, mais avoir un homme comparer ces pages, sauf si vous voulez travailler sur un tout nouveau projet, tout aussi grande que celle en cours, pour l'essayer.
  • Je pense que Bitmap vérifier devrait fonctionner dans votre cas. J'utilise un outil d'automatisation de comparer 2 images bitmap à l'aide de check point
  • Ce que l'un d'intelligent, \\*#?`%& décision de fermer cette question que "non constructive" ! (Il faut l'adore lorsque la question de fermeture-les modérateurs de détruire le contenu de la communauté qui porte des balises où ces mêmes mods n'ont pas la réputation personnelle en!)
  • Un autre cas, inutile de la fermeture d'une question relative à un très pertinente realworld de cas d'utilisation. Je voudrais bien savoir comment faire pour proposer un son raisonnement sur Meta, cela va arrêter par la suite. Il se sent juste si mal chaque fois qu'il se passe.
  • connexes: superuser.com/q/46123/35237
  • Il y a un accès GRATUIT à la bibliothèque de comparer pdf pixel par pixel. Consultez ce blog. testautomationguru.com/...

InformationsquelleAutor Horcrux7 | 2008-09-28