Convertir correctement les fichiers pdf en ps et vice-versa
Je suis en utilisant "pdftops" pour les convertir .les fichiers pdf .les fichiers ps et puis "ps2pdf" pour le processus inverse (poppler-utils). Le problème est que lors de la création de l' .fichiers pdf à partir de l' .les fichiers ps, le texte semble ok, mais quand j'ai essayer de le copier, les personnages sont très étranges (c'est comme s'ils sont endommagés). J'ai utilisé ces outils sur d'autres fichiers pour une longue période et il a bien fonctionné.
J'ai aussi essayé "pdftohtml -xml" pour en créer un .fichier xml, et le texte est ok (les personnages sont extraites correctement).
- Ce que le problème pourrait-il être à propos de la conversion? Peut-être que si j'utilise "pdftops" et "ps2pdf" sont là certaines des options qui doivent être changées?
- Si je créer les .xml de sortie, il est un moyen de créer un .fichier pdf à partir de l' .fichier xml ?
EDIT:
Sortie de "pdffonts d'origine.pdf"
De sortie pour "roundtripped.pdf"
OriginalL'auteur Andrei F | 2012-05-28
Vous devez vous connecter pour publier un commentaire.
Je suis juste en couvrant la PS->conversion PDF... (je suis en supposant que votre phrase de vice-versa n'est pas destiné à point à un 'aller-retour' de conversion de la très même fichier [PDF->PS->PDF], mais la direction générale de la conversion pour tout fichier PS. Est-ce exact?)
Tout d'abord, il est probable que votre
ps2pdf
n'est qu'un shellscript, qui utilise en interne une Ghostscript commande de certains paramètres par défaut pour faire le vrai travail.ps2pdf
est beaucoup plus facile à utiliser. Ghostscript a beaucoup plus d'options, mais il est plus difficile à apprendre.ps2pdf
il enlève beaucoup de possibilités de contrôle, vous pourriez avoir si vous avez utilisé Ghostscript. (Vous pouvez modifier quelques paramètres avecps2pdf
- mais alors vous êtes déjà beaucoup plus proche d'un réel Ghostscript commande déjà...)Seconde, sans savoir exactement comment exactement votre PS fichier d'entrée est climatisé, il est difficile de vous donner de bons conseils: votre PS ont intégré les polices de caractères qu'il utilise? Quel type de polices sont-ils? etc.
Troisièmement, Ghostscript gagné beaucoup de puissance et de contrôle, et a eu quelques bugs ou les points faibles été supprimés au cours des dernières années, quand il s'agit de outputing PDF. Donc, qui est la version de Ghostscript installé sur votre système? (Rappelez-vous,
ps2pdf
appels Ghostscript, il ne fonctionnera pas sans un installé localementgs
exécutable.)Une cause probable de l'incapacité de copier du texte à partir du fichier PDF pourrait être le type de police (et codage), qui a fini par être utilisé et intégré dans votre fichier PDF. De la police de caractères de détails pouvez-vous nous parler de vos fichiers Pdf qui en résultent? (Essayez
pdffonts your.pdf
pour en savoir -- pdffonts est aussi de la partie Poppler utils vous l'avez mentionné.)Vous pouvez essayer ceci (complet) Ghostscript commande pour PS->conversion PDF et de vérifier où il vous faut:
Pour les autres questions? Essayez
pdffonts original.pdf
+pdffonts roundtripped.pdf
et les résultats du rapport.J'ai édité ma question initiale.
la version de Ghostscript est installé sur votre système?
gs --version: 8.71
OriginalL'auteur Kurt Pfeifle