Sont tous les fichiers PDF compressés?
Donc, il y a quelques discussions ici sur la compression PDF en disant qu'il y en a, mais pas beaucoup de gain lors de la compression des fichiers Pdf en format Pdf sont déjà compressés.
Ma question est: Est-ce vrai pour tous les fichiers Pdf y compris les anciennes version du format?
Aussi, je suis sûr que c'est possible pour quelqu'un (un idiot peut-être) à la place des images bitmap dans le PDF plutôt que JPEG, etc. Notre société a beaucoup de fichiers Pdf dans son DBs (certains anciens formats peut-être). Nous envisageons à l'aide de gzip pour compresser lors de la transmission, mais ne sais pas si sa valeur la dispute
OriginalL'auteur Rob McFeely | 2012-05-11
Vous devez vous connecter pour publier un commentaire.
Pdf en général utiliser la compression interne pour les objets qu'elles contiennent. Mais cette compression est en aucun cas obligatoire selon les spécifications du format de fichier. Tous les (ou certains) les objets peuvent apparaître totalement non compressé, et qu'ils vont encore faire un fichier PDF valide.
Il existe des outils en ligne de commande qui sont en mesure de décompresser la plupart (si pas tous) de l'objet interne des flux (même de la plupart des versions modernes de fichiers Pdf) -- et la nouvelle, version non compressée du fichier de rendre exactement le même sur l'écran ou sur papier (si imprimé).
Donc, pour répondre à votre question: Non, vous ne pouvez pas supposer que la compression gzip est l'ajout de tracas et aucun avantage. Vous devez le tester auprès d'un échantillon représentatif de vos fichiers. Juste gzip et de prendre note de l'heure et de l'espace économisé.
Il dépend également du type de PDF la production de logiciel qui a été utilisé...
Mais le contenu du texte compressé? Et que dire de polices de caractères?
Les polices incorporées sont compressés (parce que les fichiers de police eux-mêmes, par défaut, sont également compressés). Voir également la réponse à "[Comment puis-je extraire les polices incorporées dans un document PDF, comme valides les fichiers de police? ](stackoverflow.com/a/3489099/359307)". Contenu du texte est habituellement incorporé comme les autres le contenu et peut ou ne peut pas être compressé, tout comme la réponse décrit...
Dites-vous que les sections de texte dans un document PDF sont des "objets", tout comme les images et les tels sont? Ce n'est pas clair pour les gens unfamilar avec la façon dont le format fonctionne en arrière-plan.
Oui. 🙂
OriginalL'auteur Kurt Pfeifle
Au lieu d'appliquer la compression gzip, vous obtiendrez beaucoup mieux en utilisant PDF utilitaires pour appliquer la compression du contenu dans le format ainsi que enlever des choses comme inutiles les polices incorporées. Ces utilitaires peuvent sous-échantillonner les images et demander le bon de compression d'image, ce qui serait beaucoup plus efficace que gzip. JBIG2 peut être appliqué à l'aide inspiratoire avec pep images et est remarquablement efficace, et JPEG peuvent être appliqués à des images naturelles avec le niveau de qualité, sélectionnés en fonction de vos besoins. Dans Acrobat Pro, vous pouvez utiliser Avancé -> format PDF Optimiseur de voir où l'espace est utilisé et attaquent sélectivement les consommateurs. Il y a aussi un Document générique -> Réduire la Taille du Fichier pour appliquer automatiquement ces réductions.
Mise à jour:
Ika, en réponse a un lien vers un PDF utilitaire d'optimisation qui peut être utilisé à partir de Java. Vous pouvez consulter leur exemple de code Java, il y. Que les listes de codes exactement les choses que j'ai mentionnées:
OriginalL'auteur Mark Adler