Donnez vie à vos documents numériques !
 

Compression des images

Compression des images

 

Les modes de compression des images dans les PDF

Les options de compression des images incorporées dans les fichiers PDF restent mystérieuses pour la plupart des utilisateurs qui se contentent des réglages par défaut.

Ces options se retrouvent dans Acrobat Distiller, qui nous sert pour illustrer cet article, et dans les modules d’exportation de tous les logiciels qui savent convertir en PDF.

L’examen de chaque cas de figure et de chaque option serait un vrai calvaire à lire et à rédiger, alors on va au plus simple avec un comparatif des résultats sur une série d’images identiques. Chacun y trouvera ce qui l’intéresse, après une courte présentation de chaque format de compression et un rappel sur les notions de résolution :

 

• Les modes de compression d’images

Compress_image01.png

– La compression ZIP est une compression non destructive

La compression ZIP donne ses meilleurs résultats sur des images présentant des grandes zones d’aplats avec des ruptures de tons franches. L’exemple type c’est la copie d’écran d’une boîte de dialogue ou d’un menu.
C’est également la compression que l’on choisira pour tout type d’image lorsqu’on veut réduire la taille du fichier sans prendre aucun risque de dégradation des images.

 

– La compression JPEG est une compression toujours destructive

Même si la Qualité maximale n’engendre que des dégradations imperceptibles à l’œil nu, il y a toujours une dégradation qui s’opère lors de l’enregistrement.
C’est d’ailleurs le plus grand danger de ce mode de compression : chaque enregistrement successif d’une même image, suite à des modifications par exemple, l’altère un peu plus de façon irréversible…

La compression JPEG est plus performante sur des images de type photographiques, présentant de multiples nuances et des dégradés de tons.
Bien entendu, le gain sur le poids du fichier est inversement proportionnel à la qualité sélectionnée pour l’image, une compression forte engendre un effet de tuilage très caractéristique.

A noter que seul point commun entre JPEG et JPEG2000 c’est les quatre premières lettres du nom, les algorithmes utilisés ne sont pas du tout les mêmes.

 

– La compression JPEG2000 (PDF 1.5 et versions ultérieures)

C’est le meilleur des deux mondes,

avec ce format on dispose à la fois d’un mode de compression non destructif, comme la compression ZIP, ou bien d’un mode destructif mais plus performant en terme de poids de fichier, comme le JPEG.
En mode destructif et à qualité visuelle égale, la compression JPEG2000 offre dans tous les cas des performances accrues par rapport au JPEG dans le gain sur le poids des images.

Dans la mesure du possible on aura donc toujours intérêt à utiliser la compression JPEG2000 en lieu et place du ZIP ou du JPEG.

Dans la mesure du possible… parce-que le JPEG2000 est arrivé avec la version 1.5 du format PDF, ce qui signifie qu’il est inutilisable avec les versions antérieures, et en particulier avec les normes prépresse PDF/X-1 et le PDF/X-3, qui s’appuient sur les versions 1.3 et 1.4 du format PDF.

 

– La compression Automatique (JPEG)

On laisse le logiciel décider quelle compression, ZIP ou JPEG, appliquer aux images en fonction de leur type.

 

– La compression Automatique (JPEG2000)

On laisse le logiciel décider quelle compression, ZIP ou JPEG2000, appliquer aux images en fonction de leur type.

 

– CCITT, RLE, ZIP et JBIG2

Ce sont des modes de compression destinés aux images bitmap monochromes, où le pixel n’a que deux valeurs possibles : par nature ce type d’image est forcément très léger.
Pour des raisons de qualité visuelle, en pré-presse on considère qu’une image bitmap monochrome doit avoir une résolution quatre fois supérieure à celle des images en niveaux de gris.

  • La compression CCITT 4 est en général la plus performante, c’est un mode de compression non destructif.
  • La compression CCITT 3 est en général (il y a toujours des exceptions…) moins performante que CCITT 4.
  • La compression ZIP est à peu de chose près (environ 5%) aussi performante que la compression CCITT 4.
  • C’est un mode de compression non destructif.
  • La compression RLE est un format historique, moins performante mais gage de rétro-compatibilité vers les versions les plus anciennes du format PDF.
  • C’est aussi un mode de compression non destructif.
  • La compression JBIG2, disponible dans l’Optimisation PDF d’Acrobat mais pas dans Distiller, est supérieure à la compression CCITT 4 en gain de poids.
  • Elle est apparue avec la version 1.4 du format PDF et est utilisable en mode non destructif ou en mode destructif à divers degrés, comme le JPEG2000.

 

– Compression du texte et des dessins au trait
Cette option a disparu dans les versions récentes de Distiller car elle est activée par défaut, mais on la trouve dans d’autres logiciels.

C’est une compression non destructive (ZIP) qui s’applique aux éléments vectoriels : images et textes.

“Dessins au trait” est ici la (mauvaise) traduction du mot anglais Artworks, il s’agit bien d’images vectorielles.
Rien à voir avec le terme “Dessin au trait” que l’on trouve dans les pilotes de scanner, par exemple, et qui désigne des images bitmap monochromes.

 

• La résolution des images

 

Voir l’article : En finir avec la résolution des images

 

 

• Le tableau comparatif

 

Télécharger le tableau comparatif

 

Le tableau comparatif

 

L’image ci-dessus est une copie d’écran de l’original en PDF, téléchargez le pour apprécier visuellement les différences
Les pourcentages de compression sont obtenus en comparant avec le nombre d’octets du fichier original (en italique). La couleur et le sens des images vectorielles sont normales, c’est pour qu’on les distingue mieux sur le tableau.

 

 

• Pourquoi y a t’il un seuil de sous-échantillonnage ?

 

Qu’une image soit à 300 ou 450 ppp cela ne change pas grand-chose à son poids une fois compressée en JPEG ou en ZIP, par contre le sous-échantillonnage peut potentiellement fortement modifier son aspect visuel et causer plus de dégâts (visuellement parlant) que de gain sur le poids du fichier.

 

Il faut donc de savoir à partir de quel moment le jeu en vaut la chandelle : ce que ces valeurs représentent c’est le seuil à partir duquel le sous-échantillonnage devient contre-productif dans la majorité des cas d’utilisation.

Parce-qu’il n’y a pas que l’aspect visuel à prendre en compte : à quoi servirait d’utiliser de longues heures de temps de calculs pour réduire de 400 à 300 ppp les milliers d’images d’un document de plusieurs centaines de pages pour un gain de poids de fichier dérisoire et potentiellement au détriment de la qualité visuelle alors que pendant ce temps l’utilisateur attend d’obtenir son PDF dans un délai forcément le plus court possible et avec forcément la meilleure qualité possible ?

Surtout si l’utilisateur en question est un pro qui a déjà préalablement optimisé l’aspect et la résolution/dimension/nombre de pixels des dites images… Efficacité d’abord.

Tous les logiciels de conversion en PDF utilisent cette technique, parfois sans le dire lorsque la simplicité d’utilisation prime sur la débauche de choix techniques.

 

À noter que le rapport par défaut utilisé par Adobe et les autres éditeurs est de 1,5, ce qui n’est certainement pas anodin et doit correspondre intimement aux capacités des algorithmes de sous-échantillonnage.

Je n’en sais pas plus sur le sujet mais intuitivement et à vue de nez il semble évident qu’en dessous de ce seuil l’interpolation occasionnée par le sous-échantillonnage aboutirait à une bouillie de pixels (comment diviser un pixel par 3 ou par 0,75 ?).

L’avantage avec les logiciels prépresse c’est qu’ils laissent la possibilité de déterminer ce seuil : à chacun de choisir selon ses impératifs entre dégradation potentielle et rapidité d’exécution, sachant que les réglages par défaut conviennent dans la plupart des cas et qu’il est possible de désactiver totalement le sous-échantillonnage.