Qu’est-ce que le format PDF 2.0 ?
Depuis que la société Adobe a donné son format de fichier le plus connu à l’ISO, le rythme de l’évolution des versions du format PDF s’est fortement ralenti.
En effet, ce n’est plus une société privée qui en décide, c’est maintenant un consortium international composé de nombreux membres aux intérêts divers et variés.
C’est pour ça que le format PDF 1.7, sorti en octobre 2006, est devenu la norme ISO 32000-1:2008 en février 2008 et qu’il a fallu attendre un peu plus de neuf ans pour voir apparaitre la version suivante en juillet 2017 : le format PDF 2.0, alias norme ISO 32000-2:2017.
C’est en effet la première version du format PDF entièrement développée en fonction des spécifications et des processus propres à l’ISO (International Organization for Standardization), c’est à dire que c’est un format :
- international,
- ouvert et dont les spécifications sont publiques,
- indépendant de tout éditeur ou vendeur,
- de conception collaborative,
- qui s’appuie sur des techniques et des standards ouverts et non propriétaires.
Autant dire que c’est une nouvelle version majeure du format PDF et que beaucoup de choses vont changer, pas tant pour les utilisateurs que pour les développeurs car c’est surtout la structure des fichiers PDF qui est renouvelée en profondeur.
Ce qui ne change pas
Tout ce qui a fait le succès du format PDF jusqu’ici :
fiabilité, portabilité, universalité, mise en page fixe, apparence déterminée par l’auteur, contenu autonome, dépendances incorporées (polices de caractère, images…), structure des fichiers, description du format, etc.
Ce qui change
Il y a beaucoup de nouveautés
alors on va se concentrer sur les principales et sur les moins techniques, florilège :
Prépresse
Pour résumer et bien comprendre l’avalanche de nouvelles fonctionnalités il faut imaginer que toutes les caractéristiques techniques qui constituent un document PDF “prépresse” actuel (intention de sortie, normes PDF, etc.) deviennent des caractéristiques constitutives au niveau de chaque page d’un document. Je ne vais pas rentrer dans le détail mais les professionnels du secteur apprécieront les perspectives que ça ouvre.
On notera aussi l’apparition très attendue de la gestion de la compensation du point noir (Black Point Compensation) et l’apparition des Spectral data, possiblement attachées aux tons directs pour une meilleure description et un meilleur rendu en toutes circonstances. À l’inverse, sont exclues de la norme l’OPI (Open Prepress Interface) et les Fonctions de transfert, deux fonctions historiques de la PAO des années 80, créées par feue la société Aldus et que plus personne n’utilise.**
Les normes ISO 15930, alias PDF/X, ne changent pas et restent des sous-ensembles de la norme ISO 32000-2.
Commentaires
Le vieux “moteur” qui datait du siècle dernier est obsolète* et remplacé par les Rich Media Annotations, apparues avec Acrobat 9. Ce sont essentiellement les développeurs qui apprécieront, coté utilisateur cela signifie surtout que les commentaires supporteront la transparence, les modes de fusion et que les outils de dessin Polygone et Ligne utiliseront de “vrais” tracés vectoriels, à la Illustrator.
Multimédia
Sans surprise, Flash Player qui ne faisait pas partie de la norme précédente n’en fera définitivement jamais partie, tout comme le support des formats SWF et FLV. Le format PDF 2.0 supporte les formats ouverts (MP4, MP3, OGG…) et les médias sont incorporés dans les documents PDF sous la forme de Rich Media Annotations.
3D
Là aussi ce sont les Rich Media Annotations qui sont mises à contribution. Pour la gestion des médias 3D c’est le format PRC qui est utilisé, avec gestion de la transparence et des modes de fusion là aussi.
Formulaire
Une “vraie” gestion de l’ordre de tabulation et, après tant d’années passées à en rêver, on appréciera aussi l’arrivée de la transparence pour les champs de formulaire.
Par-contre le format XFA, dont l’avenir parait du coup bien sombre, est définitivement écarté de la norme ISO 32000-2.
Balisage & accessibilité
Le modèle sémantique a été restructuré et des sets de balisage font leur apparition. Intégration des prononciation hints (suggestions de prononciation) et du support de MathML. Avec PDF 2.0 le balisage devient beaucoup plus concis (moins de balises), beaucoup plus clair (meilleures descriptions des balises, indication claire de là où elles peuvent être utilisées ou non) et plus flexible (les restrictions existent seulement quand elles sont nécessaire).
Pour avoir un peu pratiqué cet art difficile je crois pouvoir affirmer sans me tromper que ces nouveautés ne sont pas du luxe.
Métadonnées
Le modèle de métadonnées DocInfo d’origine est obsolète* et remplacé par XMP Metadata (eXtensible Metadata Platform), alias norme ISO 16684-1:2012.
Les métadonnées basées sur le langage XML sont couramment utilisées dans de nombreux formats de fichiers et de nombreux systèmes savent les lire et les indexer, XMP Metadata est maintenant un requis de première importance dans le format PDF 2.0
XMP Metadata est une norme compatible avec toutes les normes des sous-ensembles ISO, qui permet d’attacher des métadonnées XMP à n’importe quel objet incorporé dans un PDF et qui permet de crypter tout ou partie des métadonnées avec AES 256.
Le Permanent ID (numéro unique et permanent d’identification du document), qui fait partie des métadonnées, est requis et obligatoire car il est devenu constitutif d’un document PDF 2.0.
Par exemple, les actions GoTo et GoToR (aller à la page) s’appuiront désormais sur le Permanent ID pour devenir aussi des actions de navigation inter-documents. Et on peut imaginer que dans un futur proche il permettra également des communications inter-documents sécurisées avec JavaScript.
Signature
Intégration des formats standardsPAdES
& CAdES et Long Term Validation (LTV), mais ça n’interdit pas l’utilisation éventuelle d’autres formats, ouverts ou propriétaires.
Protection
Tout ce qui se faisait avant est obsolète
* et remplacé par le cryptage AES 256 bit. Le support du format Unicode est ajouté aux mots de passe, on pourra désormais les saisir aussi facilement en chinois qu’en farsi ou qu’en français.
Porte-Documents
L’utilisation commerciale par Adobe du terme Portfolio a conduit à lui préférer le terme de Collection, en améliorant encore le concept au passage. Les documents incorporés seront prévisualisables via des vignettes, pourront être regroupés, être liées entre-eux. À cela s’ajoute le concept “d’enveloppe numérique non cryptée” (Unencrypted wrapper document), c’est-à-dire qu’éventuellement seul le contenu peut-être protégé, sans devoir protéger le contenant : on peut librement voir ce qu’il a à l’extérieur de l’enveloppe (adresse, nom du destinataire, expéditeur…) mais pas ce qu’il a à l’intérieur, qui est crypté.
Associated files (AF)
C’est un nouveau concept introduit dans le format PDF.
Les “fichiers associés” c’est le moyen d’associer du contenu dans d’autres formats avec les objets contenus dans un fichier PDF et d’identifier la relation entre eux.
Les objets associés peuvent être de toute nature : document PDF, page, objet graphique, tableau, annotation…
L’association AF décrit la relation entre l’objet PDF et sa source. Par exemple : Source, Data, Alternative, Supplement, EncryptedPayload, FormData, Schema.
Ce qui permet de nouvelles fonctionnalités grâce aux relations entre les objets PDF et d’autres données arbitraires. Comme attacher MathML aux graphiques d’équation, joindre une feuille de calcul ou des données brutes aux graphiques, joindre du code XML professionnel à une facture électronique, etc.
Pas de révolution donc, mais quelle évolution !
Cependant, dans l’immédiat rien ne change pour les utilisateurs car aucun des logiciels actuellement disponibles n’est capable de créer ou d’exploiter un document PDF 2.0, mais je suppose que nombreux sont ceux qui attendent impatiemment les prochaines versions de leurs logiciels préférés.
Depuis la disgrâce du plugin Flash Player l’intégration d’éléments multimédia dans des documents “PDF universels” n’était plus à l’ordre du jour.
Le support des standards ouverts du moment dans le PDF 2.0 change complètement la donne dans ce domaine et ouvre de nouvelles perspectives que je suis impatient d’explorer…
Nous aborderons certainement ce sujet dans un avenir proche.
À bientôt.
• Exemples de documents PDF 2.0 à télécharger librement : https://github.com/pdf-association/pdf20examples
• Plus d’infos techniques : https://www.pdflib.com/knowledge-base/pdf-20/
• Keynote PDF 2.0 : https://www.youtube.com/watch?v=AR4lGlDh9Ac
(Inutile d’activer le son, il ne fait que lire ses diapos 😉 )
* Les fonctionnalités obsolètes peuvent continuer à être supportées pour des raisons de rétro-compatibilité mais leur utilisation est déconseillée puisque dans l’absolu rien n’oblige un développeur ou un éditeur de logiciels à le faire.
** Le comité ISO 32000 a lancé des appels et a fait faire des enquêtes dans le monde entier, aucun professionnel n’a répondu positivement.