Le PDF parfait : Indexation & recherche multi-fichiers
L’art et la manière de présenter un fichier PDF qui soit le plus agréable possible à l’utilisateur final
On imagine facilement le temps infini qu’il faudrait pour obtenir les résultats d’une simple recherche lancée sur plusieurs milliers de PDF si le logiciel lecteur de PDF devait aller explorer les fichiers un par un…
Ou bien le temps nécessaire pour faire la même chose dans un long PDF contenant 14864 pages de texte en plusieurs langues…
Surtout si les PDF en question sont stockés sur un volume réseau ou sur un volume externe “lent”, comme un DVD.
Quand on doit délivrer des documents PDF on peut améliorer le ressenti de l’utilisateur en lui fournissant rapidement les résultats de ses recherches, parce-que l’utilisateur trouvera toujours normal d’obtenir des retours instantanés, c’est l’inverse qu’il ne considérera pas comme normal.
D’où l’intérêt de constituer préalablement un index, c’est-à-dire une base de données dans laquelle s’effectueront les recherches et dans laquelle les références pointent directement sur les documents qui les contiennent.
Ainsi, lors de l’utilisation, les retours des résultats de recherche sont quasiment instantanés, quels que soient le nombre de documents et le nombre de leurs pages.
Acrobat incorpore un module Catalog qui sert à indexer le contenu des PDF stockés dans les dossiers (ou répertoires) du système de fichier d’un ordinateur.
La constitution d’un index avec Acrobat Catalog est très bien détaillée dans l’Aide du logiciel.
Autant cette solution est idéale pour délivrer une collection ou un ensemble de documents sur une clé USB par exemple, autant elle n’est pas vraiment simple à mettre en œuvre auprès d’un large public car elle se heurte à des problèmes de compatibilité entre différentes versions d’Adobe Reader, et entre les différents logiciels lecteurs de PDF (non-Adobe).
Pour une diffusion plus large il existe d’autres solutions, dont l’Index incorporé.