Introduction
Les extensions de fichier «.PDF» permet d'indiquer un fichier de document, tirer de l'abréviation de l'anglicisme «Portable Document Format», utilisé essentiellement par Adobe Acrobat. En théorie, il peut être lu sur n'importe quel machine et le rendu sera identique et sans altération d'une plateforme à l'autre. Bien que le format soit ouvert, le texte est encrypté de façon particulière et il y a un besoin d'un algorithme très onéreux pour pouvoir être lu. Ce n'est donc pas à la porter d'un amateur au niveau de sa programmation. Elle est maintenant supporté par des navigateurs Web comme Firefox ou Chrome.
Spécification
Spécification | Description |
---|---|
Type | Document |
Format | Description de pages |
Auteur | Adobe Systems |
Plateforme | Tous les plateformes |
Date de création | 1993 |
Norme | ISO/DIS 32000, ISO 32000-1:2008 |
Structure du fichier
Un fichier PDF conforme doit être constitué des 4 éléments suivants :
- Entête : Un entête d'une ligne identifiant la version de la spécification PDF à laquelle le fichier est conforme.
- Corps : Un corps contenant les objets composant le document contenu dans le fichier.
- Table de références croisées : Une table de références croisées contenant des informations sur les objets indirects dans le fichier.
- Queue de données : Une queue de données donnant l'emplacement de la table de correspondance et de certains objets spéciaux dans le corps du fichier.
Cette structure initiale peut être modifiée par des mises à jour ultérieures, ajoutant des éléments supplémentaires à la fin du fichier. De plus, par convention, les section d'un fichier PDF sont organisés en lignes. Chaque ligne doit terminée par un marqueur de fin de ligne (EOL), pouvant être un retour de chariot (0Dh), un saut de ligne (0Ah), ou les 2. Toutefois, les fichiers binaires peuvent avoir des longues lignes arbitraires.
Entête
La première ligne d'un fichier PDF doit être un entête composé des 5 caractères «%PDF-» suivi d'un numéro de version de format 1.N, où le N est un chiffre compris entre 0 et 7. Voici les formats d'entête existant :
Format | Description |
---|---|
%PDF-1.0 | PDF - Version 1.0 |
%PDF-1.1 | PDF - Version 1.1 |
%PDF-1.2 | PDF - Version 1.2 |
%PDF-1.3 | PDF - Version 1.3 |
%PDF-1.4 | PDF - Version 1.4 |
%PDF-1.5 | PDF - Version 1.5 |
%PDF-1.6 | PDF - Version 1.6 |
%PDF-1.7 | PDF - Version 1.7 |
A partir de la PDF - Version 1.4, l'entrée de la version dans le dictionnaire du catalogue du document (situé dans l'entrée racine de la queue de données du fichier), si elle est présente, alors elle doit être utilisé à la place la version spécifié dans l'entête du fichier.
Remarques
- Pour assurer la compatibilité avec les programmes compatibles traitant des fichiers PDF, les lignes n'étant pas partie des données d'objet flux sont limitées à 255 caractères maximum, à une exception près. À partir de PDF version 1.3, la chaîne de caractères de signature n'est pas soumise à la restriction sur la longueur de ligne.
- ASP.NET : Le format n'est pas intégré directement dans le ASP.NET, il faudra donc utiliser une extension comme PdfViewer.dll.