Encodage URL
L'encodage d'URL permet de remplacer les caractères ASCII n'étant pas acceptés par le navigateur Web ou le serveur par un caractère «%» suivi de deux chiffres hexadécimaux. Le protocole qu'utilise les navigateurs Web et les serveurs autorisent uniquement des codes ASCII pour la transmission des références de liens, ainsi, ils doivent donc utiliser un encodage pour permettre de transmettre l'information sans perte de données. De plus, certains caractères comme le point d'interrogation («?») et les «&» indique les paramètres associés à l'URL, il devient donc nécessaire d'indiquer que le caractère transmis n'est pas un paramètre mais une partie intégrante d'un URL par exemple.
Liste de l'encodage URL
Voici la liste des conversions des caractères et leurs équivalents en encodage dans une ligne d'adressage URL :
Code | Caractère/Description |
---|---|
%00 | Caractère de contrôle nulle (NUL) |
%01 | Caractère de contrôle de démarrage d'entête (SOH) |
%02 | Caractère de contrôle de démarrage de texte (STX) |
%03 | Caractère de contrôle de fin de texte (ETX) |
%04 | Caractère de contrôle de fin de transmission (EOT) |
%05 | Caractère de contrôle d'enquête (ENQ) |
%06 | Caractère de contrôle de reconnaissance (ACK) |
%07 | Caractère de contrôle de signal sonore (BEL) |
%08 | Caractère de contrôle de retour en arrière (BS) |
%09 | Caractère de contrôle de tabulation horizontal (HT) |
%0A | Caractère de contrôle de saut de ligne (LF) |
%0A | Caractère de contrôle de saut de ligne (LF) |
%0B | Caractère de contrôle de tabulation vertical (VT) |
%0C | Caractère de contrôle de saut de page (FF) |
%0D | Caractère de contrôle de retour de chariot (CR) |
%0E | Caractère de contrôle de décalage vers la sortie (SO) |
%0F | Caractère de contrôle de décalage vers l'entrée (SI) |
%10 | Caractère de contrôle d'échappement de liaison de données (DLE) |
%11 | Caractère de contrôle de périphérique 1 (DC1) |
%12 | Caractère de contrôle de périphérique 2 (DC2) |
%13 | Caractère de contrôle de périphérique 3 (DC3) |
%14 | Caractère de contrôle de périphérique 4 (DC4) |
%15 | Caractère de contrôle de reconnaissance négative (NAK) |
%16 | Caractère de contrôle de synchronisation (SYN) |
%17 | Caractère de contrôle de fin de transmission de bloc (ETB) |
%18 | Caractère de contrôle d'annulation (CAN) |
%19 | Caractère de contrôle de fin de médium (EM) |
%1A | Caractère de contrôle de remplacement (SUB) |
%1B | Caractère de contrôle d'échappement (ESC) |
%1C | Caractère de contrôle de séparateur de fichier (FS) |
%1D | Caractère de contrôle de séparateur de groupe (GS) |
%1E | Caractère de contrôle de séparateur d'enregistrement (RS) |
%1F | Caractère de contrôle de séparateur d'unité (US) |
%20 | Espace |
%21 | ! |
%22 | " |
%23 | # |
%24 | $ |
%25 | % |
%26 | & |
%27 | ' |
%28 | ( |
%29 | ) |
%2A | * |
%2B | + |
%2C | , |
%2D | - |
%2E | . |
%2F | / |
%30 | 0 |
%31 | 1 |
%32 | 2 |
%33 | 3 |
%34 | 4 |
%35 | 5 |
%36 | 6 |
%37 | 7 |
%38 | 8 |
%39 | 9 |
%3A | : |
%3B | ; |
%3C | < |
%3D | = |
%3E | > |
%3F | ? |
%40 | @ |
%41 | A |
%42 | B |
%43 | C |
%44 | D |
%45 | E |
%46 | F |
%47 | G |
%48 | H |
%49 | I |
%4A | J |
%4B | K |
%4C | L |
%4D | M |
%4E | N |
%4F | O |
%50 | P |
%51 | Q |
%52 | R |
%53 | S |
%54 | T |
%55 | U |
%56 | V |
%57 | W |
%58 | X |
%59 | Y |
%5A | Z |
%5B | [ |
%5C | \ |
%5D | ] |
%5E | ^ |
%5F | _ |
%60 | ` |
%61 | a |
%62 | b |
%63 | c |
%64 | d |
%65 | e |
%66 | f |
%67 | g |
%68 | h |
%69 | i |
%6A | j |
%6B | k |
%6C | l |
%6D | m |
%6E | n |
%6F | o |
%70 | p |
%71 | q |
%72 | r |
%73 | s |
%74 | t |
%75 | u |
%76 | v |
%77 | w |
%78 | x |
%79 | y |
%7A | z |
%7B | { |
%7C | | |
%7D | } |
%7E | ~ |
%7F | |
%80 | |
%81 | |
%82 | |
%83 | |
%84 | |
%85 | |
%86 | |
%87 | |
%88 | |
%89 | |
%8A | |
%8B | |
%8C | |
%8D | |
%8E | |
%8F | |
%90 | |
%91 | |
%92 | |
%93 | |
%94 | |
%95 | |
%96 | |
%97 | |
%98 | |
%99 | |
%9A | |
%9B | |
%9C | |
%9D | |
%9E | |
%9F | |
%A0 | |
%A1 | ¡ |
%A2 | ¢ |
%A3 | £ |
%A4 | ¤ |
%A5 | ¥ |
%A6 | ¦ |
%A7 | § |
%A8 | ¨ |
%A9 | © |
%AA | ª |
%AB | « |
%AC | ¬ |
%AD | |
%AE | ® |
%AF | ¯ |
%B0 | ° |
%B1 | ± |
%B2 | ² |
%B3 | ³ |
%B4 | ´ |
%B5 | µ |
%B6 | ¶ |
%B7 | · |
%B8 | ¸ |
%B9 | ¹ |
%BA | º |
%BB | » |
%BC | ¼ |
%BD | ½ |
%BE | ¾ |
%BF | ¿ |
%C0 | À |
%C1 | Á |
%C2 | Â |
%C3 | Ã |
%C4 | Ä |
%C5 | Å |
%C6 | Æ |
%C7 | Ç |
%C8 | È |
%C9 | É |
%CA | Ê |
%CB | Ë |
%CC | Ì |
%CD | Í |
%CE | Î |
%CF | Ï |
%D0 | Ð |
%D1 | Ñ |
%D2 | Ò |
%D3 | Ó |
%D4 | Ô |
%D5 | Õ |
%D6 | Ö |
%D7 | × |
%D8 | Ø |
%D9 | Ù |
%DA | Ú |
%DB | Û |
%DC | Ü |
%DD | Ý |
%DE | Þ |
%DF | ß |
%E0 | à |
%E1 | á |
%E2 | â |
%E3 | ã |
%E4 | ä |
%E5 | å |
%E6 | æ |
%E7 | ç |
%E8 | è |
%E9 | é |
%EA | ê |
%EB | ë |
%EC | ì |
%ED | í |
%EE | î |
%EF | ï |
%F0 | ð |
%F1 | ñ |
%F2 | ò |
%F3 | ó |
%F4 | ô |
%F5 | õ |
%F6 | ö |
%F7 | ÷ |
%F8 | ø |
%F9 | ù |
%FA | ú |
%FB | û |
%FC | ü |
%FD | ý |
%FE | þ |
%FF | ÿ |
Remarques
- Les caractères de contrôles ASCII sont indiqués par les valeurs de «%00» à «%1F».
- Les espaces sont considérés comme des caractères incertain, il faut donc les remplacement par un code «%20» ou un «+».
- Les URL ne peuvent être transmis sur les réseaux qu'avec l'aide de l'ensemble de caractères ASCII. Ainsi, lorsque le caractère est en dehors des standards, il est possible d'utiliser un encodage URL pour le transmettre. Il devient donc valide pour la transmission puisqu'il utilise des caractères ASCII.
Exemples
L'exemple permet de conserver l'espace lors de la transmission du lien URL :
L'exemple permet de transmettre une page Web avec des paramètres en l'indiquant dans un paramètre :
Voir également
Articles - URL (Uniform Resource Locator)