UNICODE |
Unicode |
---|---|
Python |
Syntaxe
unicode(object) |
unicode(object, encoding) |
unicode(object, encoding, errors) |
Paramètres
Nom | Description |
---|---|
object | Ce paramètre permet d'indiquer l'objet à convertir en chaîne de caractères. |
encoding | Ce paramètre optionnel permet d'indiquer la chaîne de caractères encodé. |
errors | Ce paramètre optionnel permet d'indiquer la manière qu'il faut gérer les erreurs. |
Description
Cette fonction permet de retourner une version de chaîne de caractères Unicode de l'objet.
Algorithme
MODULE UNICODE(objet, encodage="utf-8", erreurs="strict") SI objet est déjà une chaîne de caractères Unicode ALORS RETOURNE objet SINON SI objet est un type de chaîne de caractères (str) ALORS Décoder objet en utilisant encodage et erreurs, et retourner le résultat en tant que chaîne Unicode SINON Appeler la méthode __unicode__ de objet s'il est défini, sinon convertir objet en str puis le décoder FIN SI |
Remarques
- Si un codage et/ou des erreurs sont donnés, la fonction unicode() décodera l'objet pouvant être soit une chaîne de caractères de 8 bits, soit un tampon de caractères utilisant le codec pour le codage. Le paramètre encoding est une chaîne de caractères donnant le nom d'un encodage; si le codage n'est pas connu, l'exception LookupError est déclenchée. La gestion des erreurs se fait en fonction du paramètre errors; ce paramètre spécifie le traitement des caractères non valides dans le codage d'entrée. Si les erreurs sont 'strict' (c'est la valeur par défaut), une erreur ValueError est déclenchée sur les erreurs, tandis qu'une valeur 'ignore' fait en sorte que les erreurs sont silencieusement ignorées, et une valeur 'replace' provoque le caractère de remplacement Unicode officiel, U+FFFD, à utiliser pour remplacer les caractères saisis ne pouvant pas être décodés. Voir devriez également consulter le module codecs pour des situations plus personnalisés.
- Si aucun paramètre facultatif n'est donné, la fonction unicode() imitera le comportement de la fonction str() sauf qu'il renvoie des chaînes de caractères Unicode au lieu de chaînes de caractères 8 bits. Plus précisément, si l'objet est une chaîne de caractères ou une sous-classe Unicode, il retournera cette chaîne de caractères Unicode sans aucun décodage supplémentaire appliqué.
- Pour les objets fournissant une méthode __unicode__(), il appellera cette méthode sans paramètres pour créer une chaîne de caractères Unicode. Pour tous les autres objets, la version ou la représentation de chaîne de caractères 8 bits est demandée, puis convertie en chaîne de caractères Unicode en utilisant le codec pour l'encodage par défaut en mode «strict».
Dernière mise à jour : Mercredi, le 14 septembre 2016