Section courante

A propos

Section administrative du site

 Langage  Elément  Tutoriel  Aide 
ABAP/4
Ada
Assembleur
Assembly & bytecode
ASP (Active Server Pages)
Basic
C
C++
C# (C Sharp)
Cobol
ColdFusion
Fortran
HTML
Java
JavaScript
LISP
Logo
LotusScript
Oberon
Pascal
Perl
PHP
PL/1
Prolog
Python
Rebol
REXX
Ruby
Rust
SAS
NoSQL
SQL
Swift
X++ (Axapta)
GNAT
SMALLAda
VHDL
Assembleur 370
Assembleur 1802
Assembleur 4004
Assembleur 6502
Assembleur 6800
Assembleur 68000
Assembleur 8080 et 8085
Assembleur 8089
Assembleur 80x86
Assembleur AGC4
Assembleur ARM
Assembleur DPS 8000
Assembleur i860
Assembleur Itanium
Assembleur MIPS
Assembleur PDP-11
Assembleur PowerPC
Assembleur RISC-V
Assembleur SPARC
Assembleur SuperH
Assembleur UNIVAC I
Assembleur VAX
Assembleur Z80
Assembleur Z8000
Assembleur z/Architecture
ASSEMBLER/MONITOR 64
Micol Assembler
GFA Assembler
A86
MASM (Macro Assembler)
TASM (Turbo Assembler)
CIL
Jasmin
LLVM
MSIL
Parrot
P-Code (PCode)
SWEET16
G-Pascal
ASP 1.0
ASP 2.0
ASP 3.0
ASP.NET
ASP.NET Core
ABasiC (Amiga)
Adam SmartBASIC
Altair BASIC
AmigaBASIC (Amiga)
AMOS Basic (Amiga)
Atari Basic (Atari 400, 600 XL, 800, 800XL)
Basic Apple II (Integer BASIC/APPLESOFT)
Basic Commodore 64 (CBM-BASIC)
Basic Commodore 128 (BASIC 7.0)
Basic Commodore VIC-20 (CBM-BASIC 2.0)
Basic Coco 1 (Color Basic)
Basic Coco 2 (Extended Color Basic)
Basic Coco 3 (Extended Color Basic 2.0)
BASICA (PC DOS)
Basic Pro
BBC BASIC
Blitz BASIC (Amiga)
DarkBASIC
Dartmouth BASIC
GFA-Basic (Atari ST/Amiga)
GWBASIC (MS-DOS)
Liberty BASIC
Locomotive BASIC (Amstrad CPC)
MSX-Basic
Omikron Basic (Atari ST)
Oric Extended Basic
Power Basic
Quick Basic/QBasic (MS-DOS)
Sinclair BASIC (ZX80, ZX81, ZX Spectrum)
ST BASIC (Atari ST)
Turbo Basic
Vintage BASIC
VBScript
Visual Basic (VB)
Visual Basic .NET (VB .NET)
Visual Basic pour DOS
Yabasic
BeckerBASIC
SIMONS' BASIC
Basic09 d'OS-9
Disk Extended Color Basic
Basic09 d'OS-9
Disk Extended Color Basic
Access
Excel
Visual Basic pour Windows
Visual Basic .NET pour Windows
C Shell Unix (csh)
C pour Amiga
C pour Atari ST
C pour DOS
C pour Falcon030
C pour GEMDOS (Atari ST)
C pour Linux
C pour PowerTV OS
C pour OS/2
C pour Unix
C pour Windows
Aztec C
CoCo-C
GNU C
HiSoft C
IBM C/2
Introl-C
Lattice C
Microsoft C
MinGW C
MSX-C
Open Watcom C
OS-9 C Compiler
Pure C
Quick C
Turbo C
HiSoft C for Atari ST
HiSoft C for CP/M (Amstrad CPC)
C++ pour OS/2
C++ pour Windows
Borland C++
C++Builder
IBM VisualAge C++
Intel C++
MinGW C++
Open Watcom C++
Symantec C++
Turbo C++
Visual C++
Visual C++ .NET
Watcom C++
Zortech C++
C# (C Sharp) pour Windows
Apple III Cobol
Microsoft Cobol
BlueDragon
Lucee
OpenBD
Railo
Smith Project
Microsoft Fortran
WATFOR-77
CSS
FBML
Open Graph
SVG
XML
XSL/XSLT
LESS
SASS
GCJ (GNU)
JSP
Jython
Visual J++
Node.js
TypeScript
AutoLISP
ACSLogo
LotusScript pour Windows
Amiga Oberon
Oberon .NET
Apple Pascal
Delphi/Kylix/Lazarus
Free Pascal
GNU Pascal
HighSpeed Pascal
IBM Personal Computer Pascal
Lisa Pascal
Maxon Pascal
MPW Pascal
OS-9 Pascal
OSS Personal Pascal
Pascal-86
Pascal du Cray Research
Pascal/VS
Pascal-XT
PURE Pascal
QuickPascal
RemObjets Chrome
Sun Pascal
THINK Pascal
Tiny Pascal (TRS-80)
Turbo Pascal
UCSD Pascal
VAX Pascal
Virtual Pascal
Turbo Pascal for CP/M-80
Turbo Pascal for DOS
Turbo Pascal for Macintosh
Turbo Pascal for Windows
CodeIgniter (Cadre d'application)
Drupal (Projet)
Joomla! (Projet)
Phalanger (PHP .NET)
phpBB (Projet)
Smarty (balise)
Twig (balise)
Symfony (Cadre d'application)
WordPress (Projet)
Zend (Cadre d'application)
PL360
PL/M-80
PL/M-86
Turbo Prolog
CPython
IronPython
Jython
PyPy
AREXX
Regina REXX
JMP
Btrieve
Cassandra
Clipper
CouchDB
dBASE
Hbase
Hypertable
MongoDB
Redis
Access
BigQuery
DB2
H2
Interbase
MySQL
Oracle
PostgreSQL
SAP HANA
SQL Server
Sybase
U-SQL
Introduction
Configuration de l'environnement de développement
Fabriquer le LibSass
Profilage de LibSass
Utilisation de l'API
LibSass et Unicode
Composantes internes de SourceMap
Allocateur de mémoire personnalisé
Implémentation du pointeur intelligent LibSass
Les plugiciels
Compilation avec des fichiers makefiles
Compilation avec autotools
Compilation de LibSass avec MinGW (makefiles)
Compilation de LibSass avec Visual Studio
Compilation sur Mac OS X
Création d'une bibliothèque système partagée
Ebuilds pour Gentoo Linux
Contexte Sass
Valeur Sass
Fonction Sass
Importateur Sass
Exemple de code pour le contexte Sass
Contexte Sass interne
Exemple de code pour la valeur Sass
Valeur Sass interne
Exemple de code pour la fonction Sass
Fonction Sass interne
Exemple de code pour l'importateur Sass
Importateur Sass interne
Préface
Notes légales
Dictionnaire
Recherche

LibSass et Unicode

Actuellement, LibSass s'attend à ce que toutes les entrées soient encodées en UTF8 (et ne génère que ce format), même si vous avez des caractères Unicode. La conversion entre les encodages n'est pas prise en charge, même si vous la déclarez avec une règle @charset. Le texte ci-dessous a été initialement publié comme un problème sur le suivi LibSass. Depuis, l'état est obsolète : LibSass s'attend désormais à ce que vos entrées soient compatibles UTF8/ASCII. Il a été prouvé que la lecture des encodages ANSI (par exemple, les encodages sur un octet) en UTF8 peut entraîner des comportements inattendus, pouvant dans le pire des cas entraîner des dépassements de tampon ou des erreurs de segmentation. Par conséquent, LibSass vérifie désormais que vos entrées sont bien encodées en UTF8 !

Déclaration des encodages de caractères en CSS

Ceci explique comment l'encodage des caractères d'un fichier CSS est déterminé. Comme il ne traite que des fichiers locaux, ils n'ont jamais d'entête HTTP. La priorité devrait donc être la règle «charset», le marqueur d'ordre des octets (BOM) ou la détection automatique (avec retour final à la valeur par défaut du système/UTF-8). Cela peut paraître simple à mettre en ouvre, mais qu'en est-il des règles d'importation ? Les spécifications CSS n'interdisent pas le mélange de différents encodages ! Ils ont résolu ce problème en convertissant tous les fichiers en UTF-8 en interne. Lors de l'écriture, une option permet d'indiquer à l'outil l'encodage souhaité (UTF-8 par défaut). Il est également possible de définir s'il doit écrire un BOM ou non et s'il doit ajouter la déclaration de l'ensemble de caractères.

Leur outil étant écrit en Perl, il dispose de nombreux utilitaires pour gérer différents ensembles de caractères Unicode. La plupart des logiciels libres utilisent ICU ou libiconv pour effectuer la conversion entre différents encodages. Ils n'ont pas encore une idée de la facilité/difficulté d'intégration, quelle que soit la plateforme (cela semble faisable). L'encodage ANSI (codage sur un octet) vers UTF-8 se résume à une table de conversion (pour chaque page de code prise en charge).

État actuel de la prise en charge Unicode de LibSass

LibSass est/devrait être entièrement compatible UTF (et donc ASCII simple).

LibSass 3.5 garantit que votre entrée est soit en ASCII simple (caractères inférieurs à 127), soit en UTF-8. Il ne gère rien d'autre, mais garantit donc que la sortie est valide. Avant la version 3.5, il était possible de mélanger différentes pages de codes, ce qui provoquait des comportements inattendus.

Détection automatique de l'encodage actuel

LibSass lit actuellement tous les types de BOM et génère une erreur s'il détecte un élément qu'il ne sait pas gérer ! Il semble qu'il supprime le BOM UTF-8 facultatif (s'il en trouve un). À mon avis, il serait appréciable que les utilisateurs puissent configurer cela (y compris si une règle de l'ensemble de caractères doit être ajoutée à la sortie). Cependant, il ne prend pas réellement en compte les @charsets : il suppose toujours que votre entrée est en UTF-8 et ignore tout @charset donné !

Ce qui n'est pas pris en charge actuellement :

Ce qui manque pour prendre en charge les cas ci-dessus

Fonctionnalité de faible priorité

Il suppose que l'implémentation actuelle devrait gérer plus de 99 % des cas d'utilisation réels. A) Les caractères Unicode sont encore rarement utilisés (car ils peuvent être écrits avec un échappement).

Il suppose que le plus gros problème réside dans la dépendance de la bibliothèque libiconv/ICU (ou autre). Comme elle contient de nombreuses règles de conversion, je pense que c'est la seule façon de gérer cela correctement. Une fois ce problème résolu, il devrait être assez simple d'implémenter les éléments manquants (dans parser.cpp : Parser::parse devrait renvoyer l'encodage et ajouter Parser::sniff_charset, puis convertir le flux d'octets source en UTF-8).

Il espère que les affirmations ci-dessus sont vraies. Unicode n'est vraiment pas le sujet le plus simple à appréhender.



PARTAGER CETTE PAGE SUR
Dernière mise à jour : Mardi, le 8 octobre 2024