Section courante

A propos

Section administrative du site

 Langage  Elément  Bibliothèque  Module  Annexe  Aide 
ABAP/4
Ada
Assembleur
Assembly & bytecode
ASP (Active Server Pages)
Basic
C
C++
C# (C Sharp)
Cobol
ColdFusion
Fortran
HTML
Java
JavaScript
LISP
Logo
LotusScript
Oberon
Pascal
Perl
PHP
PL/1
Prolog
Python
Rebol
REXX
Ruby
Rust
SAS
NoSQL
SQL
Swift
X++ (Axapta)
GNAT
SMALLAda
VHDL
Assembleur 370
Assembleur 1802
Assembleur 4004
Assembleur 6502
Assembleur 6800
Assembleur 68000
Assembleur 8080 et 8085
Assembleur 8089
Assembleur 80x86
Assembleur AGC4
Assembleur ARM
Assembleur DPS 8000
Assembleur i860
Assembleur Itanium
Assembleur MIPS
Assembleur PDP-11
Assembleur PowerPC
Assembleur RISC-V
Assembleur SPARC
Assembleur SuperH
Assembleur UNIVAC I
Assembleur VAX
Assembleur Z80
Assembleur Z8000
Assembleur z/Architecture
ASSEMBLER/MONITOR 64
Micol Assembler
GFA Assembler
A86
MASM (Macro Assembler)
TASM (Turbo Assembler)
CIL
Jasmin
LLVM
MSIL
Parrot
P-Code (PCode)
SWEET16
G-Pascal
ASP 1.0
ASP 2.0
ASP 3.0
ASP.NET
ASP.NET Core
ABasiC (Amiga)
Adam SmartBASIC
Altair BASIC
AmigaBASIC (Amiga)
AMOS Basic (Amiga)
Atari Basic (Atari 400, 600 XL, 800, 800XL)
Basic Apple II (Integer BASIC/APPLESOFT)
Basic Commodore 64 (CBM-BASIC)
Basic Commodore 128 (BASIC 7.0)
Basic Commodore VIC-20 (CBM-BASIC 2.0)
Basic Coco 1 (Color Basic)
Basic Coco 2 (Extended Color Basic)
Basic Coco 3 (Extended Color Basic 2.0)
BASICA (PC DOS)
Basic Pro
BBC BASIC
Blitz BASIC (Amiga)
DarkBASIC
Dartmouth BASIC
GFA-Basic (Atari ST/Amiga)
GWBASIC (MS-DOS)
Liberty BASIC
Locomotive BASIC (Amstrad CPC)
MSX-Basic
Omikron Basic (Atari ST)
Oric Extended Basic
Power Basic
Quick Basic/QBasic (MS-DOS)
Sinclair BASIC (ZX80, ZX81, ZX Spectrum)
ST BASIC (Atari ST)
Turbo Basic
Vintage BASIC
VBScript
Visual Basic (VB)
Visual Basic .NET (VB .NET)
Visual Basic pour DOS
Yabasic
BeckerBASIC
SIMONS' BASIC
Basic09 d'OS-9
Disk Extended Color Basic
Basic09 d'OS-9
Disk Extended Color Basic
Access
Excel
Visual Basic pour Windows
Visual Basic .NET pour Windows
C Shell Unix (csh)
C pour Amiga
C pour Atari ST
C pour DOS
C pour Falcon030
C pour GEMDOS (Atari ST)
C pour Linux
C pour PowerTV OS
C pour OS/2
C pour Unix
C pour Windows
Aztec C
CoCo-C
GNU C
HiSoft C
IBM C/2
Introl-C
Lattice C
Microsoft C
MinGW C
MSX-C
Open Watcom C
OS-9 C Compiler
Pure C
Quick C
Turbo C
HiSoft C for Atari ST
HiSoft C for CP/M (Amstrad CPC)
C++ pour OS/2
C++ pour Windows
Borland C++
C++Builder
IBM VisualAge C++
Intel C++
MinGW C++
Open Watcom C++
Symantec C++
Turbo C++
Visual C++
Visual C++ .NET
Watcom C++
Zortech C++
C# (C Sharp) pour Windows
Apple III Cobol
Microsoft Cobol
BlueDragon
Lucee
OpenBD
Railo
Smith Project
Microsoft Fortran
WATFOR-77
CSS
FBML
Open Graph
SVG
XML
XSL/XSLT
LESS
SASS
GCJ (GNU)
JSP
Jython
Visual J++
Node.js
TypeScript
AutoLISP
ACSLogo
LotusScript pour Windows
Amiga Oberon
Oberon .NET
Apple Pascal
Delphi/Kylix/Lazarus
Free Pascal
GNU Pascal
HighSpeed Pascal
IBM Personal Computer Pascal
Lisa Pascal
Maxon Pascal
MPW Pascal
OS-9 Pascal
OSS Personal Pascal
Pascal-86
Pascal du Cray Research
Pascal/VS
Pascal-XT
PURE Pascal
QuickPascal
RemObjets Chrome
Sun Pascal
THINK Pascal
Tiny Pascal (TRS-80)
Turbo Pascal
UCSD Pascal
VAX Pascal
Virtual Pascal
Turbo Pascal for CP/M-80
Turbo Pascal for DOS
Turbo Pascal for Macintosh
Turbo Pascal for Windows
CodeIgniter (Cadre d'application)
Drupal (Projet)
Joomla! (Projet)
Phalanger (PHP .NET)
phpBB (Projet)
Smarty (balise)
Twig (balise)
Symfony (Cadre d'application)
WordPress (Projet)
Zend (Cadre d'application)
PL360
PL/M-80
PL/M-86
Turbo Prolog
CPython
IronPython
Jython
PyPy
AREXX
Regina REXX
JMP
Btrieve
Cassandra
Clipper
CouchDB
dBASE
Hbase
Hypertable
MongoDB
Redis
Access
BigQuery
DB2
H2
Interbase
MySQL
Oracle
PostgreSQL
SAP HANA
SQL Server
Sybase
U-SQL
Introduction
Compression
Cryptographie
Encodage
CCITT Group 3
Huffman
LZ77
LZW
PackBits
Chiffre de César
AES
DES
MD5
SHA-1
base64
CryptoAuthLib
CryptoLib4Pascal
Delphi-OpenSSL
HashLib4Pascal
OpenSSL
hashlib
Structure de fichiers compressé
ARC
ARJ
CAB
JAR
gz
PAK
RAR
SWG
WAR
ZIP
ZOO
Préface
Notes légal
Dictionnaire
Recherche

LZ77

La compression LZ77, tire son nom de l'abréviation de «Ziv et Lempel 1977». Il s'agit d'une méthode de compression étant relativement facile à mettre en oeuvre et le décodage peut être effectué très rapidement en utilisant seulement une petite quantité de mémoire. Pour ces raisons, il est particulièrement adapté lorsque les ressources nécessaires au décodage doivent être minimisées, comme lorsque des données sont distribuées ou diffusées depuis une source centrale vers un certain nombre de petits ordinateurs. Comme de nombreuses méthodes de compression, le LZ77 s'explique le plus facilement en termes de décodage. La sortie se compose d'une série de triplets. La première composante d'un triplet indique la distance à parcourir dans le texte précédent (décodé) pour trouver la phrase suivante, la deuxième composante enregistre la longueur de la phrase et le troisième donne le caractère suivant de l'entrée. Les deux premiers éléments constituent un pointeur de retour dans le texte. Strictement, le troisième n'est nécessaire que lorsque le caractère à coder n'apparaît nulle part dans l'entrée précédente; il est inclus dans chaque triple pour des raisons de simplicité. Ainsi, prenons pour exemple «abaabab». Le décodeur remonte de cinq caractères dans le texte décodé (au troisième depuis le début) et copie trois caractères, produisant la phrase aab. Le troisième élément du triple, b, le décode, le décodeur commence à copier à partir d'un caractère en arrière (le b) et copie les 10 caractères suivants. Malgré la référence récursive, chacun des caractères sera disponible avant qu'il ne soit nécessaire, produisant 10 b consécutifs. De cette façon, une sorte de codage de longueur est archivée. La méthode de compression LZ77 impose des limites sur la distance à laquelle un pointeur peut se référer et la taille maximale de la chaîne à laquelle il est fait référence. Pour le texte français, il est peu avantageux de permettre à la portée des pointeurs de dépasser une fenêtre de quelques milliers de caractères. Par exemple, si la fenêtre est limitée à 8 192 caractères, la quantité de texte qu'elle contient équivaut à plusieurs pages de livre et la première composante du triple peut être représenté en 13 bits. Si vous étendez la portée du pointeur au-delà de cela, vous augmentez le texte du pointeur. La deuxième composante du triple, la longueur de la phrase, est également limitée, généralement à environ 16 caractères. Encore une fois, les correspondances plus longues que ceux-ci sont rares et ne justifient pas d'allouer de l'espace supplémentaire au nombre représentant la longueur de la phrase. La recherche d'une correspondance peut renvoyer une longueur nulle, auquel cas la position de la correspondance n'est pas pertinente. Notez que le décodeur est simplement une petite boucle copiant à partir d'un tableau. En pratique, le tableau peut être un tampon circulaire de caractères W et les caractères sont écrits dans la sortie au fur et à mesure de leur décodage. La méthode LZ77 a été progressivement affinée aux systèmes ayant des mise en oeuvre pour les pointeurs. Pour la première composante (le déplacement), il peut être efficace d'utiliser des mots de code plus courts car les correspondances récentes sont plus courantes que les mots distants. La deuxième composante d'un pointeur (la longueur de correspondance) peut être représenté plus efficacement avec des codes de longueur variable utilisant moins de bits pour représenter des nombres plus petits. De plus, dans de nombreux schémas, le troisième élément du triple, le caractère, n'est inclus que lorsque cela est nécessaire. Par exemple, un indicateur d'un bit peut être utilisé pour indiquer si l'élément suivant dans la sortie est un pointeur (déplacement et longueur de correspondance) ou un caractère.

Algorithme

Voici l'algorithme du LZ77 :

* Entrée : Chaîne de caractères S
* Paramètres : taille_max_fenetre (taille de la fenêtre glissante), taille_max_séquence (longueur maximale des séquences à encoder)
* Sortie : Liste de triplets (décalage, longueur, caractère_suivant)

MODULE LZ77
   Initialiser une liste vide result pour entreposer les triplets
   Initialiser position à 0

   BOUCLE TANT QUE position < longueur(S) FAIRE
      * Initialiser les variables de meilleure correspondance
      meilleur_décalage ← 0
      meilleure_longueur ← 0
      caractère_suivant ← S[position]

      * Définir la fenêtre de recherche
      fenêtre_début ← max(0, position - taille_max_fenetre)

      BOUCLE POUR i ← fenêtre_début JUSQU'À position - 1 FAIRE
         longueur ← 0

         BOUCLE TANT QUE (longueur < taille_max_séquence) ET (position + longueur < longueur(S)) ET (S[i + longueur] = S[position + longueur]) FAIRE
            longueur ← longueur + 1
         FIN BOUCLE TANT QUE

         SI longueur > meilleure_longueur ALORS
            meilleure_longueur ← longueur
            meilleur_décalage ← position - i
            SI position + longueur < longueur(S) ALORS
               caractère_suivant ← S[position + longueur]
            SINON
               caractère_suivant ← ""
            FIN SI
         FIN SI
      FIN BOUCLE POUR

      * Ajouter le triplet (décalage, longueur, caractère suivant) à result
      Ajouter (meilleur_décalage, meilleure_longueur, caractère_suivant) à result

      * Avancer la position dans la chaîne de caractères
      position ← position + meilleure_longueur + 1

   FIN BOUCLE TANT QUE
   RETOURNE result


PARTAGER CETTE PAGE SUR
Dernière mise à jour : Samedi, le 18 mai 2019