Outil pour appliquer la compression LZW. Lempel-Ziv-Welch (LZW) est un algorithme de compression de données sans pertes créé par Abraham Lempel, Jacob Ziv, et Terry Welch.
Compression LZW - dCode
Catégorie(s) : Compression
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
LZW est un algorithme de compression de données qui permet de réduire la taille de fichiers en utilisant un dictionnaire de taille variable.
L'algorithme d'encodage LZW s'initialise avec un dictionnaire prédéfini (comme les 128 valeurs ASCII) et encode les caractères par un numéro correspondant à leur entrée dans le dictionnaire.
Exemple : Le message clair DECODED qui peut s'écrire 3,4,2,14,3,4,3 (ensemble de 7 éléments) avec le dictionnaire 0:A,1:B,2:C,…,25:Z.
A chaque étape, regarder si la sous-chaine est dans le dictionnaire, si elle n'y est pas, faire évoluer le dictionnaire qui enregistre alors une nouvelle entrée constituée des deux dernières entrées trouvées.
Exemple : Etape 1, recherche de DE, qui n'existe pas dans le dictionnaire. Enregistrer DE (position 26) et sauvegarder en sortie la position de D (position 3).
Etape 2, recherche de EC, qui n'existe pas dans le dictionnaire. Enregistrer EC (position 27) et sauvegarder en sortie la position de E (position 4). Ainsi de suite pour les étapes 3 et 4.
Etape 5, recherche à nouveau de DE, cette fois DE existe dans le dictionnaire, passer à l'étape 6.
Etape 6, recherche de DED, qui n'existe pas dans le dictionnaire. Enregistrer DED (position 30) et sauvegarder en sortie la position de DE (position 26).
Le dictionnaire est devenu 0:A,1:B,…,25:Z,26:DE,27:EC,28:CO,29:OD,DED:30
Le message chiffré est composé des nombres sauvegardés en sortie.
Exemple : Le message chiffré est 3,4,2,14,26,3 (constitué de 6 éléments, le message a bien été compressé)
La décompression/déchiffrement nécessite de connaitre le dictionnaire et la suite de valeurs issue de la compression.
Exemple : Soient le message chiffré 3,4,2,14,26,3 et le dictionnaire 0:A,1:B,2:C,…,25:Z
Pour chaque valeur, regarder les caractères correspondant à la position dans le dictionnaire.
A chaque étape, faire évoluer le dictionnaire comme lors du codage.
Exemple : Etape 1 : 3 correspond à D
Etape 2 : 4 correspond à E, rajouter DE dans le dictionnaire en position 26,
Etape 3 : 2 correspond à C, rajouter EC dans le dictionnaire en position 27, de même pour l'étape 4
Etape 5 : 26 correspond à DE, etc.
Le message clair décompressé est DECODED.
Le message (généralement binaire) est plutôt court (car compressé). Les premières valeurs du message correspondent généralement à des valeurs basiques du dictionnaire (car non compressés) généralement de l'ASCII.
LZW est utilisé dans plusieurs formats de fichiers comme le GIF ou le TIFF.
LZW permet de réduire considérablement la taille de fichiers textuels, ce qui peut être utile pour économiser de l'espace de stockage ou pour accélérer le transfert de tels fichiers sur des réseaux à faible bande passante. LZW est également relativement simple à mettre en œuvre et est souvent utilisé dans les programmes de compression de données.
LZW est moins efficace pour compresser des fichiers binaires (comme des images ou des fichiers audio) que pour des fichiers textuels car ils comportent moins de répétition.
Il existe de nombreuses variantes du LZW améliorant la compression comme le LZ77 et LZ78, le LZMA, le LZSS, ou l'algorithme Deflate. Et il est souvent intéressant de combiner cette compression à la transformée de Burrows-Wheeler ou du codage Huffman.
— LZ77 utilise des fenêtres de texte vu pour trouver des répétitions de séquences de caractères dans le texte à compresser. Lorsqu'il trouve une répétition, il utilise un code qui indique la position de la séquence répétée dans la fenêtre et sa longueur, au lieu de la séquence elle-même, dans le fichier compressé.
— LZMA utilise une approche de compression basée sur l'analyse statistique de la donnée à compresser (chaines de Markov), qui permet de trouver et de remplacer les séquences de données répétées de manière probabiliste.
En pratique, pour indiquer la fin d'un message, un marqueur stop (ou nul) est utilisé. L'algoritme LZW peut alors l'inclure dans son dictionnaire (en première valeur 0 ou en dernière valeur).
En 1978 par Abraham Lempel, Jacob Ziv, et Terry Welch
dCode se réserve la propriété du code source pour "Compression LZW". Sauf code licence open source explicite (indiqué Creative Commons / gratuit), l'algorithme pour "Compression LZW", l'applet ou snippet (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou les fonctions liées à "Compression LZW" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou les données, en téléchargement, script, ou les accès API à "Compression LZW" ne sont pas publics, idem pour un usage hors ligne, PC, mobile, tablette, appli iPhone ou Android !
Rappel : dCode est gratuit.
Le copier-coller de la page "Compression LZW" ou de ses résultats est autorisée (même pour un usage commercial) tant que vous créditez dCode !
L'exportation des résultats sous forme de fichier .csv ou .txt est gratuite en cliquant sur l'icone export
Citer comme source bibliographique :
Compression LZW sur dCode.fr [site web en ligne], consulté le 21/01/2025,