Outil d'analyse de fréquences, une méthode de cryptanalyse consistant à examiner la fréquence des lettres ou groupes de lettres employées dans un message chiffré.
Analyse des Fréquences - dCode
Catégorie(s) : Cryptanalyse
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
L'analyse fréquentielle est l'étude de la répartition (et du décompte) des lettres dans un texte. Elle facilite la cryptanalyse et le déchiffrement de messages chiffrés par substitution en se basant sur le fait que certaines lettres ou combinaisons de lettres n'apparaissent pas aussi souvent que d'autres dans les langages : en français, E est la lettre la plus utilisée, alors que W l'est beaucoup moins.
L'analyse des fréquences génère un histogramme qui permet de comparer les distributions statistiques avec celles d'un modèle de référence (la langue du texte clair). Cette comparaison peut théoriquement permettre de déchiffrer un texte en rapprochant les fréquences d'apparition des lettres du message codé avec les fréquences théoriques d'apparition des lettres dans la langue du texte clair.
L'attaque par analyse des fréquences est particulièrement efficace sur les chiffrements monoalphabétiques. Ces systèmes ne modifient pas la distribution statistique des lettres, ce qui permet d'établir une correspondance entre le texte chiffré et le texte clair.
Pour réaliser une substitution alphabétique à l'aide d'une analyse fréquentielle, il convient de remplacer le symbole le plus fréquent par la lettre E (qui est la lettre la plus fréquente en français), et d'en déduire les autres. Ce principe n'est véritablement applicable que si le cryptogramme contient une grande quantité de symboles afin que les fréquences soient statistiquement significatives.
L'analyse des fréquences ne se limite pas aux lettres individuelles mais peut aussi s'appliquer aux groupes de lettres (ngrammes) pour les chiffrements polygrammiques.
Certains chiffrements ont pour signature la présence ou l'absence de lettres répétées dans un bigramme ou trigramme.
Pour certaines analyses de ngrammes, il convient d'utiliser le mode Fenêtre glissante :
Exemple : DECODE donne les bigrammes DE,CO,DE (mode par blocs)
Exemple : DECODE donne les bigrammes DE,EC,CO,OD,DE (mode fenêtre glissante)
Si le texte est trop court alors les variations statistiques sont trop importantes et l'analyse des fréquences est moins précise.
L'analyse des fréquences est également moins pertinente lorsque le message a été chiffré avec un chiffrement polyalphabétique (qui tend à rendre aléatoire la fréquence des lettres), ou lorsque le chiffrement est homophonique (plusieurs caractères chiffrés différents pour une même lettre clair) ou polygrammique (des groupes de caractères remplacent chaque lettre). Dans ces cas, l'analyse ne permet pas un décodage mais permet de filtrer ou de retrouver le type de chiffrement utilisé.
Lettres par fréquences d'apparition en français :
E | 17.3 % | P | 3.0 % |
---|---|---|---|
A | 8.4 % | G | 1.3 % |
S | 8.1 % | V | 1.3 % |
I | 7.3 % | B | 1.1 % |
N | 7.1 % | F | 1.1 % |
T | 7.1 % | Q | 1.0 % |
R | 6.6 % | H | 0.9 % |
L | 6.0 % | X | 0.4 % |
U | 5.7 % | J | 0.3 % |
O | 5.3 % | Y | 0.3 % |
D | 4.2 % | K | 0.1 % |
C | 3.0 % | W | 0.1 % |
M | 3.0 % | Z | 0.1 % |
A titre de comparaison, voici les fréquences en anglais :
E | 12.7 % | M | 2.4 % |
---|---|---|---|
T | 9.1 % | W | 2.4 % |
A | 8.2 % | F | 2.2 % |
O | 7.5 % | G | 2.0 % |
I | 7.0 % | Y | 2.0 % |
N | 6.7 % | P | 1.9 % |
S | 6.3 % | B | 1.5 % |
H | 6.1 % | V | 1.0 % |
R | 6.0 % | K | 0.8 % |
L | 4.0 % | J | 0.2 % |
D | 4.3 % | X | 0.2 % |
C | 2.8 % | Q | 0.1 % |
U | 2.8 % | Z | 0.1 % |
dCode se réserve la propriété du code source pour "Analyse des Fréquences". Tout algorithme pour "Analyse des Fréquences", applet ou snippet ou script (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou toutes fonctions liées à "Analyse des Fréquences" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou toute base de données, ou accès API à "Analyse des Fréquences" ou tout autre élément ne sont pas publics (sauf licence open source explicite type Creative Commons). Idem avec le téléchargement pour un usage hors ligne sur PC, mobile, tablette, appli iPhone ou Android.
Rappel : dCode est une ressource éducative et pédagogique, accessible en ligne gratuitement et pour tous.
Le contenu de la page "Analyse des Fréquences" ainsi que ses résultats peuvent être copiés et réutilisés librement, y compris à des fins commerciales, à condition de mentionner dCode.fr comme source.
L'export des résultats est gratuit et se fait simplement en cliquant sur les icônes d'export ⤓ (format .csv ou .txt) ou ⧉ copier-coller.
Pour citer dCode.fr sur un autre site Internet, utiliser le lien :
Dans un article scientifique ou un livre, la citation bibliographique recommandée est : Analyse des Fréquences sur dCode.fr [site web en ligne], consulté le 24/04/2025,
Besoin d'Aide ?
Rendez-vous sur notre communauté Discord dCode pour participer au forum d'entraide !
PS : Pour les messages codés, testez notre détecteur de chiffrement !
Questions / Commentaires
Remarques et suggestions sont les bienvenues afin que dCode propose le meilleur outil 'Analyse des Fréquences' gratuit ! Merci !