Criptografía: método de las frecuencias

La Criptografía (Kriptos=ocultar, Graphos=escritura) es la técnica, ciencia o arte de la escritura secreta. Consiste en transformar un mensaje inteligible, denominado texto plano, en otro que sólo puedan entender las personas autorizadas a ello, que llamaremos criptograma o texto cifrado.

Un poco de criptografía

La Criptografía es una rama de las Matemáticas, cuyo principio básico es mantener la privacidad de la comunicación entre dos personas alterando el mensaje original de modo que sea incomprensible a toda persona distinta del destinatario. Se complementa con el Criptoanálisis, que es la técnica de descifrar textos cifrados sin tener autorización para ellos, es decir, realizar una especie de Criptografía inversa. Ambas técnicas forman la ciencia llamada Criptología.

Desde la antigüedad hasta nuestros días se han mandado mensajes secretos. Hasta hace pocos años los códigos secretos tenían como únicos usuarios a los diplomáticos y a los militares, que intercambiaban mensajes sin que pudiesen ser leídos por otras personas. Debido a los cambios en las telecomunicaciones, los bancos y el tipo de vida, los códigos secretos se usan ampliamente para proteger los archivos de computadora, transferencias electrónicas de fondos y el correo electrónico.

Ejemplos de Criptogramas simples:

  • Cuenta que, cuando César Augusto escribía sus mensajes, sustituía cada letra por la siguiente del alfabeto. Así, por ejemplo,
    "césar" se convertía en "DFTBS".
  • Cifrado de Cesar
    Algo más sofisticado, Julio César reemplazaba cada letra por la que estaba tres lugares más adelante en el alfabeto. Esta vez, por lo tanto,
    "césar" pasaba a ser "FHVDU"

    Ejemplo cifrado de Cesar generalizado. ¡Pruébalo tu mismo!

    Si pones como clave D quiere decir que A-->D, B-->E y así sucesivamente. No se cifran signos de puntuacion letras acentuadas o eñes.

    Clave (B - Z)
    ¡Sólo una letra!
    Texto plano
    Texto cifrado

    Un cifrado de este tipo es ridículamente fácil de romper (pero también fue muy muy fácil de hacer), basta con probar los 25 posibles desplazamientos desde P+1 hasta P+25 y con una ojeada sabremos cual es el mensaje.

  • Cifrado con clave
    Hay algunas formas de mejorar este método sin complicarlo demasiado, por ejemplo elegir una palabra clave con todas sus letras diferentes, supongamos que elegimos ESTUDIA. Escribimos entonces el alfabeto normal junto con el transformado siguiente:
               A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 
               E S T U D I A B C F G H J K L M N O P Q R V W X Y Z

    y ahora el mensaje"césar" con el cifrado sería "TDPEO"

    (Por convención criptográfica, las letras del texto plano, es decir, el texto original, se escriben en minúsculas, y las del texto cifrado, en mayúsculas)

    Un ataque de fuerza bruta para descodificar este tipo de criptogramas es "algo" más costoso pues se debería intentar con todos los alfabetos de sustitución posibles que son 26!=403.291.461.126.605.635.584.000.000

    Este método tiene la siguiente debilidad: con ciertas claves las letras finales del alfabeto quedan sin modificar y esto facilita mucho la labor del criptoanalista. Esto pasa con la clave de nuestro ejemplo, mejor escogerla de modo que aparezcan en ella letras como V U Z cercanas al final del alfabeto y que producen un mayor "desorden" en el alfabeto transformado.

    Para seguir jugando puedes descargar el programa del blog Epsilones Encripsus.exe (37 Kb), que encripta y descifra mensajes cifrados a partir de una clave, como el del ejemplo que se acaba de explicar.

Estos métodos, sin embargo, no son difíciles de descifrar. De hecho, actualmente se conoce la frecuencia con la que se utiliza cada letra en los niveles de lengua coloquiales, por lo que un simple análisis estadístico permite reconstruir un texto largo de manera casi automática, esta técnica se llama análisis de frecuencias

Descifrado por análisis de frecuencias

El Análisis por frecuencias para descifrar criptogramas se basa en estudiar la frecuencia con la que aparecen los distintos símbolos en un lenguaje determinado y luego estudiar la frecuencia con la que aparecen en los criptogramas, y de esta manera establecer una relación y obtener el texto plano.

La idea fundamental es que no todas las letras aparecen con la misma frecuencia en los textos, sino que algunas aparecen más a menudo que otras. Contando las signos del texto cifrado y ordenándolos de mayor a menor frecuencia podemos establecer conjeturas acerca de qué letra corresponde a cada signo. El análisis se completa con la búsqueda de palabras frecuentes como artículos y preposiciones. Si además conocemos o sospechamos de alguna palabra que deba aparecer en el mensaje, mejor que mejor. El resto es cuestión de intuición

Según un estudio sobre textos del diario El País de Enrique Fontanillo(la muestra tomadad son los ejemplares de dicho diario publicados durante una semana, 52619 letras en total). ), la frecuencia de las letras en castellano es aproximadamente la que sigue:

Frecuencia alta Frecuencia media Frecuencia baja
Letra Frecuencia % Letra Frecuencia % Letra Frecuencia %
E 16.78 R 4.94 Y 1.54
A 11.96 U 4.80 Q 1.53
O 8.69 I 4.15 B 0.92
L 8.37 T 3.31 H 0.89
S 7.88 C 2.92 G 0.73
N 7.01 P 2.76 F 0.52
D 6.87 M 2.12

El resto de las letras: V, J, Ñ, Z, X ,K, W tienen frecuencias inferiores a 0.5% y se pueden considerar por tanto "raras". Resumiendo los datos anteriores y aplicándolos por grupos de letras podríamos decir que:

  • Las vocales ocuparán alrededor del 47% del texto.

  • Sólo la E y la A se identifican con relativa fiabilidad porque destacan mucho sobre las demás.

  • Las letras de frecuencia alta suponen un 68% del total.

  • Las consonantes más frecuentes: L,S,N,D (alrededor del 30%)

  • Las seis letras menos frecuentes: V,Ñ,J,Z,X y K (poco más del 1%)

El de análisis de frecuencias, fue desarrollada primeramente por los árabes cuando estaban buscando la frecuencia con la que ciertas palabras aparecían en el Corán para dilucidar la cronología de las palabras del Profeta.

Para comprender en detalle cómo funciona este método vamos a ver unos ejemplos

Empezaremos por descifrar esta frase célebre de Galileo Galilei:

TATIG NK KTIUTZXGJU ATG VKXYUTG ZGT OMTUXGTZK WAK TU YK VAKJG GVXKTJKX TGJG JK KRRG

Contabilizamos los símbolos que aparecen en el mensaje secreto. Al que aparece con mayor frecuencia le asignamos a o e (destacan abrumadoramente en castellano y son las dos primeras que debes intentar identificar); en nuestro ejemplo se observa que las letras más repetidas son la "G" y "K" , podríamos conjeturar que se corresponde con la "a" y "e" (como es un mensaje de pocas letras en estes caso hay más "a" que "e"). El siguiente grupo de letras a encontrar es (o, l, s, n, d ) y así sucesivamente con las demás letras pueden averiguarse las suficientes como para poder leer el mensaje original.

nunca he encontrado una persona tan ignorante que no se pueda aprender nada de ella

En mensajes más largos es conveniente después del recuento de las letras, organizar los resultados en una tabla ordenada de frecuencias, como explica Edgar Allan Poe en el Escarabajo de Oro.

El Escarabajo de Oro de Allan Poe

Todo el mundo recuerda a Edgar Allan Poe como escritor de historias de misterio, aunque pocos conocen su vertiente de criptoanalista. Y era bueno. Un ejemplo de esta afición lo tenemos en su relato El Escarabajo de Oro, donde presenta un mensaje cifrado y explica cómo el protagonista logra resolverlo. En él se dan pistas sobre el proceso que se sigue para descifrar este mensaje.

53‡‡†305))6*;4826)4‡.)4‡);806*;48†8¶60))85;1‡(;:‡*8†
83(88)5*†;46(;88*96*;8)*‡(;485);5 *†2:*‡ (;4956*2(5*—4)8¶8*;4069285);)6†8)4‡‡;1 (‡9;48081;8:8‡1;48†85;4)485†528806 *81(‡9;48;(88;4(‡?34; 48)4‡;161;:188;‡?;

  • Mensaje descifrado
  • A good glass in the bishop's hostel in the devil's sear —forty one degrees and thirteen minutes—northeast and by north —main branch seventh limb eart side —shoot from the left eye of the death's head —a bee line from the tree through the shot fifty feet out
    Traducción: Un buen vaso en la hostería del obispo en la silla del diablo - cuarenta y un grados y trece minutos - Nordeste cuatro del Norte - rama principal séptimo vástago lado Este - soltar desde el ojo izquierdo de la cabeza del muerto - una línea de abeja desde el árbol a través de la bala cincuenta pies hacia fuera

  •   Relato completo en PDF »

Más ejemplos de criptogramas

Utilizando la técnica de análisis de frecuencias puedes descifra estos mensaje:

Mensaje I

La felicidad no consiste en ganar mucho dinero sino en que la tarea que se hace se haga con gusto. El día que cada niño al llegar a hombre pueda ser aquello que desea y para lo que está dotado habremos conseguido un mundo feliz. Miguel Delibes

Mensaje II

Omar Khayyam matemático y poeta (1048- 1131) escribió

OQ VKEQ DW JN GQBODFL ED QUDEFDZ, ELNED DO YQEL NLW MJDVD CJQO ÑDLNDW, EQNEL MQGDW CLN ÑDNQW

  • La vida es un tablero de ajedrez, donde el Hado nos mueve cual peones, dando mates con penas

  • Póema completo y bibliografía de ilustre matemático Omar Khayyam en matematicas.net
Mensaje III

SBLY AFL FWY IL UYC VYDQGYC VEC ZYILBYCYC AFL SYWIFSLW EU ÑYVPBL EU EBDL K E UE SQLWSQE LC LU ILCLY IL LGEIQBCL IL UE GQIE SYDQIQEWE SYW CF ECZLBLME IYUYBYCE K CF GESQY ILCLCZLBEWDL IL LCSEZEB E UEC SEILWEC IL ILCLYC CQLVZBL SEVPQEWDLC EUPLBD LQWCDLQW

  • creo que uno de los motivos mas poderosos que conducen al hombre al arte y a la ciencia es el deseo de evadirse de la vida cotidiana con su aspereza dolorosa y su vacio desesperante de escapar a las cadenas de deseos siempre cambiantes albert einstein

  • Detalles del proceso de descifrado en epsilones

Para evitar el análisis de frecuencias se introdujeron algunas mejoras, como la inclusión de caracteres nulos que no se traducían por nada, o la introducción de errores premeditados en el deletreado de las palabras para confundir al criptoanalista.

La facilidad con que se descifra este tipo de criptografía explica que no se utilice desde hace mucho tiempo cuando se quieren unas comunicaciones realmente seguras. Sin embargo, es revelador saber que durante muchos siglos fue un sistema considerado seguro. Y lo fue, hasta que a alguien se le ocurrió el análisis de frecuencias.

Enlaces relacionados


Criptografía