domingo, 14 de agosto de 2022

De cómo decodifiqué el alfabeto encriptado de VILLAINOUS

Fandom: Ninguno / No específico

Un verdadero fan de Villainous sabe que en cada situación siempre hay más de lo que se ve a simple vista. No hay corto o episodio sin mensajes ocultos, no hay audio sin mensajes alterados, no hay imagen sin un detalle oculto en las sombras, y no hay texto sin un significado mayor.
Por esto, el fandom ya está acostumbrado a actuar como una agencia de detectives cada vez que un nuevo material oficial sale a la luz. Entre los integrantes de este fandom tenemos a maestros de la edición en Photoshop, programadores que pueden moverse entre el código fuente de un sitio web, políglotas y traductores de cualquier lenguaje, e incluso astutos catalogadores de información que guardan a buen recaudo todo registro de información revelada.

Teniendo en cuenta eso, realmente me sorprendió que nadie pudiese decodificar esto antes que yo:


La respuesta que recibí en Agentes de Podemos Bailar ante mi decodificación fue inesperadamente asombrada, y recibí varios comentarios preguntándome cómo lo hice. Pues bien, hoy vengo a responder esa pregunta.

Tengan en mente que esta publicación no es exclusiva para los fans de Villainous. Esta publicación es para quienes tengan curiosidad por conocer uno que otro consejo que sirva para la decodificación de cualquier alfabeto gráfico.
Yo no soy una gran conocedora en el campo de la decodificación de ningún tipo, y como podrán leer pronto, tuve mucha suerte de mi lado al lograr la pequeña hazaña. La intención de esta publicación es dar a conocer mi proceso de descifre, e incluso dar consejos para que ustedes hagan sus propios descifres y sus propios alfabetos cifrados.

Espero que esta lectura sea de su agrado. ¡Iniciemos!

LA INSPIRACIÓN

Hace ya más de un año, el canal de YouTube llamado “The Game Theorists” publicó un video enfocado en un ARG popular de la época: “Catastrophe Crow”, también conocido como “Crow 64”. Para quienes no lo conozcan, Crow 64 es la historia de un desarrollador de videojuegos quien, tras perder a su hija, transformó el infantil juego en que trabajaba en una macabra recreación de la triste vivencia… para después suicidarse.

Para contar su historia, este ARG lanzaba pequeñas pistas encriptadas en múltiples formatos que los fans debían desencriptar para acceder a la información, y una de esas pistas encriptadas justamente resultaba ser un alfabeto cifrado.

El método más fácil de desencriptar esta clase de mensajes es usando un descifrador en línea: un programa en el que tú sólo insertas el texto encriptado y pulsas un botón para que un algoritmo lo resuelva por ti.
Por desgracia, es imposible usar un descifrador en línea para revelar los mensajes del alfabeto de Villainous por los siguientes motivos:
1.- Los descifradores en línea funcionan con el diccionario y las reglas ortográficas del idioma inglés. El español usa reglas ortográficas diferentes, así que el algoritmo anglosajón no funcionaría aquí.
2.- A diferencia del alfabeto cifrado de Crow 64, que usa letras reales mezcladas entre sí, el alfabeto cifrado de Villainous usa caracteres totalmente nuevos y alejados de nuestras letras. Como no es posible insertar el alfabeto de Villainous en la computadora, no se puede usar el descifrador en línea.

Pero si el método del descifrador en línea no sirve aquí, ¿por qué digo que fue mi inspiración? Verán: hace poco mencioné que los descifradores en línea usan un algoritmo, ¿verdad? Pues bien, ¿qué es un algoritmo?
Según el Diccionario de la Lengua Española de la RAE, un algoritmo se define como un “conjunto ordenado y finito de operaciones que permite hallar la solución de un problema”. Un algoritmo se rige por una serie de reglas que un humano le ordena seguir a un programa, así que alguien conociera la serie de reglas que el programa informático está usando, en teoría ese alguien podría seguir esas mismas reglas y llegar al mismo resultado que el programa.

¿Y cómo se llaman las reglas que rigen la escritura de cualquier idioma? Así es: la ortografía.

ORTOGRAFÍA Y ESTADÍSTICA: MIS DOS MAYORES ALIADOS

Todos hemos escuchado al menos una de esas reglas que nos enseñaban en la escuela: “la ‘b’ siempre va después de la ‘m’”, “la ‘q’ siempre va seguida de la ‘u’”, “los plurales de las palabras que acaban en ‘z’ se escriben con ‘-ces’”, y un largo etcétera.

Pues bien: esas son las reglas que los descifradores en línea usan. Cualquier persona con un buen conocimiento de la ortografía española puede intentar hacer el descifrado. Por suerte, en la escuela me solía ir mejor que al promedio cuando se trataba de ortografía, y hasta hoy en día no dejo de tener mi diccionario a la mano cuando sea que voy a escribir.

Pero la ortografía no es lo único que me iba a ayudar en esta tarea autoimpuesta.
Volviendo al descifrador en línea, resulta que también usa estadísticas para hacer su trabajo, consultando un catálogo de las letras más usadas en su vocabulario para compararlo con los caracteres más repetidos en el mensaje y así llegar más rápido a una conclusión.
Esto tiene bastante sentido: si ves un símbolo muy repetido en un mensaje encriptado, ¿qué piensas que será: una ‘a’ o una ‘w’?
Haciendo una búsqueda rápida en Google, me topé de inmediato con un resumen de las letras más y menos usadas en el vocabulario español; así que ya con esto tenía mi guía ortográfica y mi guía estadística.

Todo lucía como que me iría viento en popa, hasta que me acordé de un pequeñísimo detalle que no está presente en el inglés, pero sí en español…

CARACTERES EXTRA Y PALABRAS NO-ESPAÑOLAS: MIS MAYORES RIESGOS DE FRACASO

Se dice que el español es de los idiomas más difíciles de aprender debido a su complejo sistema de conjugación y al uso de acentos. De esas dos características, con los acentos y otros caracteres “extra” los que me causarían problemas: ‘Á’, ‘É’, ‘Í’, ‘Ó’, ‘Ú’ y ‘Ü’.

Por ejemplo, si el mensaje a decodificar fuera “UN AGÜERO” y el alfabeto NO hiciese distinción entre la ‘U’ y la ‘Ü’, habrían 7 caracteres por descifrar (U, N, A, G, E, R y O). Pero si ese mismo mensaje tuviese que ser decodificado CON UNA DISTINCIÓN entre la ‘U’ y la ‘Ü’, los caracteres por descifrar ascenderían a 8 (U, N, A, G, Ü, E, R y O).
Obviamente es más fácil descifrar siete caracteres a descifrar ocho, así que, si los caracteres del alfabeto de Villainous sí incluían a los especiales, mi misión sería más dura.

Lo mismo cuenta para los caracteres numéricos y los signos de puntuación: ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’, ‘0’, ‘¡’, ‘!’, ‘¿’, ‘?’, ‘,’, ‘.’, ‘;’, ‘:’, y un largo etcétera.

Si el alfabeto de Villainous NO consideraba los caracteres especiales, mi trabajo sería descifrar sólo veintisiete símbolos. Si el alfabeto sí consideraba los caracteres especiales, mi trabajo ascendería a un aproximado de cincuenta y un símbolos: casi el doble.

Y ese era sólo uno de los dos problemas.

Muchos personajes en Villainous tienen sus nombres en inglés en lugar de español: “Black Hat”, “Miss Heed”, “Sunblast”, “Goldheart”… Incluso hay personajes con nombres de otras lenguas, como el de “Kenning Flugslys” (islandés). También hay palabras inventadas (como “Braxton”) y palabras estilizadas para lucir más cool (como “Kamo”).
Sabiendo que todas esas palabras no siguen las reglas ortográficas hispanas, su posible inclusión en los mensajes podría traducirse en un fallo esencial en el funcionamiento de mi “algoritmo manual”.

Combinando los caracteres especiales con las palabras no-hispanas, no tardé en darme cuenta de que mi misión autoimpuesta podía volverse mucho más complicada de lo que imaginé en un inicio. Las variables eran demasiado grandes, y una sola palabra “especial” (por llamarla de algún modo) podía complicar el proceso y confundirme.
Era un reto de alto riesgo y altas recompensas, así que al final me decanté por este curso de acción:

Coincidentemente, por esas fechas mi familia y yo nos enfermamos del infame Coronavirus. Ninguno de nosotros podía ir a trabajar, así que en esos días me la había pasado muerta de aburrimiento por tener que estar en reposo. En los últimos días de mi suspensión laboral me sentía bastante bien, así que decidí trabajar en la decodificación mientras se acababa mi descanso.
Si llegaba el día de volver a trabajar y todavía no tenía éxito, iba a abandonar el proyecto por completo. Si lograba tener éxito con la decodificación, daría a conocer mi hallazgo cuanto antes.

PRUEBA Y ERROR

 
 
Para comenzar, tenía estos tres mensajes encriptados disponibles, todos sacados del video de YouTube que podrán encontrar aquí. De los tres, me decidí por el más largo. ¿Por qué? Porque mientras más largo sea un texto, más reglas ortográficas y gramaticales estará usando. Recuerden: las reglas de la escritura española son nuestro “algoritmo manual”.

El siguiente paso fue copiar y separar cada símbolo, y contar cuántas veces estaba repetido cada uno. No olvidemos que las estadísticas de uso de cada letra son un apoyo útil a la hora de filtrar las probabilidades de repetición de letras.


Según el conteo y análisis inicial, tres símbolos son usados 10 o más veces, y es muy probable que dos de ellos sean vocales y el otro sea una consonante. Además, sólo es posible descifrar 20 de las al menos 27 letras.
Estadísticamente hablando, las vocales más comunes son la ‘E’, la ‘A’ y la ‘O’; y las consonantes más usadas son la ‘S’, la ‘R’ y la ‘N’. Significa que al menos uno de los símbolos más repetidos tenía que ser una de esas vocales, y al menos otro más debía ser una de esas consonantes.
Las letras menos comunes son la ‘Z’, la ‘J’, la ‘Ñ’, la ‘X’, la ‘K’ y la ‘W’, por lo que al menos una de esas letras NO estaría entre los 20 símbolos disponibles.

Desde ahí, todo el proceso se redujo a probar cada combinación de letras posible hasta dar con la combinación correcta.
Y sí: fue un trabajo increíblemente tedioso.

Mi método fue así: aquí tenemos una palabra de tres letras cuya letra intermedia es la más repetida. El símbolo a su izquierda tiene sólo tres repeticiones, mientras que el de su derecha tiene ocho repeticiones.

Repito:
 - Símbolo 1: tres repeticiones (rareza media-alta)
 - Símbolo 2: doce repeticiones (rareza muy baja)
 - Símbolo 3: ocho repeticiones (rareza baja)

Usando el apoyo del sitio web WORdER, podemos sacar una lista de palabras con cualquier condición que le indiquemos. Yo inicié con la condición “la letra de en medio es E”; y desde ahí, probé cada combinación ofrecida que también cumpliera con las condiciones “la primera letra es rara” y “la tercera letra es común” (esas dos condiciones las seguí mentalmente). Después de probar TODAS las combinaciones ofrecidas por las palabras VEA, BEL, GEA, VED, YEN, VEN, FEA, GEL, VEN, DEL, FEO, GEN, LEO, VEO, DEN, FER, GEO, JET, LES, MES, VER, DES, FES, LEA y VES, ninguna surtió efecto. El símbolo más repetido no es la E.

Ahora era turno de la letra A como reemplazo del símbolo intermedio. De nuevo, probé todas las combinaciones y todas llevaban a callejones sin salida: FAN, HAS, MAR, LAS, MAS, PAN, BAR, DAN, GAS, NAO, RAS, ZAR, DAR, MAL, ZAS, HAN, VAN y VAS. El símbolo más repetido tampoco es la A.

La siguiente letra era la O, así que una vez más comencé a probar con todas las combinaciones posibles: BOA, GOL, COL, LOS… Ahí me detuve.
“LOS” no me llevaba a ningún callejón sin salida.

Con esto ya tenía decodificados tres símbolos de veinte. Además, gracias a que ya tenía la O y la S, esta otra palabra ya estaba casi completa.

El símbolo faltante en esa palabra es el segundo más repetido, así que por lógica las estadísticas dicen que esa es la letra N.

Desde aquí, realmente no tengo nada interesante qué comentar. Con esas cuatro letras descifradas, el método de la prueba y error se volvió cada vez más fácil. Descifré la I, luego la T, luego la R, luego la E, luego la U… y así hasta tener listas las 20 letras.
Para que se den una idea de lo mucho que se agilizó el proceso: duré alrededor de 4 horas para descifrar la L, la O, la S y la N; y duré una hora para descifrar las otras 16 letras.
¡Una hora para descifrar 16 letras! Ese es el poder de la ortografía y la estadística.

Y así, finalmente acabé con una mesa de trabajo en Photoshop que lucía así.


Lo sé: soy muy desordenada cuando estoy trabajando. Todos mis bocetos y borradores suelen lucir así de caóticos.

Y como obviamente no iba a publicar ese penoso desorden, me puse a acomodarlo todo y darle un formato más lindo. Así fue como nació la primera versión del alfabeto decodificado de Villainous.


El resto ya es historia.
Mi publicación en Facebook estalló de reacciones, y con apoyo de otros miembros del grupo de Agentes de Podemos Bailar, fuimos capaces de añadir otras cuatro letras antes de que se lanzara el decodificador oficial. Y por supuesto, gracias a los talentosos “VillainToubers” (Youtubers de Villainous) fue posible extender el conocimiento del alfabeto para que todo el fandom se enterara.

CONCLUSIÓN

Si hay un motivo por el cual amo esta anécdota, es porque me recuerda lo lejos que un fandom puede llegar si se une por una meta común.
Yo no podría haber iniciado mi decodificación sin las publicaciones de quienes ya tenían en mano los primeros mensajes. El trabajo que hice fue inspirado por otras leyendas del fandom de Villainous y de otros fandoms que en el pasado también tuvieron que lidiar con alfabetos codificados. La versión perfeccionada de mi alfabeto nació gracias al apoyo de otros fans, y su fama fue posible gracias al apoyo de los grandes miembros del fandom con miles de seguidores.

Este fue un trabajo en equipo, y me siento honrada de haber sido parte de ese equipo.

Tuve mucha suerte de que el equipo de Alan Ituriel no creara un alfabeto con acentos y signos de puntuación. Si esos hubiesen estado incluidos, estoy segura de que hubiese fallado en mi misión autoimpuesta.
(Por cierto: si está leyendo esto, señor Ituriel, lamento haber arruinado el timing de las revelaciones. Soy una gran admiradora de su trabajo, y espero que no me guarde rencor por haber hecho la decodificación.)

Para aquellos que se preguntaban cómo logré hacer la decodificación, aquí tienen la respuesta: apoyándome de las reglas ortográficas, usando datos recolectados en el Internet, y probando con paciencia cada combinación posible hasta dar con la correcta.
Fue algo tedioso, pero al final también me divertí mientras trabajaba. Y por supuesto: el esfuerzo valió la pena. Siempre me hace feliz ver que mis pequeños hallazgos e ideas traen alegría y entusiasmo a los demás. Los comentarios que recibí en aquella publicación de febrero me siguen alegrando hasta el día de hoy, y de vez en cuando me paseo de vuelta por aquellos videos de YouTube dando la noticia porque me recuerdan que unidos somos grandiosos.

Si algún día alguno de ustedes, buenos lectores, desea crear su propio alfabeto codificado, aprendan de lo que han leído hoy:
 - De ser posible, usen palabras en más de un idioma. Con eso dificultarán el uso de reglas ortográficas.
 - Creen símbolos especiales para los acentos y los signos de puntuación. Con eso aumentarán exponencialmente la cantidad de combinaciones con las cuales lidiar.
 - Den mensajes lo más cortos posibles. Mientras menos letras involucren, más difícil será que un decodificador encuentre un patrón.

Pues bien, con eso hemos terminado por hoy. Al momento de acabar de redactar esto, una de mis intenciones secundarias es entretener a los fans de Villainous mientras esperamos alguna noticia importante. Si pronto surgen noticias sobre un nuevo libro o el estreno de nuevos episodios, aplazaré esta publicación para cuando sepa que se acerca un nuevo hiato.

Ya sea que esta publicación salga en un futuro cercano o en uno lejano, mi mensaje final es el mismo de siempre: estaré feliz de leer sus comentarios y opiniones respecto a este tema. Les recuerdo que, si les gusta lo que han leído hoy, estaría muy agradecida de que compartieran este humilde blog a sus amigos. Deseándoles un maravilloso día, me despido. ¡Hasta la próxima!

No hay comentarios.: