¿Cómo se puede aplicar Machine Learning para descifrar la secuencia de comandos de idiomas desconocidos?

Descifrar lenguas antiguas desconocidas necesita intuición y lógica. Las computadoras no poseen ninguna lógica o intuición. Entonces, para duplicar la “intuición”, el software de aprendizaje automático hace múltiples suposiciones. El primero de estos supuestos es que el idioma desconocido que se descifrará está estrechamente relacionado con un idioma conocido. Luego, el alfabeto del idioma desconocido se mapea sistemáticamente en el alfabeto del idioma conocido y la frecuencia de los símbolos y letras correlacionados se mide en ambos idiomas.

El algoritmo de Machine Learning supone que, a nivel de palabra, ambos idiomas tienen ciertas palabras con raíces compartidas o similares. Ejemplo: como Mano y Main en español y francés. Luego, el algoritmo asume un mapeo cercano o similar para diferentes partes de las palabras. Basado en un tipo de modelado probabilístico, el algoritmo determina los conjuntos de prefijos y sufijos. Se realiza de cientos a miles de veces para lograr la coherencia utilizando los conjuntos de datos de entrada más grandes. Aunque se puede cuestionar la fiabilidad de dichos algoritmos para descifrar un lenguaje, el aprendizaje automático cerrará todas esas brechas tarde o temprano.