Desde el punto de vista del aprendizaje automático, simplemente unimos dos técnicas: codificadores automáticos de texto y optimización bayesiana. Es decir, capacitamos a un autoencoder para transformar una representación de texto de productos químicos (SMILES) hacia y desde vectores continuos. Entonces, el “diseño químico” es simplemente maximizar la función de una variable continua, algo de lo que ya sabemos mucho.
También mostramos algunas de las cosas buenas que se pueden hacer con representaciones latentes continuas, como la interpolación. Esto ya se había hecho para las imágenes de muchas personas, y para el texto en [1511.06349] Generando oraciones desde un espacio continuo, para dar crédito donde se debe.
Por supuesto, nuestro artículo es solo una prueba de concepto. Por ejemplo, en lugar de codificar desde y hacia SONRIENTES, sería mucho mejor codificar directamente desde y hacia gráficos. Sabemos cómo codificar gráficos en vectores, pero no conozco una buena forma de decodificar un vector en un gráfico.
- ¿Cuáles son los pros y los contras de las diferentes técnicas de factorización matricial: rango bajo, SVD y NMF? ¿Cuáles son algunos ejemplos prácticos de cada uno?
- ¿Qué es la regresión de Ridge en términos simples?
- ¿Cuál es la diferencia entre el análisis factorial y el análisis de conglomerados?
- ¿Cuáles son los siguientes pasos en el reconocimiento de voz después de extraer las funciones de MFCC?
- ¿Cómo funciona el algoritmo de recomendación de filtrado basado en contenido?
Otro problema abierto es que es difícil saber qué optimizar. Nuestros experimentos iniciales de optimización de propiedades químicas específicas produjeron moléculas sugeridas con estructuras locas, como anillos gigantes. Los químicos humanos tienen una gran intuición de lo que es fácilmente sintetizable o estable, y es difícil articular todas las propiedades que queremos que la molécula tenga mediante programación. Alternativamente, podríamos hacer que el optimizador solo mire moléculas similares a las que ya hemos visto, pero esto también es insatisfactorio: después de todo, ¡el mejor resultado de la exploración es cuando encuentras algo totalmente diferente a lo que has visto antes!