¿Cuáles son las principales innovaciones y hallazgos del documento ‘Diseño químico automático utilizando una representación continua de moléculas basada en datos’?

Desde el punto de vista del aprendizaje automático, simplemente unimos dos técnicas: codificadores automáticos de texto y optimización bayesiana. Es decir, capacitamos a un autoencoder para transformar una representación de texto de productos químicos (SMILES) hacia y desde vectores continuos. Entonces, el “diseño químico” es simplemente maximizar la función de una variable continua, algo de lo que ya sabemos mucho.

También mostramos algunas de las cosas buenas que se pueden hacer con representaciones latentes continuas, como la interpolación. Esto ya se había hecho para las imágenes de muchas personas, y para el texto en [1511.06349] Generando oraciones desde un espacio continuo, para dar crédito donde se debe.

Por supuesto, nuestro artículo es solo una prueba de concepto. Por ejemplo, en lugar de codificar desde y hacia SONRIENTES, sería mucho mejor codificar directamente desde y hacia gráficos. Sabemos cómo codificar gráficos en vectores, pero no conozco una buena forma de decodificar un vector en un gráfico.

Otro problema abierto es que es difícil saber qué optimizar. Nuestros experimentos iniciales de optimización de propiedades químicas específicas produjeron moléculas sugeridas con estructuras locas, como anillos gigantes. Los químicos humanos tienen una gran intuición de lo que es fácilmente sintetizable o estable, y es difícil articular todas las propiedades que queremos que la molécula tenga mediante programación. Alternativamente, podríamos hacer que el optimizador solo mire moléculas similares a las que ya hemos visto, pero esto también es insatisfactorio: después de todo, ¡el mejor resultado de la exploración es cuando encuentras algo totalmente diferente a lo que has visto antes!

… y ahora para un punto de vista químico:

  • Casi todos los problemas en química / ciencia de los materiales / descubrimiento de fármacos están relacionados con el problema de la optimización de las propiedades.
  • Esta tarea es extremadamente difícil porque el espacio químico es discreto, es decir, no hay espacio intermedio entre H2O y H2S. Para ir de uno a otro, se encuentra en una situación de “todo o nada”, tiene uno u otro. No puedes navegar lentamente entre ellos. Eso es un problema, porque hace inútiles muchas de las maravillosas herramientas disponibles para las exploraciones espaciales continuas (por ejemplo, el uso de gradientes con diferenciación automática).
  • Se han realizado muchos esfuerzos dirigidos a cómo abordar la optimización del espacio químico de manera discreta. Hemos realizado algunos trabajos relacionados con grandes bibliotecas (para química) con éxito en el descubrimiento de OLED. Otras personas han aplicado algoritmos genéticos para lograr un mejor desempeño de las moléculas para la misma tarea (esta es una pequeña lista de 2. Muchas personas están trabajando en ello).
  • Todos estos métodos tienen el problema de que el usuario tiene que especificar de antemano de alguna manera qué cambios se permitirán, además, no se sabe una vez que se encuentra en un punto dado de qué dirección tomar para mejorar la molécula, uno solo tiene que probar mucho y eso es muy ineficiente, además se opone a la forma en que los químicos suelen pensar. En general, somos buenos acerca de qué pequeños cambios harán que una molécula se acerque más a la meta.
  • Y ahí es donde los autoencoders vienen al rescate. Como David mencionó, hay un trabajo hermoso con el lenguaje (interpolación entre dos oraciones, manteniendo los intermedios razonables) e imágenes (interpolación entre dos imágenes diferentes). Hemos aplicado algunas de esas herramientas a la química.
  • Entrena una red neuronal con SONRISA como entrada y salida, y eso genera un vector continuo entre el cual podemos usar y trabajar. En principio, ahora tiene una representación del espacio químico que es continua. Por supuesto, su calidad dependerá de muchos factores, principalmente la cantidad de moléculas utilizadas para el entrenamiento.
  • En este artículo hemos realizado interpolaciones. ¿Cómo pasas de una molécula a otra en este espacio? ¿Cómo se pasa de la aspirina a la Viagra? Esto no tiene aplicaciones directas, pero muestra que el método funciona y que funciona muy, muy bien.
  • Cuando las cosas entran en el territorio casi mágico (al menos para un químico como yo) y muestran cuán verdaderamente cambiante puede ser esto cuando realizamos optimizaciones (como en la Figura 7). Para eso, necesita un NN adicional entrenado para la propiedad de elección (eficiencia OLED, logP, toxicidad, solubilidad, qué tan bien trata la malaria, …) o una combinación de muchos (idealmente, estos 2 NN se optimizarían juntos). En este caso, puede moverse a lo largo de los gradientes para obtener mejores y mejores moléculas. En el ejemplo presentado, generamos automáticamente 2 moléculas cuyo logP es mejor que cualquier molécula presente en el conjunto de entrenamiento. Podríamos seguir este argumento más e incluir estas 2 moléculas en el conjunto de entrenamiento y hacerlo de nuevo, y así sucesivamente.
  • En resumen, este documento abre la puerta a una nueva forma automática de descubrimiento y optimización molecular y de medicamentos, que con suerte nos permitirá obtener candidatos más eficientes, más fáciles de sintetizar y más baratos para múltiples aplicaciones.

Esto me recuerda a un artículo en el Artificial Intelligence Journal (AI Journal), para lo que se llamó una máquina de creatividad que emplea dos redes neuronales vinculadas para aprender las primeras variaciones de los perfiles de modelos de automóviles, y luego generar nuevos perfiles por la variación de los valores externos. El Diario ya no se publica y todas las referencias a él se han ido; me robaron mi colección, así que ya no puedo referirme a ella ni a ninguna revista del período de los noventa. Ah, y esto también me recuerda un artículo que publiqué en un grupo para documentar el conocimiento de las ecuaciones moleculares en un lenguaje de sistema experto (sistema de restricción) para descubrir oportunidades de investigación. Pero el artículo fue borrado del grupo el año pasado y mi computadora portátil fue robada posteriormente este año, por lo que no puedo referirme a ella. Este documento parece similar a estas referencias.

More Interesting

¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?

¿Cuál es el mejor sitio web de aprendizaje automático?

¿Cómo ayuda el enfoque ontológico con la clasificación de texto?

¿Cuáles son los principales problemas con el uso de la codificación one-hot?

¿Cuándo es preferible usar árboles de regresión en el aprendizaje automático?

¿Es posible o valioso obtener otro doctorado en Machine Learning (Deep Learning) de una de las 50 mejores universidades de los Estados Unidos?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

Cómo guardar los pesos de los datos de entrenamiento de las pruebas MNIST en Tensorflow para uso futuro

¿Qué tan buenos son los conjuntos de datos SIG en India (por ejemplo, red de carreteras / calles, parcelas municipales, etc.)? ¿Cuáles son las fuentes para este tipo de conjuntos de datos?

¿Cómo ser bueno en la programación de Python si quiero aprender el aprendizaje automático? ¿Son estos problemas diferentes de la programación competitiva?

¿Dónde se usa la función de pérdida con clases verdaderas desconocidas?

¿Cuál crees que es la razón detrás de la asociación de Microsoft y Amazon en la tecnología de red neuronal llamada 'Gluon'?

¿Cómo debería abordar el problema de segmentar el césped de una imagen?

¿De qué sirve un alumno constante?