¿Cuáles son los casos de uso (potenciales) de la inteligencia artificial o el aprendizaje automático para la biología?

Un uso particular de Machine Learning in Biology es la predicción de la estructura terciaria de proteínas.

Las proteínas son moléculas muy importantes en el cuerpo humano. Hay cientos de miles que cumplen diferentes funciones únicas pero importantes. Están formados por cadenas o secuencias de generalmente alrededor de 50–400 aminoácidos (hay 20 tipos diferentes de aminoácidos). Estas secuencias se pliegan desde su estado inicial de secuencia unidimensional a una estructura nativa tridimensional. Es esta estructura la que se cree que da a las proteínas sus funciones específicas. Y es importante para los científicos poder estudiar la estructura de las proteínas para que puedan descubrir más información sobre la función de esas proteínas. No solo esto, sino que los científicos también podrían diseñar estructuras de proteínas que cumplan funciones específicas (diseño de proteínas).

Actualmente, existen dos métodos principales para obtener experimentalmente estructuras de proteínas altamente precisas. Estos se denominan cristalografía de rayos X y espectroscopía de RMN. La desventaja de estos métodos es que ambos son caros, requieren mucho tiempo y pueden ser procesos muy delicados. Por lo tanto, a la comunidad proteómica le interesa poder predecir con precisión la estructura de una proteína dada su secuencia de aminoácidos para evitar tener que pasar por cualquiera de estos procesos solo para obtener las estructuras nativas de las proteínas.

En la última década, se han utilizado más y más técnicas de aprendizaje automático para poder predecir la estructura terciaria de las proteínas a través de algunos métodos diferentes. Algunas tuberías de predicción de estructura tienen como objetivo predecir la estructura de una proteína directamente desde la secuencia misma (ab initio). Otros pueden usar plantillas de estructura para diferentes fragmentos de longitud de la secuencia (de novo). Algunos usan información de estructura secundaria, o incluso son ayudados por mapas de contacto (aquí hay un documento interesante en el que un grupo de investigación en Chicago tuvo como objetivo predecir el mapa de contacto (no la estructura en sí) utilizando el aprendizaje profundo (red residual profunda)). Aquí hay un artículo de mi asesor de tesis en el que utilizó modelos gráficos probabilísticos (Modelos de Markov ocultos de entrada-salida) para muestrear diferentes conformaciones de fragmentos de longitud para su uso en la predicción de la estructura terciaria de proteínas de novo.

La predicción de la estructura terciaria de proteínas es solo una de biología y bioinformática donde se aplica el aprendizaje automático (y el aprendizaje profundo). Si desea obtener más información sobre cómo se aplica el aprendizaje automático, consulte Bioinformática: el enfoque del aprendizaje automático por el profesor Baldi de la Universidad de California Irvine. Es un investigador líder en aprendizaje profundo, aprendizaje automático y bioinformática. El libro en sí contiene una revisión exhaustiva de los temas de aprendizaje automático y las áreas de biología en las que se pueden aplicar.

Las aplicaciones de Inteligencia Artificial / Aprendizaje automático en el sistema biológico se presentan en forma de órganos sintéticos para reemplazar órganos biológicos fallidos (p. Ej., Páncreas artificial), implantes cerebrales (p. Ej., Reemplazo de partes dañadas de cerebros biológicos) y nuevas formas de interfaces basadas en el control hombre-máquina. (también con implantes cerebrales biológicos: el Proyecto SYNAPSE del Departamento de Defensa de EE. UU. actualmente financia investigaciones en esta área) Robotronics LLC | Facebook