Me preocupa.
Hablando francamente, después de hacer una investigación de aplicación en ML durante cuatro años. Lo que me preocupa (trato de no usar “frustrados”) es que ML tiene muy pocas posiciones de liderazgo en muchos campos donde muchos de afuera piensan que debería / podría ser la técnica principal.
Como estoy haciendo investigación de aplicaciones principalmente en ciencias naturales, he estado expuesto a un mundo diferente en comparación con otros científicos informáticos. Por ejemplo, en el descubrimiento de fármacos, las técnicas de ML se han utilizado incluso antes de que la última red neuronal estuviera activa (principios de los 90, si recuerdas el programa de televisión X File, hay un episodio sobre el robot malicioso de “red adaptativa” que controla un edificio ) El problema con esta aplicación (también llamada QSPR / QSAR) siempre está ahí: los científicos necesitan RAZONAMIENTO, que ML nunca tiene. Piense en una regresión SVM con el núcleo RBF, ni siquiera tiene los coeficientes para las características (llamados descriptores en este contexto). Y el modelo solo puede usarse como una caja negra. Creo que hay muchos esfuerzos en la interpretación de los modelos, pero no creo que ninguno de ellos funcione realmente bien. El punto clave aquí es que la precisión de la predicción es impredecible ya que el modelo en sí no implica causalidad. La industria farmacéutica no es como la industria publicitaria. No matará a nadie si un anuncio de vestido de niña de 12 años se lanza a un hombre de 55 años (con suerte).
- ¿Cuáles son las diferencias en las aplicaciones de filtrado colaborativo en los datos de calificación y en los datos de compra?
- Mi campo de interés para el doctorado es la visión por computadora, el aprendizaje automático y el procesamiento de imágenes. ¿Qué recursos hay para principiantes con respecto a estos temas? Yo sé Java; ¿Debo aprender otros idiomas primero o puedo comenzar los cursos de inmediato?
- ¿Cuán extendido es el aprendizaje profundo en finanzas?
- ¿Cuál es la diferencia entre Hadoop y Teradata aster?
- ¿Debo obtener una MacBook Pro con 16 GB de RAM (máximo) para el trabajo de aprendizaje automático, a pesar de que puedo llevar cosas intensas a una instancia de Google Cloud?
Como resultado, el clásico QSPR / QSAR se usa más como una herramienta rápida para la detección temprana, pero nada más. El diseño de drogas in silico todavía se basa principalmente en el modelo y la simulación basados en la física.
En cuanto a los materiales, que es mi tesis doctoral, las cosas son muy similares. Muchos documentos han afirmado que han encontrado algo “funcional”, pero muy pocos de ellos son realmente utilizados por los experimentadores. Los modelos más simples desarrollados en los años 70 y 80 son en realidad los únicos implementados en software comercial para uso público (nuestro laboratorio está tratando de hacer públicos todos los modelos, pero no lo estoy promoviendo ahora). Es más como una relación cliente-proveedor: el experimentalista es el cliente y el científico computacional es el proveedor. El cliente quiere razonamiento y conocimientos, no solo una caja mágica negra o gris.
No me malinterpreten, estoy tan sorprendido por el progreso reciente en ML, especialmente el aprendizaje profundo en audio, imagen, reproducción, ver video y muchos otros. Pero me pregunto cuándo y dónde debería ser esa técnica (detrás de la cual probablemente se encuentren las personas más inteligentes del mundo) más que una herramienta para atraer a la gente a hacer clic en anuncios o etiquetar su rostro en una imagen, pero más profundamente en la historia del ser humano.
Una cosa más, adivinar una función de un conjunto de datos masivo y afirmar que es el poder de ML sobre las ciencias naturales clásicas, no es lo que tengo en mente al menos.