¿Cuál es el papel de la informática en el aprendizaje automático?

Depende de lo que quieras decir con informática . CS en sí es un campo muy grande y abarca muchos dominios.

Y como dijiste, el aprendizaje automático se implementa utilizando computadoras, es por eso que ha logrado crecer mucho en las últimas dos décadas. Y aunque hay mucha intersección entre el aprendizaje automático y la informática (una vez más, las líneas son borrosas), debe comprender la razón detrás del aprendizaje automático. La única razón (y mucha gente no lo sabe) por qué se realiza o implementa el aprendizaje automático (especialmente el aprendizaje automático supervisado) es descubrir la función subyacente o la relación oculta entre los datos con las observaciones dadas.

Cuando aplicamos el aprendizaje automático, nunca conocemos la estructura subyacente; Es por eso que nuestra tarea es realizar ingeniería inversa del patrón subyacente en los datos. El aprendizaje automático nos permite hacerlo al proporcionar un conjunto de herramientas computacionales y estadísticas para estimar esa función oculta.

En ese sentido, el aprendizaje automático lo es todo, desde estadísticas y álgebra lineal hasta estructuras de datos y algoritmos de clasificación.

La informática tiene muy poco que ver con el aprendizaje automático.

Proporcionaré una perspectiva diferente, generalmente no discutida.

El aprendizaje automático está mucho más cerca de la química computacional y teórica. El campo fue fundado por H. Christopher Longuet-Higgins, quien fue un famoso químico teórico, quien realizó su trabajo postdoctoral en la Universidad de Chicago, y fue presidente de la química teórica en Cambridge.

H. Christopher Longuet-Higgins – Wikipedia

http://homepages.inf.ed.ac.uk/st

Dejó Cambridge y Química Teórica para mudarse a la Universidad de Edimburgo y ayudó a fundar el Departamento de Inteligencia y Percepción de Máquinas.

Su alumno más famoso es Geoff Hinton, quien es una de las figuras más importantes hoy en Deep Learning. Si nos fijamos en los primeros trabajos de Hinton en Deep Learning, se leen como documentos de química teórica. Hay términos como máquina de Boltzmann, entropía de la red, minimización de energía libre, teorías de campo medio, teorema variacional, muestreo de Gibbs, simulaciones de Monte Carlo, etc. Esta es TODA la química teórica.

Por supuesto, el campo está muy avanzado ahora, y se ha desviado significativamente incluso de este trabajo inicial. Pero incluso hoy, vemos documentos que salen de Google Deep Mind discutiendo sobre Helmholtz Free Energy

https://arxiv.org/pdf/1310.8499.pdf

Y la búsqueda de por qué Deep Learning Works se centra en la teoría del vidrio giratorio. Sip. eso es química teórica: el asesor post doc de mi asesor graduado inventó los lentes giratorios.

La informática es algo bueno seguro. Pero no es de donde vino el aprendizaje automático.

Algunas áreas de CS que son útiles para ML, es el área de computación paralela masiva, que trata con grandes flujos de datos y confiabilidad, teoría de bases de datos, etc.

El problema es que los datos se están expandiendo mucho más rápido que la ley de Moore. La única forma de gestionar mejor esto es con la computación paralela.

  1. Google, por ejemplo, desarrolló el Sistema de archivos de Google para lidiar con el hecho de que incluso con tasas de error extremadamente bajas, se producirán errores debido a grandes cantidades de datos (Sistema de archivos de Google – Wikipedia)
  2. “Bases de datos” escalables “eficientes” pero “confiables”. (Bigtable – Wikipedia, Apache Cassandra, etc.)
  3. Almacenamiento en caché inteligente de datos (y coherencia de caché y bloqueo eficiente)
  4. Redes de servidores grandes y escalables eficientes
  5. MapReduce – Wikipedia
  6. Desarrollar nuevos lenguajes y compiladores que tengan modismos para la computación paralela.
  7. Desarrollo de sistemas para aprovechar GPU para cálculos masivos de matriz o paralelos. https://en.wikipedia.org/wiki/GP
  8. Actualización en tiempo real de bases de datos.

El aprendizaje automático se considera una subárea de inteligencia artificial. Tradicionalmente, la IA se considera un subcampo de CS. Sin embargo, CS no tiene el monopolio del aprendizaje automático.

Los principios de ML se utilizan en el procesamiento de imágenes (por ejemplo, reconocimiento de fotos o caracteres), procesamiento de señales y muchos otros campos.

Yo diría que Machine Learning / Data Science es lo que solía llamarse Estadísticos. He visto el plan de estudios de mis amigos que estudia Estadística en la Universidad de Glasgow y pasó 3 de sus 4 años aprendiendo R y algoritmos de Machine Learning. Él está mucho más avanzado que yo que tengo experiencia en CS.