¿Cuál es la relación entre física y aprendizaje automático / IA?

Antes de que el aprendizaje automático se formara como un campo, los físicos necesitaban herramientas para construir modelos de procesos naturales a partir de observaciones.

Con el desarrollo de la termodinámica y la mecánica estadística, los físicos comenzaron a usar macromodelos, sustituyendo innumerables microparámetros (como las velocidades individuales de las moléculas) con unos pocos macroparámetros que caracterizan bastante bien el estado general de la materia (como la presión y la temperatura). La relación entre estos parámetros se describe mediante distribuciones de probabilidad y las propiedades de distribuciones especiales. El mismo principio se usó más tarde en el aprendizaje automático para inferir patrones generales a partir de puntos de datos (la regresión a la media es la herramienta más básica que surgió de la inferencia estadística).

Estos tres tipos lo hicieron todo posible: James Maxwell, Ludwig Boltzmann y Josiah Gibbs, creadores de mecánica estadística que hicieron la conexión entre las propiedades estadísticas (léase: macro) de sistemas complejos y propiedades similares de las partículas que las componen.

Además de eso, el análisis funcional, muy utilizado en física, permitió a los matemáticos derivar las fórmulas para minimizar las funciones de pérdida. ¿Ves la conexión? La mecánica estadística describe cuán lejos está su hipótesis de sus observaciones en promedio, el análisis funcional describe cómo prueba una hipótesis dada contra sus datos de manera rigurosa. Describe la distancia entre dos funciones, que, esencialmente, es todo lo que necesita.

Cualquier sistema que consiste en un conjunto finito de partículas tiene un conjunto finito de estados. Esta idea es muy útil en termodinámica y se convirtió en uno de los conceptos centrales en el aprendizaje automático. La transición entre estados requiere la transformación de la energía: puede gastar algo de energía externa para traer más orden al sistema (al enfriarlo) o puede extraer energía al provocar el caos (prendiendo fuego a todo). Por lo tanto, algunos grupos de estados tienen mayores probabilidades que los demás. Voila: puede saber qué tan bueno es su modelo al estimar cuánta energía necesita para hacer la transición entre su modelo y el estado real (sus datos).

Por cierto, la famosa función softmax ampliamente utilizada en la clasificación y los modelos recurrentes se deriva de la distribución de Gibbs.

Históricamente, los mejores cuantos y algunos de los mejores investigadores de ML (antes de que comenzaran a venir de CS) eran ex físicos. Simplemente porque el modelado estadístico es su pan de cada día.

Es seguro decir que el aprendizaje automático fue descubierto por físicos y actualizado por programadores, lo que parece ser un orden de cosas bastante natural.

Interesante pregunta. Veo que Yann Le Cun mencionó la física en sus respuestas relacionadas con el aprendizaje automático. Me imagino que la mayoría de la gente piensa … ”

“¡Qué demonios tiene que ver la física con el aprendizaje automático!”

La física es una ciencia habilitadora. Si bien se trata del mundo físico, también se ocupa de problemas complejos y matemáticas avanzadas y soluciones creativas. La física y los físicos tienen una relación larga y extensa con las computadoras y la programación, y eso ciertamente es anterior a las computadoras modernas, y muchas de las computadoras más avanzadas y grandes están diseñadas para resolver problemas basados ​​en la física.

La física también tiene una fuerte relación con la probabilidad (mecánica cuántica) y las matemáticas en general. Es por eso que muchos físicos se utilizan para implementar modelos matemáticos complejos en la banca o, en este caso, el aprendizaje automático. A menudo, los físicos son muy buenos para desarrollar algoritmos donde ningún algoritmo conocido funciona o es efectivo.

Estas habilidades son muy diferentes de la programación regular donde hay una implementación conocida de lo que básicamente quieres hacer. Si desea impulsar un campo hacia adelante, tendrá que agregar algo a ese campo. Algún tipo de perspicacia.

Puede sorprender a la gente, pero los físicos a menudo son pensadores creativos (en general) y el tipo de experiencia que obtienes estudiando física es muy diferente de lo que puedes obtener solo estudiando ingeniería o matemáticas. Los enfoques únicos y creativos pueden ser muy apreciados en Física, pero pueden ser problemáticos en Ingeniería o Matemáticas.

Técnicamente hablando, la IA se basa en la física de la electricidad. La IA tiene su origen en la cibernética, desarrollada por un equipo encabezado por Norbert Wiener en la década de 1940. El equipo incluía no solo informáticos y matemáticos, sino también físicos y científicos médicos.

La investigación neurofisiológica había demostrado que el cerebro, al procesar información, transmite señales en corrientes eléctricas diminutas en una secuencia de encendido y apagado. El Grupo de Cibernética de Wiener razonó que si el cerebro se basa en este principio de encendido y apagado, tendría sentido basar las máquinas de computación electrónica en el mismo código.

Desde la década de 1950, la mayoría de las computadoras se han basado en sistemas binarios, pero en los últimos años la investigación ha intentado (re) introducir procesos analógicos en la informática digital. La naturaleza (y, por lo tanto, la física) implica procesos analógicos y binarios, pero este es un tema complejo que los científicos aún debaten.

La cibernética explica qué es la IA y qué no es

¿ES LA VIDA ANALÓGICA O DIGITAL?

He leído las respuestas anteriores, pero se desvían de mi comprensión de la pregunta. En mi opinión, esta es una muy buena pregunta.

Por Machine Learning básicamente estoy interpretando aquí como ANN.

Aquí hay referencias interesantes.

Las redes neuronales son poderosas gracias a la física, no a las matemáticas.

Los físicos han descubierto lo que hace a las redes neuronales tan extraordinariamente poderosas

Los físicos están comenzando a usar ML para analizar sus datos. Además, la física y el aprendizaje automático se basan en muchas de las mismas matemáticas, lo que los convierte en algo parecido a los primos. Las otras respuestas proporcionan algunos detalles específicos, particularmente con respecto a la mecánica estadística …

Los físicos usan herramientas de ML cuando analizan datos (muchos métodos se usaron en física antes de que se pusiera de moda llamarlos ML).

Recientemente vi un artículo usando un NN para modelar un potencial complicado. El NN se utilizó para parametrizar una gran familia de funciones ajustadas a partir de datos empíricos.

Y, por supuesto, las computadoras que se usan en ML están diseñadas usando mucha física

More Interesting

¿Existe la idea de utilizar la regularización para evitar el sobreajuste en la econometría, como lo enseñan los economistas?

¿Cuáles son algunos buenos proyectos de aprendizaje automático que implican el uso de estructuras de datos y tienen aplicaciones de la vida real y se pueden hacer en 2-3 semanas?

¿Cómo funcionan las capas de incrustación en TensorFlow?

¿Cuáles son las mejores medidas de rendimiento para un modelo de detección de anomalías?

¿Cuáles son los primeros usos de la regresión logística?

¿Es posible que un ingeniero de procesamiento de señales se involucre en el campo del aprendizaje automático?

Veo que la mayoría de las API de Machine Learning están en Python, algunas usan C o C ++ bajo el capó. ¿Por qué los desarrolladores de framework no exponen las API de C ++?

¿Cuál es el papel del análisis de datos exploratorios (EDA) en el aprendizaje automático?

¿Cuáles son algunas aplicaciones del aprendizaje automático y la inteligencia artificial para los datos de detección remota basados ​​en el espacio y los SIG?

¿Cómo puedo explicar el hecho de que el aprendizaje por transferencia ofrece un mejor rendimiento que el entrenamiento estándar?

Cómo usar mel-spectrogram como entrada de una CNN

Cómo pensar que el 'problema de aprendizaje One Shot' se resolverá con Deep Neural Network

¿Tenemos que aprender matemáticas detrás de cada algoritmo de aprendizaje automático?

¿Cuál es la diferencia entre datos etiquetados y datos no etiquetados?

¿Debo comenzar a aprender Python y el aprendizaje automático al mismo tiempo?