¿Cómo se usa el aprendizaje automático en física?

Entre otras cosas,

  • El CERN maneja tantos datos en una sola ejecución del LHC que es físicamente imposible (creo que la cifra es de 50 petabytes) para que los seres humanos verifiquen manualmente los datos en busca de anomalías. En cambio, los algoritmos de aprendizaje automático se utilizan para verificar datos anómalos y presentar un informe resumido para que los humanos trabajen.
  • Los algoritmos de aprendizaje automático se utilizan mucho para procesar datos satelitales en física atmosférica, así como para manejar pronósticos y predicciones meteorológicas.
  • Los astrofísicos usan rutinariamente técnicas de aprendizaje automático para clasificar y organizar datos. A menos que me equivoque, los algoritmos de agrupamiento se están utilizando actualmente en los datos de Kepler para clasificar e identificar posibles sistemas estelares que cumplan los requisitos para entornos estables adecuados para la habitación.
  • Se ha comenzado a intentar introducir herramientas de aprendizaje automático para predecir el comportamiento de sistemas de muchas partículas, lo cual es de interés para los físicos de la materia condensada, los físicos de plasma y los químicos. Esto todavía es un campo en desarrollo y podría ganar más impulso a medida que pasa el tiempo.

El aprendizaje automático se usa en física tal como se usa en otro campo de la ciencia o en la industria, es decir, cuando se trata de problemas complejos y / o una gran cantidad de datos, tener computadoras que compartan la parte del pensamiento duro con usted ayuda mucho, sin importar lo que pase. usted está trabajando

Tomaré como ejemplo los experimentos del Gran Colisionador de Hadrones (LHC) en el CERN, mientras amplío las respuestas anteriores. El LHC colisiona protones o iones en varios lugares alrededor del colisionador circular, y cada colisión se registra a través de experimentos dedicados del tamaño de un edificio de varias historias. Estos experimentos son tan complejos que un día de grabación equivale a decenas de PetaBytes (o equivalente, decenas de miles de PetaBytes por año). El registro de esta cantidad de datos está más allá de la capacidad de cualquier organización grande (de investigación o industria). Un primer paso es filtrar todos estos datos; aquí debe ser muy rápido para que el aprendizaje automático aún no sea muy complicado, aunque ciertamente lo será en un futuro muy cercano.

El aprendizaje automático es muy útil cuando quiere comprender lo que sucedió en cada colisión: lo que ve es una gran cantidad de “golpes”: lugares en el detector donde las partículas que quedan dejan una señal grabable. Primero debe dar sentido a esos golpes para “ver” las partículas que se produjeron en una colisión. Este es un problema típico de regresión de aprendizaje automático.

Después de comprender toda la colisión que dio lugar a una multitud de partículas que atraviesan su detector, debe comprender si lo que está viendo se debe al proceso de física particular que estaba buscando para comenzar: la producción de un Higgs bosón? ¿O un par de quarks superiores? ¿O mini agujeros negros? De hecho, las colisiones que le interesan ocurren tan raramente que incluso el proceso físico más cotidiano imita su “señal”. Las simulaciones se utilizan para comprender cómo se vería su señal interesante en el experimento. Luego, las técnicas de aprendizaje automático se utilizan para clasificar las colisiones reales como interesantes o poco interesantes.

Los algoritmos de aprendizaje automático (los más utilizados en el CERN son árboles de decisión potenciados y redes neuronales) superan a los físicos en estas tareas de regresión o clasificación en un 20-30%. Hoy en día, la mayoría de los estudios de física utilizan el aprendizaje automático tanto para reconstruir las colisiones reales como para interpretarlas, aprovechando de manera efectiva las técnicas de aprendizaje automático secuencial para superar el 50% del rendimiento sobre el rendimiento humano (¡físicos trabajadores!).

Recientemente, ha habido mucho trabajo pionero dedicado al uso de herramientas de aprendizaje automático en física computacional y de materia condensada. Aquí hay una lista (incompleta) de algunos artículos influyentes:

  • Funciones de onda variadas del estado fundamental utilizando redes neuronales artificiales [1]
  • Reconocimiento y predicción de transiciones de fase [2] [3] [4]
  • Aprendizaje automático cuántico [5]
  • Descubrimiento de un nuevo parámetro de orden en la transición vítrea [6]

La mayoría de los documentos publicados hasta la fecha son prueba de concepto, aunque algunos resultados en realidad proporcionaron una nueva visión física.

Hay un debate en curso sobre la relevancia de tales algoritmos, ya que la comunidad de física generalmente no solo está interesada en los resultados, sino también en los mecanismos que los causan. Tener un ‘recuadro negro’ que le da las respuestas correctas pero no tiene explicaciones es insatisfactorio e insuficiente. Sin embargo, estoy convencido de que el aprendizaje automático tendrá un gran impacto en la comunidad física.

Editar : Acabo de encontrar una excelente respuesta a una pregunta relacionada de uno de los principales expertos en este campo (incluidas varias publicaciones): la respuesta de Juan Felipe Carrasquilla a ¿Cómo se puede utilizar el aprendizaje automático para la física de la materia condensada?

Notas al pie

[1] https://arxiv.org/pdf/1606.02318

[2] https://arxiv.org/pdf/1605.01735

[3] [1610.02048] Transiciones de fase de aprendizaje por confusión

[4] [1704.01578] Sondeo de localización de muchos cuerpos con redes neuronales

[5] [1611.09347] Aprendizaje automático cuántico

[6] [1506.07772] Un enfoque estructural para la relajación en líquidos vítreos

ML no se usa actualmente en física tanto como podría ser, en parte porque la superposición de habilidades no siempre está ahí (todavía), sino también porque la gente generalmente quiere tener un buen nivel de control sobre sus modelos.

Cuando se usa en física, la gente lo usa principalmente para acelerar los cálculos de las energías atómicas. Es muy costoso en términos de tiempo de cálculo calcular la energía de una molécula a partir de los primeros principios (es decir, de la ecuación de Schrodinger en mecánica cuántica), por lo que ejecutar la dinámica molecular durante largos períodos de tiempo ha sido casi imposible. Sin embargo, al entrenar un proceso gaussiano para aprender de los cálculos existentes, ahora podemos hacer esto.

Un buen ejemplo es la detección de eventos en el CERN.

Los detectores en el CERN detectan una cantidad increíble de datos cada segundo. Solo muy, muy pocos de estos eventos son de interés, ya que la mayoría de ellos son bien entendidos o demasiado llenos de partículas.

No puede hacer que los expertos analicen todos los datos, simplemente son demasiados. Además, ni siquiera puede almacenar todos los datos, ya que no hay suficiente almacenamiento disponible. Por lo tanto, los datos pasan por muchos algoritmos de aprendizaje automático para determinar la probabilidad de que el evento sea de interés.

La astrofísica y la física de partículas tienden a utilizar el aprendizaje automático para examinar los conjuntos de datos extremadamente grandes que recopilan para identificar posibles coincidencias con un proceso hipotético. Los datos de entrenamiento generalmente involucran interacciones de partículas conocidas (para la física de partículas) o simulaciones del comportamiento hipotético junto con interacciones conocidas que no son la interacción / comportamiento de interés. Es posible entrenar estos algoritmos en muestras pequeñas (cientos de observaciones de cada uno) y luego aplicarlo a conjuntos de billones de interacciones (con muy buenas precisiones).

Describiré el único ejemplo que encontré hasta ahora: se utilizó una SVM para identificar puntos blandos en materiales amorfos, en una investigación realizada por Cubuk et. Alabama.

En materiales amorfos, cada partícula experimenta diferentes fuerzas, ya que los entornos locales son diferentes. Sin embargo, no está claro cómo los entornos afectan la suavidad de la partícula; qué tan probable es que el entorno local de esa partícula se reorganice, cuando el sistema está sujeto a una fuerza externa. [Estos reordenamientos microscópicos son los que permiten que el material fluya en un nivel macroscópico.] La entrada al SVM fue el entorno local de la partícula y si su entorno se reorganizó o no cuando el sistema fue sometido a una fuerza externa. Después del entrenamiento, el SVM identificó correctamente ~ 80% de las partículas que eran blandas.

Había dos sistemas a los que se aplicaba este sistema de aprendizaje: un vaso de Lennard-Jones y un pilar de arena.

Un uso interesante del aprendizaje automático en física y ciencia en general es para el archivo e-Print de arXiv.org. Los encargados del mantenimiento de arxiv utilizan el aprendizaje automático para detectar papeles “crackpot” que no son de calidad suficientemente alta. También hacen estudios de plagio utilizando algoritmos sofisticados: estudio de pistas masivas de preimpresión de archivo en la geografía del plagio

Aquí hay una charla reciente del creador del arxiv sobre esto: En una intersección de Física / InfoSci P. Ginsparg, Física e InfoSci