¿Por qué no usamos el aprendizaje automático para mejorar los modelos climáticos?

El aprendizaje automático está en su infancia cuando se aplica a las ciencias físicas, particularmente en física computacional. Parte de esto es filosófico porque la terminología utilizada implica que las computadoras están reemplazando a los humanos en el aprendizaje, cuando en realidad el aprendizaje automático es principalmente una forma de clasificar e interpolar. La segunda parte es que el paradigma de ML es principalmente no paramétrico, mientras que la mayoría de la física se centra en derivar leyes matemáticas claras que describen fenómenos que incluyen parámetros que representan la importancia relativa de varios mecanismos. Hay algunos enfoques de ML que pueden tener como objetivo reproducir este enfoque, pero mi opinión personal es que realmente no pueden descubrir una nueva descripción matemática. Los algoritmos de ML por el contrario no son paramétricos en el sentido de que sus parámetros se usan solo para ajustar los datos en lugar de ofrecer una interpretación de los efectos de los mecanismos competidores.

Sin embargo, es la tercera razón por la que creo que es más importante: a menudo no está claro cómo formular el problema de física de una manera que pueda usarse con ML. Las leyes físicas contienen dentro de ellos ciertos invariantes que representan el comportamiento fundamental del universo, por ejemplo, la invariancia galileana. En general, una representación de ML no reflejará estas propiedades que sabemos que existen, lo que dificulta su aplicación. En el ejemplo de los pronósticos, violar estos invariantes conducirá a una situación inestable. El trabajo reciente ha explorado la inclusión de estos invariantes y plantear la parte ML del problema como una ley de cierre que surge de la descripción inherentemente de múltiples escalas de la mayoría de la física, incluido el modelado del clima. Los resultados preliminares sugieren que el ML puede ser útil. Entonces, al final, mi respuesta es más optimista que las otras, pero hay un largo camino por recorrer.

AlgoritmosAprendizaje automáticoInteligencia Artificial

¿Existe un límite superior para la capacidad de comprensión de un individuo? Si es así, ¿qué se debe hacer para mejorarlo?

¿Cuáles son algunos algoritmos favoritos que los usuarios de Quora crearon por sí mismos?

¿Cómo implementaría el ranking de respuestas de Quora?

¿Qué algoritmos se utilizan para el proceso de aprendizaje automático de Yandex?

¿Qué libro es bueno para los algoritmos básicos?

¿Cuál es la diferencia entre un algoritmo y una fórmula?

Los sistemas de aprendizaje automático aprenden automáticamente programas a partir de datos. Esta es a menudo una alternativa muy atractiva para construirlos manualmente. Sin embargo, pueden codificarse manualmente o pueden probarse matemáticamente, pero debido a la gran cantidad de combinaciones posibles que deben codificarse, se vuelve muy difícil. Por lo tanto, preferimos los algoritmos de aprendizaje automático sobre los programas codificados manualmente, ya que pueden descubrir cómo realizar tareas tan complejas generalizando a partir de ejemplos.

Por otro lado, la predicción meteorológica se parece más a la teoría del caos que no se puede probar matemáticamente (aunque se proponen múltiples derivaciones matemáticas, pero todas ellas con suposiciones significativas que se consideran correctas). Además, las funciones de caos son muy sensibles a las condiciones iniciales, por lo tanto, una ligera desviación en la precisión de la predicción (incluso en .00001) por el aprendizaje automático producirá resultados muy diferentes. Por lo tanto, el aprendizaje automático no se puede utilizar para crear modelos de predicción meteorológica precisos.

¡Espero que esto ayude!

~ Akash

Steven McQuinn

Estoy respondiendo esta pregunta principalmente para promover una sugerencia sobre cómo el aprendizaje automático puede usarse mejor en el pronóstico del tiempo.

Los pronosticadores del tiempo finalmente recurren a la heurística aprendida personalmente cuando existe ambigüedad o contradicción en las ejecuciones del modelo de pronóstico. Su juicio se basa en su experiencia local con lo bien que funcionó un modelo de pronóstico dado para una situación dada en el pasado. La heurística personal les ayuda a elegir con un nivel de confianza reforzado.

Cabe señalar que los diferentes modelos de pronóstico no siempre están en completo desacuerdo, y que una “situación dada” no es cuantificable, sino más bien, una evaluación personal de similitud.

Creo que esta es un área ideal para la aplicación del aprendizaje automático. Se utilizaría mejor para aumentar el juicio humano sobre el uso de modelos numéricos al desarrollar un pronóstico, en lugar de competir con modelos numéricos.

Por supuesto, esta es la forma en que abordaría el diseño de la investigación.

Parametrice la diferencia entre el rendimiento del modelo y el clima real mediante varias medidas.
Permita que el aprendizaje automático estudie el registro de pronóstico y los datos climáticos reales, para desarrollar y probar “factores de corrección de parámetros” que minimicen la variación entre los pronósticos de los diferentes modelos y el clima real.
Deje que el aprendizaje automático clasifique las “situaciones dadas” por sus propios estándares empíricos de similitud, y correlacione estos con los factores de corrección de parámetros para generar heurística (AKA, reglas generales).

Supongo que esto podría llamarse metamodelado. Un modelo de red neuronal de la propagación entre diferentes modelos numéricos y resultados reales. Con la heurística del aprendizaje automático, un pronosticador tendría una evaluación calculada para comparar con la intuición humana sobre el comportamiento de los modelos. Y los programadores de modelos tendrían medidas de precisión en relación con ciertas situaciones que se pueden utilizar para ajustar los cálculos numéricos, mejorando su habilidad.

Quizás este enfoque ya se esté utilizando, pero por lo que he leído parece haber un énfasis en el aprendizaje automático que compite con el modelado numérico en lugar de aumentar el juicio humano sobre qué modelos merecen una mayor confianza en determinadas situaciones.

Steven McQuinn

Está siendo probado. Puede encontrar muchos artículos científicos con “pronóstico del tiempo de aprendizaje automático”. Sin embargo, no los he seguido, así que no puedo comentar sobre el progreso. Tal vez este artículo da ideas:
Cómo el aprendizaje automático podría ayudar a mejorar los pronósticos climáticos

Mi opinión es que es poco probable que ML reemplace el enfoque físico a nivel micro. Sin embargo, es bastante posible que lo complemente con una vista de nivel macro, que al menos las ecuaciones clásicas clásicas básicas no pueden ver.

Akash Singh

Usamos ML para modelar el clima. Yo no, pero Yandex sí (aquí está el enlace de prensa). Yandex es la mayor compañía rusa de TI con muchos servicios como búsqueda web, taxi (como uber), servicio de tráfico, etc.

Zakhar Stavitsky

De hecho, dicho sistema existe en Rusia. Es Yandex Meteum

Compara pronósticos tradicionales con datos de estaciones meteorológicas. Analiza los errores repetidos y utiliza el método de aprendizaje automático denominado MatrixNet para detectar patrones estadísticos en ellos. En el siguiente paso, produce el conjunto de reglas que ayudan a mejorar el pronóstico.

Yandex Meteum proporciona pronósticos para cada dirección en particular en lugar de toda la ciudad.

Sergey Legotsky

More Interesting

¿Es así como se elimina de un árbol de búsqueda binario cuando un padre tiene dos subárboles?

¿Cuál es el peor caso, el caso promedio y la mejor complejidad de tiempo de un algoritmo?

¿Cómo usaría BFS en un árbol para imprimir los valores de cada nivel por separado?

¿Qué es el código binario?

¿Avanzar en CS en general hará que los algoritmos sean cada vez más complejos con el tiempo que las personas no pueden manejar? ¿Cuáles son las soluciones para ese caso?

¿Cómo dirigen los sistemas de guía del vehículo de lanzamiento la carga útil hacia órbitas tan precisas?

Cómo validar un algoritmo de stock

¿Por qué muchos elementos utilizados en la función objetivo de un algoritmo de aprendizaje asumen todas las características centradas en cero y tienen una varianza en el mismo orden?

¿Cuál es la forma más rápida de invertir una cadena con más de 10000 caracteres?