¿Se pueden usar datos generados por simulación por computadora para algoritmos de aprendizaje automático?

De hecho, en los experimentos en el Gran Colisionador de Hadrones lo hacemos todo el tiempo cuando entrenamos clasificadores multivariados.

En nuestro caso, esto funciona bien porque tenemos una comprensión detallada de 1. los procesos físicos (tipos de colisiones de haces) que buscamos y 2. la interacción de las partículas producidas en las colisiones con los elementos detectores.

Nuestras simulaciones describen los datos registrados de colisiones de partículas reales casi a la perfección y dedicamos una cantidad significativa de tiempo a comprender y corregir las diferencias restantes entre los datos registrados con el detector real y la simulación.

(Debo agregar que las simulaciones son de naturaleza bastante compleja y aunque a menudo se basan en expresiones analíticas a nivel ‘microscópico’, el resultado general generalmente no puede describirse mediante una función analítica con la precisión deseada, de ahí el uso del aprendizaje automático métodos.)

Sí, con cuidado, uno puede usar la simulación, incluso en tareas difíciles puede ser útil. Un ejemplo muy reciente es en el ámbito de la conducción autónoma. En su artículo Playing for Data: Ground Truth de Computer Games, Richter et al muestran cómo puede utilizar Grand Theft Auto para etiquetar la verdad fundamental para identificar a los peatones, etc.

Así es como se ve:

El color indica la clase (por ejemplo, rosa indica carretera, azul indica automóvil).

Sin embargo, hay que tener cuidado. Rodney Brooks, uno de los primeros pioneros de la robótica, señaló una vez que “las simulaciones están condenadas al éxito”.

Sí. Utilizo este enfoque para cada nuevo algoritmo que aprendo y cada nuevo algoritmo que diseño. Proporciona una buena manera de comparar resultados con una verdad básica conocida. Consulte mi perfil de Google Académico para ver algunos documentos de ejemplo en los que uso simulaciones para probar las capacidades de nuevos algoritmos.

More Interesting

¿Por qué las redes de confrontación generativas son tan creativas?

¿Qué (empíricamente) necesita más datos de entrenamiento (etiquetados): modelos discriminativos o modelos generativos?

¿Debo aprender Python o R para el aprendizaje automático si estoy cursando mi licenciatura en matemáticas e ingeniería informática? ¿Qué idioma se usa más en las industrias?

¿Cuáles son los trabajos más gratificantes para quienes desean trabajar en el aprendizaje profundo?

¿Cuáles son las ventajas de las máquinas de vectores de soporte (SVM) en comparación con la regresión lineal o la regresión logística?

¿Se puede usar la detección de características / descripción de características para la clasificación de imágenes con redes neuronales artificiales?

¿Qué distingue una capa de una red neuronal de otras capas?

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

Después de lograr una precisión de aproximadamente el 82% en los datos de prueba mediante regresión logística, ¿cómo puedo estar seguro / seguro de que mi algoritmo se generalizará bien para toda la población?

¿Qué se sabe sobre la eficiencia de la agrupación espectral en caso de que los datos no estén completamente conectados?

¿Cómo puedo diseñar una gran red neuronal?

¿Cuáles son las revistas científicas mejor calificadas para Machine Learning / Data Science?

¿Cuánta experiencia ML necesita uno para las competiciones ML de Kaggle?

¿Cómo debo proceder después de completar el curso de aprendizaje automático de Andrew Ng?

¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?