¿Hay alguna guía sobre el uso de datos sintéticos para entrenar algoritmos de visión por computadora? ¿Hay alguna investigación al respecto? La tecnología cambia la vida futura

Complementar los conjuntos de datos existentes con datos sintéticos es un área activa de investigación. Para responder la primera parte de su pregunta, necesitamos profundizar un poco más en los detalles del problema. La respuesta descaradamente obvia (y quizás inútil) es generar datos que coincidan lo más posible con la distribución del entrenamiento (suponiendo que la distribución del entrenamiento esté razonablemente cerca de la distribución del examen). Para complementar esta solución relativamente amorfa, veamos el trabajo previo y sus éxitos.

La investigación de gráficos por computadora ha avanzado mucho antes del auge de la visión por computadora, y el problema futuro (construir el mundo visual) está casi resuelto más allá de la distinción humana, por lo que para la mayoría de las tareas de clasificación o detección que involucran fenómenos físicos del mundo real, generan datos sintéticos a través de representaciones gráficas puede ser un buen punto de partida. Ha habido investigaciones previas con éxito en esta área, especialmente en la comprensión de videos.

El trabajo en https://adas.cvc.uab.es/phav/, por ejemplo, complementa los conjuntos de datos de reconocimiento de acción relativamente pequeños con videos generados sintéticamente, con niveles de éxito decentes en conjuntos de datos del mundo real. Si revisa las primeras líneas en la Sección 2 de su artículo de arXiv, vería una colección sustancial de trabajos anteriores sobre el mismo, aplicados a tareas que incluyen detección de objetos, reconocimiento, comprensión de escenas para estimar las poses.

También hay una colección bastante grande de trabajos previos disponibles aquí: visión por computadora irreal / sintética, que puede brindarle información sobre las propiedades de los datos sintéticos más comúnmente realizados y los posibles puntos de partida para su tarea.

Intuitivamente, sería difícil generar datos donde intervienen sistemas expertos (tareas como la categorización detallada, la comprensión de imágenes médicas o la clasificación en datos sensoriales de alta dimensión, por ejemplo), estos ajustes pueden verse afectados por largas colas en las distribuciones de clase y grandes variaciones dentro de la clase (en comparación con las variaciones entre clases), por ejemplo, lo que haría que modelar la función de generación de datos sintéticos sea más complicado.

AlgoritmosAprendizaje automáticoAprendizaje profundoConjuntos de datosVisión por computadora