¿Hay alguna guía sobre el uso de datos sintéticos para entrenar algoritmos de visión por computadora? ¿Hay alguna investigación al respecto?

Complementar los conjuntos de datos existentes con datos sintéticos es un área activa de investigación. Para responder la primera parte de su pregunta, necesitamos profundizar un poco más en los detalles del problema. La respuesta descaradamente obvia (y quizás inútil) es generar datos que coincidan lo más posible con la distribución del entrenamiento (suponiendo que la distribución del entrenamiento esté razonablemente cerca de la distribución del examen). Para complementar esta solución relativamente amorfa, veamos el trabajo previo y sus éxitos.

La investigación de gráficos por computadora ha avanzado mucho antes del auge de la visión por computadora, y el problema futuro (construir el mundo visual) está casi resuelto más allá de la distinción humana, por lo que para la mayoría de las tareas de clasificación o detección que involucran fenómenos físicos del mundo real, generan datos sintéticos a través de representaciones gráficas puede ser un buen punto de partida. Ha habido investigaciones previas con éxito en esta área, especialmente en la comprensión de videos.

El trabajo en https://adas.cvc.uab.es/phav/, por ejemplo, complementa los conjuntos de datos de reconocimiento de acción relativamente pequeños con videos generados sintéticamente, con niveles de éxito decentes en conjuntos de datos del mundo real. Si revisa las primeras líneas en la Sección 2 de su artículo de arXiv, vería una colección sustancial de trabajos anteriores sobre el mismo, aplicados a tareas que incluyen detección de objetos, reconocimiento, comprensión de escenas para estimar las poses.

También hay una colección bastante grande de trabajos previos disponibles aquí: visión por computadora irreal / sintética, que puede brindarle información sobre las propiedades de los datos sintéticos más comúnmente realizados y los posibles puntos de partida para su tarea.

Intuitivamente, sería difícil generar datos donde intervienen sistemas expertos (tareas como la categorización detallada, la comprensión de imágenes médicas o la clasificación en datos sensoriales de alta dimensión, por ejemplo), estos ajustes pueden verse afectados por largas colas en las distribuciones de clase y grandes variaciones dentro de la clase (en comparación con las variaciones entre clases), por ejemplo, lo que haría que modelar la función de generación de datos sintéticos sea más complicado.

More Interesting

Cómo implementar un algoritmo de sincronización de reloj Berkeley en C ++

¿Convertir el tamaño de matriz en un número primo ayuda en la implementación de la tabla hash? ¿Por qué?

¿Dar un nombre largo a una variable es una pérdida de memoria? ¿Int qwertyuiop_asdfghjkl_zxcvbnm; int i; tener el mismo efecto en el tiempo de compilación y ejecución?

¿Se pueden implementar dfs sin recursividad?

Si estoy usando Java para la codificación competitiva, ¿tendré problemas de tiempo más tarde por parte de jueces en línea cuando me sumerja en estructuras de datos y algoritmos?

Cómo aprender los pesos de las características de un modelo mediante el aprendizaje automático

¿Cuál es el mejor método de clasificación para usar si solo un elemento está fuera de servicio?

¿Pueden los algoritmos de aprendizaje de refuerzo actuales elegir múltiples acciones dado el estado actual?

¿Qué calcula este algoritmo? ¿Cuál es su funcionamiento básico? ¿Cuántas veces se ejecuta la operación básica? ¿Cuál es la clase de eficiencia de este algoritmo?

Además de la complejidad de tiempo y espacio, ¿qué otras métricas de rendimiento deben tenerse en cuenta al medir el rendimiento de un algoritmo?

¿Hay alguna razón para almacenar cosas en una lista en lugar de un árbol?

Si un gráfico G contiene un puente, e, ¿es posible construir un árbol de expansión que no incluya este borde?

¿Es posible el algoritmo de compresión que se muestra en Silicon Valley en realidad?

Cómo demostrar que el camino más corto posible entre dos puntos es una línea recta

¿Cómo eliges un campo interesante en informática?