¿Cuáles son algunas técnicas comunes para el aumento de datos de video en el aprendizaje profundo?

Hay un par de técnicas disponibles para el aumento de datos de video:

Dado un video más largo que la duración de video requerida, puede usar diferentes fragmentos de video (de su duración requerida, pero más cortos que el video disponible). Entonces, por ejemplo, el video disponible tiene una longitud de 150 cuadros y su longitud requerida es de 140, puede hacer 10 (150-140) videos diferentes usando 10 combinaciones de 140 cuadros consecutivos. Hemos discutido esta técnica en nuestro documento (https://arxiv.org/pdf/1611.05125…), desafortunadamente, no obtuvimos los beneficios deseados, pero tal vez usted pueda obtenerlos.
Dependiendo de su aplicación, puede soltar algunos cuadros o duplicarlos.
Como dijo Mahshid Majd, el aumento espacial, por naturaleza, le dará datos aumentados temporalmente.
Puede agregar ruido a los cuadros.

Aprendizaje automáticoAprendizaje profundoMinería de datosRedes neuronales artificiales

Los algoritmos de ML escritos en Java funcionan bien para un conjunto de datos más pequeño. Para un conjunto de datos grande, ¿cómo podemos escalar estos algoritmos? ¿Necesitamos buscar algoritmos distribuidos / mapas distribuidos en memoria / NOSQL / archivos para leer y escribir grandes conjuntos de datos o hay alguna buena API?

¿Cuáles son las distribuciones bayesianas anteriores y posteriores? ¿Cuáles son sus roles en las redes neuronales?

Al diseñar nuevas arquitecturas de aprendizaje profundo, ¿cómo se determina si la arquitectura es mala o si la optimización del modelo es el problema?

¿Qué significa el impulso en las redes neuronales?

¿Qué cursos debería tomar para especializarse en aprendizaje automático, ciencia de datos e IA como estudiante de MS CS en USC?

Tengo una contraseña wifi pero aún no puedo usarla debido a la dirección Mac, ¿cómo puedo evitar este cortafuegos?

He visto artículos que aumentan los datos en la dimensión temporal a través de marcos de submuestreo en diferentes frecuencias, por ejemplo

Marco 1,2,3,4,5,6,7,8,9,10 – etiqueta A

Marco 1,3,5,7,9,11,13,15,17,19 – también etiqueta A

Marco 1,4,7,10,13,16,19,22,25,28 – también etiqueta A

Útil para tareas como la clasificación de video donde la frecuencia temporal de cuadros es invariable para la etiqueta de video. Espero que esto ayude.

Saurav Gupta

Para los videos, puede tener un aumento temporal y espacial. Recorte secuencias aleatorias de cuadros consecutivos para tener el aumento temporal y el aumento espacial sería lo mismo que las imágenes, solo haga el mismo aumento espacial para todo el clip.

Saurav Gupta

More Interesting

¿Qué caminos puede tomar un ingeniero mecánico para comenzar a trabajar con robótica, aprendizaje automático e inteligencia artificial?

¿Qué parte de la investigación de aprendizaje profundo es empírica versus teórica?

¿Cómo comenzó Perl como el idioma dominante en bioinformática?

¿Cómo determina el reconocimiento facial al dueño de la cara que detecta?

¿Cuáles son los mejores materiales de física estadística para redes neuronales profundas?

¿Cuál es la función de zeropad en CNN?

¿Cuál es / son los métodos para iniciar / elegir filtros en redes neuronales convolucionales?

¿Cuál es el mejor método para la reducción de dimensionalidad y la selección / extracción de características en datos de espectrometría de masas?

¿En qué casos tengo que usar un entorno distribuido y en qué casos no?

En el aprendizaje automático, ¿cómo estima el descenso de gradiente la pendiente de la función de pérdida en un punto dado?