¿Cómo se puede usar el aprendizaje profundo para la detección de eventos anormales en los videos?

Respuesta corta:
Como sé, con mucho, no hemos encontrado una buena manera de utilizar el aprendizaje profundo para videos.

Respuesta larga:
Aunque el aprendizaje profundo muestra resultados exitosos en el aprendizaje de imágenes. La academia todavía está tratando de descubrir cómo poner los videos en la tubería de aprendizaje profundo. Como el video no es simplemente una colección de imágenes, la clave es codificar la información temporal.

Aquí hay algunos resultados recientes.
Clasificación de video a gran escala con redes neuronales convolucionales
Extrae algunos cuadros de cada video y hace la clasificación. Utilizan un conjunto de datos muy grande (más de un millón de videos) y obtienen un rendimiento bastante impresionante. Pero creo que ignora la información temporal.

[1406.2199] Redes convolucionales de dos corrientes para el reconocimiento de la acción en videos
Primero extrae el flujo óptico. Luego haga la clasificación en los marcos de flujo óptico. Al calcular el flujo óptico, utiliza la información de trama consecutiva. Así que creo que codifica un poco de información temporal.

Participamos en la evaluación de detección de eventos multimedia TRECVID (Evaluación MED 2014) en 2014 y superamos a otros equipos en la mayoría de las pistas. La función de aprendizaje profundo es esencial para nuestra cartera. Pero lo que hicimos fue extraer algunos “cuadros clave” que representan todo el video, luego aplicar la tubería de aprendizaje profundo en esos cuadros. Básicamente, todavía confiamos en la tubería para imágenes y la información temporal no está muy bien codificada. Incluso eso, todavía podemos vencer a los otros equipos. Así que creo que otros equipos tampoco encontraron mejores formas de utilizar el aprendizaje profundo.

Depende de lo que quiera decir con “evento anormal”. Si este evento puede detectarse desde un solo cuadro, entonces simplemente puede alimentar cada cuadro a una conexión de red para detectarlos. Sin embargo, no he visto ningún sistema DL de extremo a extremo para detectar eventos complejos que requieren analizar múltiples cuadros.

More Interesting

¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?

¿Por qué la precisión del entrenamiento de la red CNN aumenta rápidamente cuando elijo un tamaño de lote relativamente más pequeño?

¿Dónde puedo encontrar modelos de temas previamente capacitados para MALLET?

¿El rendimiento de la regresión logística se ve afectado negativamente por características altamente correlacionadas?

¿Cuáles son las diferencias en las aplicaciones de filtrado colaborativo en los datos de calificación y en los datos de compra?

¿Cómo la IA puede ser útil en Big Data?

Todos estos algoritmos de aprendizaje automático, ¿cuál es el punto? Parece que la elección del algoritmo de aprendizaje automático, el árbol de decisión, la red neuronal, svm, no es tan importante como la selección de características y el proceso de extracción de características que determina lo que entra, basura en basura, ese tipo de cosas.

¿En qué se diferencia exactamente la generación del lenguaje natural de la comprensión del lenguaje natural?

¿Habrá una demanda de aceleradores de hardware para algoritmos de aprendizaje automático en el futuro cercano?

¿Cuáles son los avances más significativos del aprendizaje automático en 2017?

¿Cuál es la diferencia entre Deep Autoencoders y Deep Belief Networks?

Cómo evaluar la reciente eliminación de recomendaciones para usar hilo dental

¿Cómo debo comenzar a escribir una IA que jugará FIFA?

Cómo interpretar los resultados de agrupación de k-means

¿Cuáles son algunas razones por las que algunas personas prefieren R y Matlab a Python para el aprendizaje automático?