En primer lugar, como desarrollador / ingeniero de aprendizaje profundo (DL), no es su trabajo atrapar criminales, sino desarrollar su sistema para ayudar a las personas mejor calificadas a atrapar a los delincuentes o abusadores de niños.
Así que hay varios métodos que puede usar para reducir el ruido y mejorar los videos, pero mencionaré uno genial. Utilice las redes adversas generativas (GAN), la red del generador específicamente, para mejorar la calidad de los cuadros de video.
La GAN es un tipo especial de algoritmo de aprendizaje no supervisado que utiliza dos redes adversarias, la red discriminadora y la generadora. La red del generador genera contenido y la red discriminadora siempre debe intentar no dejarse engañar por el generador. Después del entrenamiento, la red del generador se vuelve tan buena para generar contenido realista a partir del ruido aleatorio. Puede usar esta técnica para desarrollar un algoritmo de mejora de imagen que se puede usar para mejorar cada cuadro de video. El video mejorado puede ser analizado por humanos para reunir más evidencia sobre el crimen.
- ¿Cuántos desarrolladores necesitamos si queremos hacer uso de la API Watson de IBM?
- ¿Será el futuro cercano de la visión por computadora el aprendizaje profundo pesado?
- ¿Cómo sugeriría Carlos Matias La Borde que un novato aprenda el aprendizaje automático?
- Cómo usar la función Master-Slave de PHPMyAdmin para replicar una base de datos en una máquina diferente
- ¿Podría la red neuronal de convolución completa aprender a discriminar entre clases si no hay muestreo descendente y la entrada es igual a salida?
También es posible desarrollar un sistema automatizado de reconocimiento de la acción humana utilizando técnicas de aprendizaje automático (ML). Sin embargo, este sistema es muy difícil de desarrollar, ya que tiene que aprender de los datos de video espacio-temporales. Dicho sistema necesita una combinación de algoritmos ML como redes neuronales convolucionales (convNets) para el procesamiento de información espacial y la red de memoria a corto y largo plazo (LSTM) para el procesamiento de información temporal. También puede ser importante agregar un modelo de atención a la mezcla, la atención mejora el rendimiento.
Si se desarrolla dicho sistema para el reconocimiento de la acción humana, puede ser útil para muchas aplicaciones. Como la detección de contenido obsceno en video, como la detección de desnudos, escenas sexuales y violencia. Dichos sistemas pueden ser útiles en la transmisión en vivo de Facebook y videos de YouTube para bloquear automáticamente el contenido para menores de edad.
Entonces sí, es posible construir un sistema automatizado para ayudar a atrapar criminales.
Espero que esto ayude.