¿Cuáles son algunas aplicaciones potenciales del seguimiento de objetos depredadores (nuevo algoritmo)?

Ni el algoritmo de seguimiento ni el algoritmo de reconocimiento de objetos son únicos; Lo bueno de la aplicación es la forma en que se han combinado para hacer un proceso de aprendizaje sólido.

El seguimiento se realiza con un rastreador Lucas-Kanade basado en flujo óptico (ver entrada de wikipedia). El reconocimiento utiliza un esquema de clasificación tipo Halet-wavelet. La parte clara es que cuando el usuario identifica algo (automóvil, ojo, etc.) para rastrear / detectar, el sistema de reconocimiento utiliza la entrada inicial del usuario como datos de entrenamiento etiquetados. Después de eso, el sistema de seguimiento se usa para etiquetar datos adicionales, expandiendo el conjunto de entrenamiento sobre diferentes vistas / aspectos del mismo objeto. Esto es excelente hasta que el sistema comienza a desviarse, porque utilizará datos etiquetados incorrectamente para entrenar, y divergerá de la verdad del terreno. La respuesta de Predator a esto es que el sistema genera restricciones positivas y negativas, y busca datos etiquetados incorrectamente. Cuando un objeto se etiqueta como objeto de interés pero no puede ser objeto de interés debido a las restricciones, se agrega al conjunto de entrenamiento negativo. Del mismo modo, un objeto etiquetado como no objeto de interés pero debe ser debido a restricciones se agrega al conjunto de entrenamiento positivo. Después de agregar objetos al conjunto de entrenamiento, el reconocedor se vuelve a entrenar. Hacer esto hace que el sistema sea mejor y mejor con el tiempo.

Para mí, la primera aplicación de este algoritmo de seguimiento sería la generación eficiente de datos de entrenamiento. Una de las partes más difíciles y que requieren más tiempo para hacer el reconocimiento de objetos es generar datos de entrenamiento etiquetados. Requiere que alguien pase una cantidad excesiva de tiempo seleccionando el objeto de interés. Usando Predator, la cantidad de datos etiquetados se expande dramáticamente.

La segunda aplicación es la transición del reconocimiento de objetos a video de manera realista. La mayoría del reconocimiento de objetos de video es solo reconocimiento de imágenes estáticas que se realiza rápidamente. Si bien ese reconocimiento rápido aún debe hacerse con Predator, puede representar el movimiento del objeto como una ruta en el espacio de la imagen y usarlo para mejorar el rendimiento. El uso de esto para rastrear muchos objetos en movimiento al mismo tiempo será muy poderoso, ya que permite rastrear, por ejemplo, muchos automóviles o personas al mismo tiempo. Reducirá la confusión y resolverá las ambigüedades, lo que hará que la mayoría de los algoritmos sean inútiles una vez que la densidad del tráfico sea demasiado alta.

Finalmente, Predator debería ser utilizable para generar y entrenar en modelos 3D de objetos y luego usar esos modelos para reconocer objetos. El reconocimiento se realiza actualmente con imágenes en 2D, pero si puede rastrear un objeto a medida que se mueve y cambia de ubicación y aspecto, y puede hacer buenas estimaciones de la postura con el tiempo, puede determinar la forma en 3D. La detección de objetos de imagen estática está fundamentalmente infradeterminada: una amplia variedad de objetos 3D puede producir la misma imagen 2D. Si combina imágenes a lo largo del tiempo con un objeto que está cambiando el lado que está frente a la cámara, puede determinar qué objeto 3D es. Depredador es parte de esa solución.

Un par de aplicaciones que se me ocurren en la cabeza:

  1. Seguimiento de comportamientos en grandes multitudes densas: una vez que se ha identificado el comportamiento, el sistema continuará aprendiendo el comportamiento en el entorno dado. Este problema es extremadamente difícil debido a la forma en que se mueven las multitudes, las oclusiones, la postura, la calibración de la cámara, etc. El sistema podría configurarse con otros clasificadores para aprender continuamente estos modelos.
  2. Reconocimiento de rostros: aunque este no es un problema nuevo, el sistema de depredador adopta un enfoque (aunque ya se ha hecho antes) en el que una vez que se ha identificado el rostro y continuará entrenando a un clasificador para identificar ese rostro. En este video, viste que resaltó esta cara, la rastreó y luego, en menos de un minuto, pudo reconocerla en una imagen de otras 15 caras. Otros algoritmos de reconocimiento facial como Eigenfaces [1] requieren que el sujeto esté en el conjunto de entrenamiento para un reconocimiento exitoso. Depredador mitigaría este problema.
  3. Reconocimiento de matrículas: ¡A muchos gobiernos de todo el mundo les encantaría tener este conjunto de datos!

Básicamente, podría usarse para resolver cualquier problema en el que tenga algún patrón que esté buscando y que cambie con el tiempo, porque el sistema continuará aprendiendo ese patrón y será mejor para identificarlo con el tiempo.

[1] http://www.cse.unr.edu/~bebis/Ma

More Interesting

¿Dónde aprendo Machine Learning?

¿Cuál es una buena definición de Generalización wrt Deep Learning?

¿Qué debo hacer para poder contribuir al campo de la visión por computadora y trabajar en Google en el futuro?

¿Cuáles son los consejos para aprender el aprendizaje automático?

¿Cuáles son algunas aplicaciones de la vida real del aprendizaje automático además de las aplicaciones relacionadas con la web?

¿Cuáles son los buenos algoritmos para la extracción de características para grandes conjuntos de datos?

¿Hay trabajos de investigación que utilicen el aprendizaje profundo para tomar decisiones clínicas?

¿Cuáles son algunos de los problemas de desarrollo que enfrenta la inteligencia artificial?

¿Qué algoritmos de optimización son buenos candidatos para la paralelización con MapReduce?

Teoría de la información: ¿Cuál es la relación entre la inteligencia y los algoritmos de compresión de datos?

Dada una red de aprendizaje profundo, ¿se puede entrenar para enseñar (por ejemplo, resolviendo la secuencia óptima de ejemplos o lo que sea) otra red? Si es así, ¿se puede resolver este problema (enseñanza) utilizando técnicas de aprendizaje profundo?

¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

¿Qué es la discretización de características?

¿Cuáles son las similitudes y diferencias entre los campos aleatorios condicionales (CRF) y las redes de Markov de margen máximo (M3N)?

Cómo comenzar a leer trabajos de investigación sobre Machine Learning