¿Cuáles son algunas direcciones de investigación recientes en análisis y reconocimiento de rostros?

La detección y el reconocimiento de la cara son importantes por muchas razones y, por lo tanto, la mayoría de los algoritmos de visión por computadora están dedicados a la tarea de análisis y reconocimiento de características faciales, como la identificación de la edad, el género y las emociones de diferentes caras a pesar de las variaciones en las apariencias. Esta es un área abierta de investigación y el aprendizaje profundo, una vez más, actualmente está realizando enfoques anteriores en términos de confiabilidad y precisión.

Una cosa a tener en cuenta aquí es que, para la mayoría de los algoritmos de detección de rostros, los rostros no se rastrean, pero el algoritmo de detección se ejecuta en cada cuadro desde un video o una cámara de transmisión. El truco consiste en tener algoritmos computacionalmente eficientes repetidos 30 veces por segundo para una transmisión de video de 30 cuadros por segundo. El flujo óptico y los algoritmos de movimiento o seguimiento rara vez se usan en la detección de rostros en videos.

El enfoque de detección de rostros Viola-Jones es probablemente el más rápido hasta la fecha, todavía se usa en cámaras digitales para detectar rostros para cosas como el enfoque automático y las adaptaciones de iluminación para que los rostros sean visibles. El otro enfoque que usa patrones binarios locales (LBP) también se basa en el algoritmo adboost para la selección de características. El problema con estos enfoques es la gran cantidad de falsos positivos y se limitan principalmente a la detección de rostros y al reconocimiento, aunque para aplicaciones básicas esto no es un problema.

Los enfoques más recientes para la detección y reconocimiento de rostros se basan en la detección de puntos de referencia faciales, es decir, nariz, boca, ojo derecho y ojo izquierdo. Esto lo convierte en una tubería de detección robusta para caras que no están alineadas correctamente, como las caras de perfil parcial. Sin embargo, esto no es muy robusto y puede verse afectado por cambios severos de postura, pero este enfoque es mucho mejor que un enfoque de ventana deslizante única. Lo mejor aquí es entrenar varias redes neuronales convolucionales (CNN) para detectar diferentes puntos de referencia faciales y combinar los resultados en la red de salida.

El otro enfoque es probablemente el mejor y se basa en una combinación novedosa de emparejamiento / alineación 3D y aprendizaje profundo. Algunos algoritmos sofisticados convierten la cara en un modelo 3D y, basándose en el modelo 3D, el algoritmo realiza una gran cantidad de normalización, como la normalización de la postura de la cara a través de la deformación afinada por partes antes de alimentar el resultado a una red neuronal profunda de nueve capas que extrae Una representación facial más profunda para un emparejamiento confiable.

En conclusión, ninguno de estos enfoques es la percepción facial perfecta o cercana al nivel humano, aunque deepFace afirma estar cerrando la brecha. El uso de redes neuronales profundas para la tarea de detección y reconocimiento de rostros podría ser lento en la mayoría del hardware, especialmente en los dispositivos móviles, por lo que el enfoque Viola-Jones podría emplearse para la tarea de detección de rostros y solo invocar los clasificadores de redes neuronales profundas en las ventanas de detección.

Espero que esto ayude.

Referencias

  1. DeepFace: cerrando la brecha en el rendimiento a nivel humano en la verificación facial
  2. Marco de detección de objetos Viola-Jones
  3. La magia detrás de How-Old.net
  4. Reconocimiento facial con patrones binarios locales

Puedes seguir algunos trabajos del grupo de investigación de Xiaoou Tang (en CUHK).

Se centran en las tareas que rodean el “Problema de detección de puntos faciales” que se muestra a continuación.

La red neuronal convolucional es el método principal para resolver este tipo de tareas en la visión por computadora. Recientemente se les ocurrió la idea de que resolver esta tarea con otras tareas múltiples (como distinguir si un hombre se está riendo o mostrar una pose) que comparten los pesos relacionados podría mejorar el resultado del modelo CNN. Puede obtenerlo más claramente en este documento: Aprendizaje y transferencia de representación profunda de tareas múltiples para la alineación facial [Zhanpeng Zhang y Ping Luo y Chen Change Loy y Xiaoou Tang 2014]

Echa un vistazo a los documentos CVPR15 [1], son bastante interesantes.
Un montón de ellos:

http://www.cse.msu.edu/~liuxm/pu…
Frontalización efectiva de la cara en imágenes sin restricciones
Página en cv-foundation.org

[1] @http: //www.A organización sin fines de lucro que fomenta y apoya la investigación en todos los aspectos de la visión por computadora / openaccess / CVPR2015.py

Eso es todo lo que hemos hecho hasta ahora: desarrollar un sistema de reconocimiento facial con redes neuronales convolucionales
Continuando la investigación.

More Interesting

¿Cuáles son las preguntas / temas de investigación más importantes en informática hoy en día?

Cómo estudiar la teoría de la computación para Gate

Cómo superar mis bloques de escritura científica en inglés (como segunda lengua)

Cómo volver al dominio de la informática mientras buscas un MBA de IIM

¿Habrá informáticos en 2047?

¿Un buen perfil en programación competitiva ayuda a obtener la admisión en los mejores programas de MS / Phd en las mejores universidades de EE. UU. Para Algoritmos / CS / Sistemas Teóricos? En caso afirmativo, ¿qué universidades específicas fomentan tales aplicaciones?

¿Cuáles son los campos interesantes en la informática teórica para entrar?

¿Es posible convertir el desarrollo de una aplicación basada en un marco existente en un trabajo de investigación?

¿Cómo es ser un estudiante graduado en ciencias de la computación en la USC?

Si todo el departamento de ciencias de la computación en una universidad se cerrara, ¿podría la mayoría de los profesores titulares conseguir trabajos como desarrolladores de software?

¿Qué puedes hacer en la escuela de posgrado para aumentar tus posibilidades de conseguir un trabajo académico, además de hacer una buena investigación?

Si los poderes informáticos aumentaran diez veces, ¿cómo afectaría la investigación actual de IA?

¿Cuáles son los temas de investigación actuales en informática en la nube?

¿Qué es mejor, realizar múltiples investigaciones al mismo tiempo o enfocarse una a la vez en un período fijo de tiempo?

¿Existe algún documento / tesis / investigación que demuestre que RegEx no debe usarse para el análisis HTML y que en su lugar debe usarse un analizador XML?