¿Cuál es el orden cronológico de los algoritmos de reconocimiento facial?

Los sistemas de reconocimiento facial normalmente tienen 3 etapas principales.

  1. Detección de rostro
  2. Alineación de la cara
  3. Representación de la cara

Vamos a profundizar un poco.

Detección de rostros :

En esta etapa, todas las caras se ubican independientemente de género, sexo, raza o identidad. Normalmente, se utiliza un cuadro delimitador para la ubicación de caras en una imagen. Por lo tanto, el clasificador debe proporcionar todas las ubicaciones de caras escaneando cada ubicación posible. Esta es la razón por la cual esta etapa tiene que ser rápida y precisa, el detector facial Viola-Jones se usa ampliamente en sistemas de cámara digital o integrados.

Alineación de la cara :

Las caras pueden ser frontales, de perfil o algo intermedio. Entonces, el propósito de esta etapa es normalizar las caras o alinearlas de modo que parezcan frontales. Esto funciona mediante la detección de puntos de referencia faciales como los ojos, la boca y la nariz derechos e izquierdos. A partir de esos puntos de referencia, es posible recuperar una postura facial más precisa que se puede utilizar para alinear la cara en una postura canónica, es decir, la postura frontal. Esto mejora el rendimiento dramáticamente.

Representación de la cara :

Las caras alineadas deben representarse de una manera más robusta para facilitar una coincidencia más precisa entre las caras. Normalmente, lo mejor es encontrar un nuevo espacio en el que las caras de la misma persona produzcan representaciones similares pero diferentes en diferentes caras. Por lo tanto, necesitamos una nueva integración de la cara mediante la formación de redes neuronales convolucionales siamesas. Por lo tanto, la nueva representación se puede combinar utilizando la medida de distancia euclidiana y las operaciones básicas de umbral. Hay muchas formas de representar caras para un mejor rendimiento de reconocimiento. La PCA también se puede usar, pero puede ser menos precisa.

Los sistemas de reconocimiento de rostros como el anterior pueden ser propensos a reconocer las fotos de una persona como la persona misma, por lo que cualquiera que tenga algunas fotos de esa persona puede iniciar sesión. Esta es la razón por la cual los enfoques basados ​​en 3D son principalmente los de mejor desempeño en términos de aplicaciones de seguridad.

Espero que esto ayude.

More Interesting

Analizador de programación: ¿por qué devolvemos los datos restantes (no consumidos) mientras escribimos un analizador?

¿Qué es la generación procesal y la generación aleatoria? ¿Cuál es la diferencia y cómo se logra cada uno?

Informática: ¿Por qué la recursión es más elegante que la iteración?

¿Es necesario aprender matemáticas discretas antes de comenzar a aprender la estructura de datos y el algoritmo? ¿Y cuál será el mejor libro para hacer lo mismo?

¿Cuál es el algoritmo más corto para probar si dos cadenas son anagramas?

¿Qué papel juega la comprensión de los algoritmos y las estructuras de datos en la construcción de proyectos, conseguir un trabajo y hacer su trabajo?

¿Cuál es un ejemplo de un algoritmo de filtro en la selección de funciones en el aprendizaje automático?

¿Qué es NP-hard y NP-complete?

¿Cuáles son algunos ejemplos de problemas que son: (1) NP pero no NP-Complete; (2) NP-Completo; (3) NP-Hard pero no NP-Complete?

Cómo crear un árbol binario de búsqueda binaria para los datos: 10, 8, 15, 7, 3, 6, 12, 5, 9,17

¿Crees que KNN tiene privilegios en comparación con otros algoritmos de aprendizaje automático porque aprende con el tiempo?

Estoy buscando algunas clases que me darían consejos sobre el enfoque. ¿Debo tomar el diseño del sistema, el algoritmo o la preparación de la estructura de datos?

¿Las ventajas del arreglo lineal desaparecen si el arreglo es demasiado corto? ¿Por qué veo 4-6 cajas de cajas?

¿Qué es un algoritmo de programación dinámica que podría resolver el problema a continuación?

Cómo encontrar si un número dado es primo o no