Los sistemas de reconocimiento facial normalmente tienen 3 etapas principales.
- Detección de rostro
- Alineación de la cara
- Representación de la cara
Vamos a profundizar un poco.
Detección de rostros :
- En el algoritmo KNN, ¿por qué el pequeño valor de k conduce a una pequeña tasa de error?
- ¿Desde dónde debo comenzar a aprender los algoritmos necesarios para la programación competitiva?
- Cómo generar una clave privada en el algoritmo RSA
- ¿Cuáles son algunas aplicaciones del algoritmo de clasificación de burbujas?
- ¿Qué es un árbol de búsqueda binario en una estructura de datos?
En esta etapa, todas las caras se ubican independientemente de género, sexo, raza o identidad. Normalmente, se utiliza un cuadro delimitador para la ubicación de caras en una imagen. Por lo tanto, el clasificador debe proporcionar todas las ubicaciones de caras escaneando cada ubicación posible. Esta es la razón por la cual esta etapa tiene que ser rápida y precisa, el detector facial Viola-Jones se usa ampliamente en sistemas de cámara digital o integrados.
Alineación de la cara :
Las caras pueden ser frontales, de perfil o algo intermedio. Entonces, el propósito de esta etapa es normalizar las caras o alinearlas de modo que parezcan frontales. Esto funciona mediante la detección de puntos de referencia faciales como los ojos, la boca y la nariz derechos e izquierdos. A partir de esos puntos de referencia, es posible recuperar una postura facial más precisa que se puede utilizar para alinear la cara en una postura canónica, es decir, la postura frontal. Esto mejora el rendimiento dramáticamente.
Representación de la cara :
Las caras alineadas deben representarse de una manera más robusta para facilitar una coincidencia más precisa entre las caras. Normalmente, lo mejor es encontrar un nuevo espacio en el que las caras de la misma persona produzcan representaciones similares pero diferentes en diferentes caras. Por lo tanto, necesitamos una nueva integración de la cara mediante la formación de redes neuronales convolucionales siamesas. Por lo tanto, la nueva representación se puede combinar utilizando la medida de distancia euclidiana y las operaciones básicas de umbral. Hay muchas formas de representar caras para un mejor rendimiento de reconocimiento. La PCA también se puede usar, pero puede ser menos precisa.
Los sistemas de reconocimiento de rostros como el anterior pueden ser propensos a reconocer las fotos de una persona como la persona misma, por lo que cualquiera que tenga algunas fotos de esa persona puede iniciar sesión. Esta es la razón por la cual los enfoques basados en 3D son principalmente los de mejor desempeño en términos de aplicaciones de seguridad.
Espero que esto ayude.