Los mejores enfoques para el reconocimiento facial se basan en el modelado 3D de la cara junto con redes neuronales convolucionales profundas. DeepFace de Facebook utiliza este tipo de métodos, primero el sistema recupera la pose de la cara en 3D y luego proyecta la cara en forma canónica, frontal, luego esa representación canónica se alimenta a una red neuronal profunda.
La razón del éxito de los métodos 3D es obvia, pueden manejar muchas distorsiones derivadas del hecho de que las caras no pueden ser completamente frontales. Los algoritmos de reconocimiento facial de Microsoft también usan cámaras especiales que capturan caras en 3D y, por lo tanto, el reconocimiento no se ve afectado por las condiciones de pose e iluminación, es tan bueno que puede distinguir a los gemelos.
El reconocimiento facial aún se ve afectado por la iluminación, la postura de la cara y cosas como el maquillaje facial y las gafas. Normalmente es mejor modelar caras correctamente antes de alimentarlas a una convNet u otras arquitecturas de aprendizaje profundo. Las características aprendidas por sí solas en una convNet no son suficientes para manejar las diversas condiciones en las que se puede observar una cara, las llamadas caras en la naturaleza.
- ¿Cuáles son algunas aplicaciones interesantes del aprendizaje profundo?
- ¿Por qué todavía no se ha creado la verdadera AGI (inteligencia general artificial)?
- ¿Cuál es el filtro de Kalman intuición?
- ¿Cuál es el algoritmo de inteligencia artificial detrás de la sugerencia de la sección de cada sitio web?
- ¿Cuál es una buena manera de construir un algoritmo de aprendizaje automático para reconocer patrones?
Ver también:
DeepFace – Wikipedia
Espero que esto ayude.