¿Cuál es el mejor método para el reconocimiento facial, PCA, modelo o redes neuronales?

Los mejores enfoques para el reconocimiento facial se basan en el modelado 3D de la cara junto con redes neuronales convolucionales profundas. DeepFace de Facebook utiliza este tipo de métodos, primero el sistema recupera la pose de la cara en 3D y luego proyecta la cara en forma canónica, frontal, luego esa representación canónica se alimenta a una red neuronal profunda.

La razón del éxito de los métodos 3D es obvia, pueden manejar muchas distorsiones derivadas del hecho de que las caras no pueden ser completamente frontales. Los algoritmos de reconocimiento facial de Microsoft también usan cámaras especiales que capturan caras en 3D y, por lo tanto, el reconocimiento no se ve afectado por las condiciones de pose e iluminación, es tan bueno que puede distinguir a los gemelos.

El reconocimiento facial aún se ve afectado por la iluminación, la postura de la cara y cosas como el maquillaje facial y las gafas. Normalmente es mejor modelar caras correctamente antes de alimentarlas a una convNet u otras arquitecturas de aprendizaje profundo. Las características aprendidas por sí solas en una convNet no son suficientes para manejar las diversas condiciones en las que se puede observar una cara, las llamadas caras en la naturaleza.

Ver también:

DeepFace – Wikipedia

Espero que esto ayude.

El reconocimiento facial basado en el aprendizaje profundo ha obtenido la mayor atención. Consulte OpenFace, que es el estado del arte en Reconocimiento facial. Es una implementación basada en el famoso artículo FaceNet de Google. También está el Descriptor de rostro VGG basado en VGG.

Ambos superan con mucho los algoritmos de reconocimiento facial más tradicionales (por ejemplo, PCA, LBP, etc.)

El reconocimiento de rostros también depende del uso del Detector de rostros adecuado, para el cual están disponibles varias técnicas más simples (no basadas en aprendizaje profundo). Estos incluyen, por ejemplo, los detectores faciales basados ​​en OpenCV y el de DLIB (el primero se basa en Haar Cascades, un trabajo seminal de Viola y Jones, mientras que el segundo se basa en el histograma de gradientes).

El reconocimiento facial es extremadamente no lineal, por lo tanto, es mejor usar un algoritmo de Machine Learning (ML) que funcione mejor en esas situaciones. Por lo tanto, las redes neuronales (NN) son el camino a seguir.

En una línea similar, el reconocimiento de dígitos escritos a mano también es muy no lineal. El mejor algoritmo utilizado en ese caso fue NN.

Recuerde que no hay almuerzo gratis en búsqueda y optimización: Wikipedia, que establece que no hay un mejor algoritmo que sea el mejor en todos los casos.

More Interesting

¿Cómo es la competencia para un doctorado en las mejores escuelas en áreas distintas a la IA? Parece que todo el mundo quiere obtener un doctorado en IA hoy en día, por lo que me preguntaba cuántas aplicaciones obtienen otras áreas.

Quiero escribir un trabajo de investigación sobre inteligencia artificial, ¿qué debo hacer para comenzar?

Si construí una IA que descubrió algo, y ese descubrimiento fue galardonado con el Premio Nobel. ¿Podría ser considerado el ganador de eso?

¿Cuáles son las mejores universidades / institutos en la India para hacer doctorado en inteligencia artificial?

¿Es posible emular el patrón de habla de una persona a partir de una oración / párrafo simple como se muestra en Misión Imposible 3?

¿Existe una solución analítica para la regresión logística, similar a la de la ecuación normal para la regresión lineal?

Si Sophia the Android obtuvo la ciudadanía, ¿puede un sistema que ejecute la IA de Sophia también obtener la ciudadanía?

¿Los robots alguna vez serán sensibles? Si es así, ¿cómo y cuándo?

Quiero comenzar a crear robots, ¿por dónde empiezo?

¿Es la singularidad un hecho o solo una hipótesis?

¿Son los requisitos de autoconciencia y motivación egoísta para AGI / ASI?

¿Qué propiedades deben tener los sistemas artificiales de aprendizaje general?

Si la IA dominara el campo de la inversión de valor analizando y analizando, como los humanos, ¿tendría algún sentido producir contenidos para inversores de valor?

¿Cuáles son algunos ejemplos de medios de ciencia ficción con IA inteligente que no salen mal?

¿Puedo obtener un M.Tech en inteligencia artificial de IIT además de completar mi BE en electrónica e instrumentación?