Cómo crear algoritmos de reconocimiento facial

Primero, ¿quieres desarrollar tu propio algoritmo o simplemente quieres usar algo que funcione?

Si quieres desarrollar tu propio …

Considere usar un marco de aprendizaje profundo para implementar una red neuronal convolucional de extracción de características con una función de triple pérdida. Una buena descripción de tal cosa está aquí.

También necesita un conjunto de datos lo suficientemente grande como la imagen de las personas clasificadas por identidad. Solo por una prueba de concepto, diría que 100-200K caras son suficientes. Pero para algo que esté listo para producción, le recomiendo que use al menos 1 millón de caras, pero si es posible.

Marcos a considerar: TensorFlow, Caffe, DeepLearning4j

Si solo quieres usar algo que funcione en tus aplicaciones …

Considere usar una de las muchas API disponibles. VisageCloud, la API desarrollada por mi equipo, tiene la ventaja de estar disponible tanto en la nube (como servicio) como en las instalaciones (instalado en sus propios servidores).

No lo sé, pero así es como lo haría:

Tener una base de datos de esquinas de muchas caras

Alimenta esos datos a algún algoritmo de ML

Ahora puede dar esquinas desde una imagen de la cara a la función anterior

Probablemente, existen algoritmos especializados para la detección de rostros, que son más precisos y no necesitan una base de datos.

More Interesting

¿Son las redes neuronales modelos paramétricos o no paramétricos?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Qué es un codificador / decodificador en aprendizaje profundo?

¿Cuál es el gradiente de la función de probabilidad logarítmica en la regresión logística multinomial?

Cómo predecir una variable de salida a partir de entradas dadas si la variable de salida y la variable de entrada se muestrean en diferentes intervalos de tiempo

¿Cuáles son las consecuencias y desventajas de usar datos agregados? ¿Cómo podemos combatirlos si no hay datos de nivel granular?

¿Cuáles son algunas características comunes utilizadas en la clasificación basada en audio?

¿Cuál es la forma mejor y más simple de agrupar productos por sus nombres?

¿Cuál es la principal diferencia entre la forma bayesiana de estimación de parámetros y la regresión lineal?

¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

¿Cuál es el mejor argumento en contra de no saber cómo usar una computadora porque él o ella no crecieron con ella?

¿Cómo debo proceder para implementar un analizador probabilístico de lenguaje natural?

¿En qué situaciones, ha encontrado que el aprendizaje profundo no funciona bien?

¿Cuál es la diferencia entre máquinas de vectores de soporte y aprendizaje profundo?