¿Cuántas imágenes de entrenamiento deberían usarse para una buena tarea de reconocimiento de género en OpenCV? ¿Hay algún conjunto de datos disponible para esta tarea?

La cantidad de datos que necesita para cualquier tarea depende de su modelo y la calidad de los datos, es decir, si sus imágenes contienen o no información suficiente para predecir la salida de la entrada. Había trabajado en un proyecto de curso sobre reconocimiento facial de género; el informe se puede encontrar en [1]. Utilizamos el conjunto de datos de escaneos de Nottingham, un conjunto de datos de juguete que consta de 50 imágenes masculinas y 50 femeninas en las que las caras se han capturado en un entorno controlado con sujetos cooperativos. Un simple clasificador SVM entrenado en características LBP parece ofrecer un rendimiento bastante decente con precisiones generales en el rango de 84 – 85%.

En una etapa posterior, también entrené a un SVM para la clasificación de género usando LFW (nuevamente con características de LBP), un conjunto de datos más desafiante con caras sin restricciones y variaciones significativas en pose, iluminación, expresión, etc. Por un lado, LFW ofrece más diversidad en términos de calidad de imagen, lo que dificulta la tarea de aprendizaje. Sin embargo, también es mucho más grande en tamaño con ~ 13k imágenes y, por lo tanto, ofrece más datos para aprender. Las precisiones en LFW estaban en el rango de 87 – 88% (en general).

[1] https://samyak-268.github.io/pdf…

More Interesting

¿Cuál es el significado intuitivo de una matriz de covarianza?

¿Hay algún resumen de las mejores modelos para el premio de Netflix? ¿Cuáles son las ideas de alto nivel e intuitivas detrás de los modelos ganadores que finalmente fueron utilizados en el aprendizaje conjunto por los mejores equipos?

¿El aprendizaje automático es un subconjunto de la ciencia de datos?

¿Hay ejemplos de organizaciones de ciencias de la vida que logren resultados en el descubrimiento de drogas a través del aprendizaje automático que no serían posibles sin el aprendizaje automático?

¿Cuáles son algunos buenos cursos y certificaciones en línea en aprendizaje automático e inteligencia artificial para un estudiante universitario de CS actual?

¿Cuál es la mejor manera de aprender la optimización numérica para el aprendizaje automático y el aprendizaje profundo?

Cómo elegir el modelo correcto con la distribución correcta

¿Tiene sentido entrenar clasificador para cada clase?

¿Qué es el análisis de componentes principales y cuántas variables se pueden usar para PCA?

¿Cuál es el mejor libro para aprender el pensamiento algorítmico?

¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?

¿Se pueden combinar blockchain y machine learning?

¿Cuáles son las opiniones de Yoshua Bengio sobre Kaggle y el aprendizaje automático competitivo en general?

¿Cómo funciona el mecanismo de atención de múltiples cabezas en el aprendizaje profundo?

¿Es posible mejorar automáticamente el archivo digital de una canción mediante muestreo y aprendizaje automático?