Los humanos tienen un proceso llamado asignación de características, es decir, cuando se reconoce un objeto, las características que son responsables de ese reconocimiento se asignan a ese objeto reconocido en particular. Las características no se pueden asignar a más de un objeto, por lo tanto, en la imagen de arriba, un humano percibiría a una bella dama de espaldas o una anciana, pero no ambas a la vez, es decir, su percepción oscilaría entre percibir a una joven y una anciana. mujer dependiendo de cómo su sistema de visión asigna las características.
Este proceso de asignación de características no está presente en las arquitecturas actuales de aprendizaje profundo, por lo tanto, si el sistema DL se entrena adecuadamente en los rostros, lo más probable es que reconozca tanto a una joven como a una anciana, el puntaje de confianza sería casi el mismo para ambos.
La mayoría de las demostraciones del sistema DL, como las disponibles en línea, en realidad no están bien entrenadas en los rostros, por lo que espera un comportamiento impredecible de ellas. Por lo tanto, veo “bien entrenado” aquí como un significado bien entrenado para elegir caras en poses muy variadas.
- ¿Estamos presenciando las primeras etapas del uso de ML en la industria o cree que la aplicación de ML hacia la industria ya está muy extendida?
- ¿Cómo se siente la comunidad de aprendizaje automático sobre Kaggle?
- ¿Por qué funciona la función de costo de regresión logística?
- ¿Cuál es un ejemplo de un sistema, proceso o actividad que no puede ser modelado por un proceso de decisión de Markov?
- ¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?
Espero que esto ayude.