Hay una historia que se transmite para ilustrar las formas en que el aprendizaje automático puede detectar características en su conjunto de datos que no esperaba.
“Érase una vez, el ejército de los EE. UU. Quería usar redes neuronales para detectar automáticamente tanques enemigos camuflados. Los investigadores entrenaron una red neuronal en 50 fotos de tanques camuflados en árboles y 50 fotos de árboles sin tanques. Utilizando técnicas estándar para el aprendizaje supervisado, los investigadores entrenaron a la red neuronal a una ponderación que cargó correctamente el conjunto de entrenamiento: emitió “sí” para las 50 fotos de tanques camuflados y “no” para las 50 fotos del bosque. Esto no aseguró, ni siquiera implica, que los nuevos ejemplos se clasifiquen correctamente. La red neuronal podría haber “aprendido” 100 casos especiales que no se generalizarían a ningún problema nuevo. Sabiamente, los investigadores habían tomado originalmente 200 fotos, 100 fotos de tanques y 100 fotos de árboles. Habían usado solo 50 de cada uno para el conjunto de entrenamiento. Los investigadores corrieron la red neuronal en las 100 fotos restantes, y sin entrenamiento adicional la red neuronal clasificó todas las fotos restantes correctamente. ¡Éxito confirmado! Los investigadores entregaron el trabajo terminado al Pentágono, que pronto lo devolvió, quejándose de que, en sus propias pruebas, la red neuronal no era mejor que la posibilidad de discriminar fotos.
Resultó que en el conjunto de datos de los investigadores, se tomaron fotos de tanques camuflados en días nublados, mientras que se tomaron fotos de bosques en días soleados. La red neuronal había aprendido a distinguir los días nublados de los días soleados, en lugar de distinguir los tanques camuflados del bosque vacío “.
- Cómo clasificar micro-textos (tweets, preguntas, etc.)
- En el análisis de sentimientos, ¿cómo son útiles los datos etiquetados por humanos para extraer características y capacitar a los clasificadores en el enfoque de aprendizaje automático?
- ¿Qué tan grande es el mercado de consultoría de aprendizaje automático para nuevas empresas?
- ¿Es aconsejable crear una aplicación basada en el aprendizaje automático y el procesamiento de imágenes sin comprender el concepto matemático subyacente?
- ¿A qué laboratorio puedo unirme en Caltech para hacer investigación de aprendizaje automático?
fuente: Detección de tanques