Tengo un modelo CNN ajustado en un pequeño conjunto de datos de 150 imágenes. Cuando uso el desenfoque para expandir el conjunto de datos (150 originales + imágenes borrosas), el resultado es peor que solo usar 150 imágenes. No estoy seguro por qué
Está agregando el desenfoque y el ruido presumiblemente porque desea que la red pueda tomar entradas borrosas o ruidosas, ¿correcto?
Si solo desea generar más datos de entrenamiento y sus datos de prueba no serán borrosos o ruidosos, la traducción / rotación / reflexión / recorte es una mejor manera de hacerlo.
- ¿Puedo replicar el auto sin conductor de Google como un proyecto de pasatiempo?
- Cómo desarrollar un chatbot basado en IA en Python desde cero
- ¿Qué tipo de matemática se usa en el aprendizaje automático y cómo se puede aprender?
- Cómo crear un bot para escribir noticias automáticamente
- ¿Cuándo comenzarán las grandes empresas a utilizar el aprendizaje automático para permitir que cada empleado haga su trabajo según su propio estilo y no a través del enfoque guiado de la empresa?
Suponiendo que espere imágenes borrosas / ruidosas en la práctica, hay varias cosas que podrían estar sucediendo:
- Estás agregando demasiado desenfoque / ruido. Si agrega mucho ruido, necesita muchos más datos de entrenamiento e incluso entonces puede ser difícil obtener una buena precisión.
- Estás agregando la cantidad justa de ruido. La red está aprendiendo en un rango más amplio de datos, pero aún tiene un poder predictivo finito. Ha aumentado la complejidad del problema sin aumentar la complejidad de su red. Es posible que no esté equipado debido a la falta de poder predictivo de su red.
- Debe esperar una mayor pérdida de entrenamiento. Los datos con ruido son más difíciles de interpretar que los datos sin ruido. Solo las pérdidas de prueba son importantes. Si sus datos de validación son ruidosos, al agregar ruido a sus datos de entrenamiento, debe esperar una menor pérdida de validación. Si los datos que planea alimentar a la red en la práctica no son ruidosos, sus datos de capacitación y validación tampoco deberían serlo.