¿Por qué agregar borrosidad o ruido puede empeorar los resultados de la red neuronal en comparación con solo usar imágenes originales?

Tengo un modelo CNN ajustado en un pequeño conjunto de datos de 150 imágenes. Cuando uso el desenfoque para expandir el conjunto de datos (150 originales + imágenes borrosas), el resultado es peor que solo usar 150 imágenes. No estoy seguro por qué

Está agregando el desenfoque y el ruido presumiblemente porque desea que la red pueda tomar entradas borrosas o ruidosas, ¿correcto?

Si solo desea generar más datos de entrenamiento y sus datos de prueba no serán borrosos o ruidosos, la traducción / rotación / reflexión / recorte es una mejor manera de hacerlo.

Suponiendo que espere imágenes borrosas / ruidosas en la práctica, hay varias cosas que podrían estar sucediendo:

  1. Estás agregando demasiado desenfoque / ruido. Si agrega mucho ruido, necesita muchos más datos de entrenamiento e incluso entonces puede ser difícil obtener una buena precisión.
  2. Estás agregando la cantidad justa de ruido. La red está aprendiendo en un rango más amplio de datos, pero aún tiene un poder predictivo finito. Ha aumentado la complejidad del problema sin aumentar la complejidad de su red. Es posible que no esté equipado debido a la falta de poder predictivo de su red.
  3. Debe esperar una mayor pérdida de entrenamiento. Los datos con ruido son más difíciles de interpretar que los datos sin ruido. Solo las pérdidas de prueba son importantes. Si sus datos de validación son ruidosos, al agregar ruido a sus datos de entrenamiento, debe esperar una menor pérdida de validación. Si los datos que planea alimentar a la red en la práctica no son ruidosos, sus datos de capacitación y validación tampoco deberían serlo.

Porque su red neuronal intenta aprender características de datos. Usted proporcionó al conjunto de datos imágenes ruidosas y capacitó a su red neuronal con estos datos, por lo que su red aprende estas características ruidosas que afectarán el proceso de clasificación con el conjunto de datos de prueba.

Si sabe que su conjunto de datos contiene imágenes ruidosas, le recomiendo usar un algoritmo de aprendizaje no supervisado, para que extraiga las características importantes de las imágenes, luego use estas características para la clasificación. En su caso, creo que usar Denoising Autoencoder será bueno para usted. Se utiliza para la reconstrucción de entradas, alimenta su red con los datos sin procesar y la red intenta descubrir las características que afectarán a la clasificación.

De esta manera, evitará aprender los datos brutos exactos al reconstruir las imágenes originales de sus versiones ruidosas. También puede usar la máquina de Boltzmann restringida en lugar de Autoencoder

Tengo un modelo CNN ajustado en un pequeño conjunto de datos de 150 imágenes. Cuando uso el desenfoque para expandir el conjunto de datos (150 originales + imágenes borrosas), el resultado es peor que solo usar 150 imágenes. No estoy seguro por qué

More Interesting

¿En qué orden debo aprender el aprendizaje automático, el aprendizaje profundo, el procesamiento del lenguaje natural y la inteligencia artificial?

¿Cómo funcionan los autos autónomos de Google?

¿Se automatizará la ciencia de datos en un futuro cercano?

¿Cuál es el papel de la inteligencia artificial (IA) en robótica?

¿Cómo logran las redes neuronales para imágenes / caras la invariancia traslacional ('colapsar' la misma cara en diferentes regiones de la imagen en la misma salida)?

¿Qué métodos efectivos automatizados / arquitectónicos existen para detectar trolls en línea?

¿Qué tan similar / diferente es la oferta de edX Inteligencia Artificial CS 188 en comparación con la oferta en el campus de UC Berkeley? ¿Es todo el curso o solo una parte de él en edX?

¿Cómo afectarán los avances en inteligencia artificial a la industria de los videojuegos?

¿Cuáles son los componentes de hardware y software necesarios para construir un sistema operativo como el que se muestra en la película Her (2013)?

Chomba Bupe, ¿cómo te interesaste en el aprendizaje automático?

¿Es probable que ocurra la singularidad tecnológica?

¿Por qué existe el temor de dominación de robots / IA cuando se pueden incorporar múltiples niveles de interruptores de muerte?

¿Cuáles son los mejores libros de texto de IA / aprendizaje profundo que puedo obtener en el mercado?

¿Cómo enseña IBM el idioma español Watson?

¿Cómo debo seguir una carrera relacionada con la inteligencia artificial en la India?