¿Cómo lidian las personas con visión artificial con el sobreajuste?

Héctor tenía razón, pero aquí hay algunos enfoques adicionales:

1. Use tres niveles de validación cruzada: entrenar / probar / sintonizar

2. Utilice la selección de características: reducir el tamaño de su espacio de características ayudará si el clasificador está siendo confundido por características ruidosas (suponiendo que las características que elija mantener sean buenas para discriminar entre sus clases)

3. Dependiendo del algoritmo que esté utilizando, optimice sus parámetros (también conocido como SVM – costo, gamma)

4. Aumente el tamaño de su conjunto de datos de entrenamiento. En la visión por computadora, esto puede ser un problema porque las imágenes son grandes y, dependiendo del algoritmo que esté utilizando, es posible que la memoria lo limite.

5. Asegúrese de tener una gran cantidad de ejemplos positivos en su conjunto de datos de entrenamiento

6. Normalice sus datos: por ejemplo, si está utilizando un núcleo lineal con una máquina de vectores de soporte, la normalización de sus datos a la longitud 1 tiene implicaciones geométricas que hacen que el problema sea más fácil de resolver (los valores del núcleo representan el coseno de los ángulos entre la entidad vectores). [1]

[1] http://www-connex.lip6.fr/~amini…

Los datos del mundo real suelen ser tan ruidosos que si su conjunto de entrenamiento es lo suficientemente grande, el sobreajuste no parece ser un problema. Además, los algoritmos de entrenamiento generalmente tienen un término de regularización que penaliza el sobreajuste. Finalmente, estos generalmente se entrenan junto con un conjunto de prueba de resistencia y las personas generalmente eligen al mejor intérprete en el conjunto de prueba, por lo que un resultado intermedio de que los sobreajustes tendrían poca memoria en el conjunto de prueba.