¿Cómo lidian las personas con visión artificial con el sobreajuste?

Héctor tenía razón, pero aquí hay algunos enfoques adicionales:

1. Use tres niveles de validación cruzada: entrenar / probar / sintonizar

2. Utilice la selección de características: reducir el tamaño de su espacio de características ayudará si el clasificador está siendo confundido por características ruidosas (suponiendo que las características que elija mantener sean buenas para discriminar entre sus clases)

¿Preferiría que una novela sobre la era medieval fuera históricamente precisa y llena de conceptos verificables o fácilmente legible pero de hecho escasa?
Aprendizaje profundo: ¿Una versión suave de unidades lineales rectificadas funciona mejor o peor que una no lineal?
¿Puede la red neuronal convolucional reconocer un objeto en cualquier condición?
Las entidades biológicas inconscientes que simplemente reaccionan automáticamente a su entorno han evolucionado y se han vuelto autoconscientes. ¿Qué impide que AI lo haga?
¿Las redes de cápsulas reemplazarán a las redes neuronales?

3. Dependiendo del algoritmo que esté utilizando, optimice sus parámetros (también conocido como SVM – costo, gamma)

4. Aumente el tamaño de su conjunto de datos de entrenamiento. En la visión por computadora, esto puede ser un problema porque las imágenes son grandes y, dependiendo del algoritmo que esté utilizando, es posible que la memoria lo limite.

5. Asegúrese de tener una gran cantidad de ejemplos positivos en su conjunto de datos de entrenamiento

6. Normalice sus datos: por ejemplo, si está utilizando un núcleo lineal con una máquina de vectores de soporte, la normalización de sus datos a la longitud 1 tiene implicaciones geométricas que hacen que el problema sea más fácil de resolver (los valores del núcleo representan el coseno de los ángulos entre la entidad vectores). [1]

[1] http://www-connex.lip6.fr/~amini…

¿Cuál es la mejor manera de aprender Python si mi objetivo es usarlo específicamente para el aprendizaje automático?

¿Cuáles son los temas que debo saber antes de comenzar el aprendizaje automático?

¿Cómo explicaría la desigualdad de Hoeffding y, como consecuencia natural, la dimensión Vapnik Chervonenkis a un niño de diez años?

¿Es una red neuronal completamente conectada igual a una red neuronal de retroalimentación?

¿Cómo va a explicar la paravirtualización a un laico?

¿Qué nuevas empresas están buscando actualmente científicos de datos?

Los datos del mundo real suelen ser tan ruidosos que si su conjunto de entrenamiento es lo suficientemente grande, el sobreajuste no parece ser un problema. Además, los algoritmos de entrenamiento generalmente tienen un término de regularización que penaliza el sobreajuste. Finalmente, estos generalmente se entrenan junto con un conjunto de prueba de resistencia y las personas generalmente eligen al mejor intérprete en el conjunto de prueba, por lo que un resultado intermedio de que los sobreajustes tendrían poca memoria en el conjunto de prueba.

Héctor Yee

More Interesting

¿Cómo utiliza Foursquare el aprendizaje automático para mejorar el producto?

El reciclaje de residuos de construcción urbana necesita usar qué máquina.

¿Cómo puedo aprender a realizar simulaciones de dinámica molecular? ¿Cuáles son algunas buenas fuentes para aprender sobre este campo?

¿Qué es el aprendizaje activo?

¿Cuál es una explicación intuitiva del método de optimización llamado Hessian-free Optimizer (HF) para redes neuronales?

¿Cómo escribe Google las pruebas para su algoritmo de búsqueda para que sepan que no lo rompieron al hacer cambios?

¿Por qué debería usar TensorFlow sobre NumPy o scikit-learn para construir redes neuronales (excepto para CPU o GPU)?

¿Por qué se usan CNN para PNL?

¿Por qué necesitamos Python y Java para el aprendizaje automático mientras tenemos R?

¿Cuáles son algunas bibliotecas de software para el aprendizaje a gran escala?