Blanquear sus datos siempre es una buena idea. Más allá de eso, sin embargo, es probable que el problema radique en la configuración de parámetros que ha elegido para su autoencoder.
Esta es una crítica común de los algoritmos de aprendizaje profundo existentes: dependen de la configuración de varios parámetros de aprendizaje de formas complejas y no lineales. Seleccionar buenos parámetros es crítico para el rendimiento del algoritmo de aprendizaje, pero es en gran medida un arte negro.
Su mejor opción es elegir un montón de configuraciones para cada parámetro y hacer una búsqueda en la cuadrícula. (Es decir, entrene un modelo para cada combinación de configuraciones). Otro enfoque común es muestrear al azar en ese espacio de parámetros en lugar de entrenar en toda la cuadrícula.
- ¿Cuáles son los proyectos de aprendizaje automático más populares en Github?
- ¿Qué proyectos principales puedo hacer en R después de aprender minería de datos, análisis de sentimientos de limpieza, regresión y técnicas de agrupamiento?
- Cómo modelar el problema de un número de generación matka usando machine learning
- ¿Cuándo debo usar la agrupación antes de ejecutar un modelo de regresión logística?
- ¿El uso de memoria aumenta a medida que aumentan los datos de entrenamiento en redes neuronales profundas?
Comenzaría con la escasez y luego comenzaría a jugar con todos los demás parámetros.