Te sugiero que realices un enfoque de aprendizaje semi supervisado en lugar de uno puramente sin supervisión. Realizar un aprendizaje no supervisado antes del aprendizaje supervisado puede conducir a mejores resultados, ya sea en términos de una convergencia más rápida o mejores predicciones o ambas.
Un ejemplo de este enfoque es usar una Red de base radial en la que inicializar los centros en función de k significa agrupamiento y luego usar redes RBF para las predicciones. Tal enfoque asegura una convergencia más rápida y un mejor poder predictivo.
Otro ejemplo sería RBM. Técnicas como las máquinas de Boltzmann restringidas pueden dar buenas aproximaciones iniciales de los pesos para los modelos de aprendizaje profundo . El RBM es un aprendizaje no supervisado, pero puede ayudarnos a mejorar los problemas que enfrentamos mientras entrenamos una red neuronal profunda.
- ¿Qué medida de evaluación fuera de línea para los sistemas de recomendación se correlaciona mejor con los resultados de la prueba AB en línea?
- ¿Cuáles son las opiniones de Yoshua Bengio sobre Kaggle y el aprendizaje automático competitivo en general?
- Cómo usar mel-spectrogram como entrada de una CNN
- ¿Cuál es la mejor manera de distribuir el descenso de gradiente?
- Dado el mismo tamaño de lote, ¿hay algún beneficio en transferir la capacitación CNN de una sola GPU a múltiples GPU (para un tamaño de lote de 128 en 4 GPU, cada GPU procesará 32 muestras)?