¿Sabes cómo funciona la validación cruzada? Olvídate del aprendizaje profundo por ahora, solo considera un problema genérico de clasificación de aprendizaje automático donde tenemos 2 algoritmos candidatos y queremos saber cuál es mejor.
El enfoque es el siguiente: dividir el conjunto de datos de entrenamiento en K contenedores de aproximadamente el mismo tamaño. Ahora repita K veces: omita un contenedor y entrene ambos algoritmos en todos los demás contenedores. Ahora verifique el rendimiento de ambos modelos entrenados en el contenedor de basura. Repita para cada contenedor. Tome los promedios del rendimiento para todos los contenedores, para cada algoritmo. Se espera que el que tenga un mejor rendimiento sea mejor para este conjunto de datos. Ahora entrénelo en el conjunto de datos completo y ahí está.
Este enfoque es completamente independiente de los algoritmos que elija. Para su problema, tendría una serie de algoritmos (uno para cada número de unidades que desea considerar) en lugar de 2, pero el enfoque aún se mantiene.
- ¿Los centros de datos cambiarán a procesadores personalizados para aplicaciones de aprendizaje automático?
- Como ingeniero de ASIC, ¿cómo debo prepararme para la era del aprendizaje automático?
- ¿Puedo hacer una competencia de kaggle con un archivo csv de entrenamiento de 0.5 Gb en mi computadora de 8 Gb y tener éxito?
- ¿Cuál es un buen algoritmo para la extracción de características y la detección de texto escrito a mano?
- ¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?