Este es un enfoque genérico y práctico que se puede aplicar a la mayoría de los problemas de aprendizaje automático:
- Clasifica el problema . Este es un proceso de dos pasos.
- Categorizar por entrada . Si ha etiquetado los datos, es un problema de aprendizaje supervisado . Si tiene datos sin etiquetar y desea encontrar la estructura, es un problema de aprendizaje sin supervisión . Si desea optimizar una función objetivo interactuando con un entorno, es un problema de aprendizaje de refuerzo .
- Categorizar por salida . Si el resultado de su modelo es un número, es un problema de regresión . Si el resultado de su modelo es una clase, es un problema de clasificación . Si la salida de su modelo es un conjunto de grupos de entrada, es un problema de agrupamiento .
- Encuentra los algoritmos disponibles . Ahora que ha categorizado el problema, puede identificar los algoritmos que son aplicables y prácticos para implementar utilizando las herramientas a su disposición.
- Implementarlos todos . Configure una tubería de aprendizaje automático que compare el rendimiento de cada algoritmo en el conjunto de datos utilizando un conjunto de criterios de evaluación cuidadosamente seleccionados. El mejor se selecciona automáticamente. Puede hacer esto una vez o tener un servicio en ejecución que lo hace a intervalos cuando se agregan nuevos datos.
- Optimizar hiperparámetros (opcional) . Con la validación cruzada, puede ajustar cada algoritmo para optimizar el rendimiento, si el tiempo lo permite. De lo contrario, los hiperparámetros seleccionados manualmente funcionarán lo suficientemente bien en su mayor parte.