El motor de recomendaciones se puede supervisar y también sin supervisión, por lo que depende de su caso, y una buena API y arquitectura es clave para el mantenimiento y la escalabilidad.
- Recolectar datos
- Hacer una lista de limitación de datos
- Limpiar datos (desduplicación, corrección de errores, filtrado, muestreo)
- Hacer extracción de características (Normalización, Escalado (como [0,1]), Extracción de características de marca de tiempo o texto)
- Elija un modelo (el filtrado a priori y colaborativo es el más popular)
- Entrena y prueba si usas aprendizaje supervisado
- Evalúe su modelo, utilice la memoria y la métrica de precisión
- Realice validación cruzada, ajuste de hiperparámetros y método de conjunto si utiliza aprendizaje supervisado
- Implemente en producción, puede usar Flask API (si prefiere código abierto), Amazon API, etc. Aquí hay varias menciones
- Indique que una API permite que funciones arbitrarias se especifiquen como tareas ejecutables de forma remota, con dependencias entre ellas.
- La creación de tareas no es de bloqueo. Cuando se crea una tarea, se devuelve de inmediato un futuro que representa el valor de retorno eventual de la tarea, y la tarea se ejecuta de forma asincrónica. La invocación de funciones arbitrarias se puede designar como una tarea remota, lo que permite admitir núcleos de ejecución arbitrarios. Los argumentos de la tarea pueden ser valores regulares o futuros.
- El método de espera toma una lista de futuros, un tiempo de espera y una serie de valores. Devuelve el subconjunto de futuros cuyas tareas se han completado cuando se produce el tiempo de espera o se ha completado el número solicitado.
- El planificador híbrido y un plano de control centralizado es mi recomendación en esta arquitectura.