Cómo construir un motor de recomendación en tiempo real

El motor de recomendaciones se puede supervisar y también sin supervisión, por lo que depende de su caso, y una buena API y arquitectura es clave para el mantenimiento y la escalabilidad.

  1. Recolectar datos
  2. Hacer una lista de limitación de datos
  3. Limpiar datos (desduplicación, corrección de errores, filtrado, muestreo)
  4. Hacer extracción de características (Normalización, Escalado (como [0,1]), Extracción de características de marca de tiempo o texto)
  5. Elija un modelo (el filtrado a priori y colaborativo es el más popular)
  6. Entrena y prueba si usas aprendizaje supervisado
  7. Evalúe su modelo, utilice la memoria y la métrica de precisión
  8. Realice validación cruzada, ajuste de hiperparámetros y método de conjunto si utiliza aprendizaje supervisado
  9. Implemente en producción, puede usar Flask API (si prefiere código abierto), Amazon API, etc. Aquí hay varias menciones
    1. Indique que una API permite que funciones arbitrarias se especifiquen como tareas ejecutables de forma remota, con dependencias entre ellas.
    2. La creación de tareas no es de bloqueo. Cuando se crea una tarea, se devuelve de inmediato un futuro que representa el valor de retorno eventual de la tarea, y la tarea se ejecuta de forma asincrónica. La invocación de funciones arbitrarias se puede designar como una tarea remota, lo que permite admitir núcleos de ejecución arbitrarios. Los argumentos de la tarea pueden ser valores regulares o futuros.
    3. El método de espera toma una lista de futuros, un tiempo de espera y una serie de valores. Devuelve el subconjunto de futuros cuyas tareas se han completado cuando se produce el tiempo de espera o se ha completado el número solicitado.
  10. El planificador híbrido y un plano de control centralizado es mi recomendación en esta arquitectura.

More Interesting

¿Qué conjuntos de datos se utilizan como puntos de referencia en los métodos de transcripción de voz / voz y qué métodos tienen los mejores resultados actuales?

¿Cuánto aprendizaje automático aprendería al completar el curso Andrew Ng (el de Coursera), en una escala de 100?

¿Por qué son escasos los autoencoders escasos?

¿Cuáles son las diferencias entre el enfoque basado en reglas y el enfoque de aprendizaje automático en el análisis de sentimientos?

¿Puedo tomar el curso de aprendizaje automático de Andrew Ng siendo un estudiante de secundaria con algo de experiencia en programación y sin conocimientos avanzados de matemáticas?

¿Cuáles son algunos avances interesantes sobre las matemáticas del aprendizaje profundo?

¿Cuál ha sido la experiencia de la gente con RapidMiner?

¿Cuál es el método más popular para clasificar los temas de los artículos de noticias?

¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?

¿Cuáles son algunas de las investigaciones más alucinantes jamás realizadas o en curso en el aprendizaje automático estadístico?

¿Cuáles son algunos algoritmos para resolver el problema de los bandidos multi-armados?

OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?

Como dicen, cada función posible se puede modelar con una percepción de 2 capas, en teoría, ¿se puede modelar una función del universo en una red neuronal con 2 o 3 capas de profundidad?

¿Qué puedo hacer con una base de datos de 800 GB de un sitio de reserva de boletos en línea? (Películas, obras de teatro, algunos eventos deportivos)?

¿Qué algoritmos son los mejores para el filtrado de spam? ¿Cómo deberían implementarse?