¿Qué hace la capa en línea y la capa de línea cercana del sistema Netflix para recomendación?

Tiene razón en que ejecutamos los algoritmos de aprendizaje por lotes fuera de línea y que producen algunos de los parámetros. Sin embargo, utilizamos el sistema nearline y en línea para los parámetros que queremos mantener actualizados y receptivos a los comentarios de los miembros. Sabemos que es importante que el tiempo entre una acción y una actualización de las recomendaciones con respecto a esa acción no sea demasiado largo; de lo contrario, las recomendaciones parecen obsoletas y no incorporan la información más reciente. Por lo tanto, generalmente solo publicamos parámetros orientados al video desde la capa fuera de línea y luego calculamos los parámetros orientados a los miembros en la línea cercana y las capas en línea para mantener esos parámetros actualizados.

La capa nearline actualiza las recomendaciones en respuesta a eventos específicos de miembros. Estos eventos pueden originarse de interacciones tales como jugadas que comienzan o se detienen, agregan / eliminan videos en su “Mi lista”, calificaciones, creación de perfil, etc. Necesitamos ejecutar algoritmos en línea cercana para actualizar los parámetros del modelo que dependen de los miembros para hacer uso de los datos más recientes. Por ejemplo, los factores latentes para un miembro en un algoritmo de factorización matricial. Esto puede implicar ejecutar un algoritmo de aprendizaje para resolver solo estos parámetros, que a menudo se denomina “plegado”.

Estos eventos de línea cercana pueden desencadenar otros eventos de tener un conjunto actualizado de recomendaciones de un algoritmo, que activa un algoritmo de notificación de eventos que depende de esa salida para actualizar. Por ejemplo, si tenemos una calificación, el algoritmo de predicción de calificación puede recibir el evento, calcular nuevas predicciones de calificación y luego notificar a los algoritmos de clasificación que deben actualizarse para las nuevas predicciones, que pueden usar como una característica. Nearline también se puede usar para algoritmos de aprendizaje en línea, ya que recibe eventos de forma asincrónica.

La capa en línea se puede utilizar para diferentes propósitos, como ejecutar algoritmos cuyas características o modelos cambian en tiempo real, por ejemplo, para tener en cuenta las últimas tendencias o contexto (en particular, el tiempo). También se puede usar para filtrar o actualizar las recomendaciones calculadas previamente de las capas nearline o offline, por ejemplo, cuando los miembros cambian sus niveles de madurez o los videos entran y salen del catálogo.