¿Cuál es el estado del arte del sistema de recomendación para 2016?

Hay un estado de confusión más que un estado de la técnica 🙂

El problema con los sistemas de recomendación como 2016 es que son sistemas muy complejos, donde predecir las recomendaciones o lo que a los usuarios les puede gustar o no es solo la punta del iceberg. Hay demasiadas cosas para considerar al mismo tiempo, como el problema del arranque en frío, cómo clasificar las recomendaciones, cómo hacer que las recomendaciones sean diversas, cómo mezclar factores sociales, factores temporales, etc.

Si piensas en Netflix, te darás cuenta de que todas esas cosas son críticas, y ahora podemos agregar cómo medir lo que le gusta o no al usuario. ¿Le gusta una serie si solo vio el primer episodio? Tal vez no, tal vez le gustó tanto que lo dejó para pasarlo mejor. En Netflix, las revisiones son muy raras hoy en día, la gente simplemente mira cosas sin tomarse el tiempo de revisarlas, por lo que decidir qué le gusta o no a un usuario es un problema nuevo.

Si me preguntas acerca de un algoritmo para predecir clasificaciones, creo que las máquinas de factorización son lo último en la actualidad, en la mayoría de los concursos de Kaggle en los que estaba involucrado algo así, los FMs funcionaron muy bien.

Pero como dije antes, eso es solo la punta del iceberg, los recomendadores no son como problemas de clasificación o agrupación en los que tienes que elegir un algoritmo para resolver tu problema, un recomendante es un ecosistema completo de algoritmos que trabajan juntos y cómo funcionan juntos es más importante que las piezas individuales.

TL; DR: Es complicado.

Las cosas paramétricas son para las aves cuando tienes muchos datos. Nadie quiere no convergencia en sus subrutinas o distribuciones condicionales sin prueba de relevancia.

Depende de qué tipo de datos está tratando y en qué escala. Técnicamente, la mayoría de los sistemas grandes son híbridos.

Calcular matrices de distancia en este campo es realmente muy, computacionalmente costoso.

¡Tienes que almacenar los elementos de cálculo de usuario * (usuario – 1) varias veces! Eso es nm ^ 2 en almacenamiento [no SVD me, tienes que obtenerlo una vez de todos modos] y operaciones. Una similitud más compleja y más datos significa que ciertas cosas pueden ser imposibles en ciertas ecologías.

No hay mejor, solo relevante para el problema en cuestión y mejor que los otros relevantes según sus criterios.

¿Donde estas buscando? Por ejemplo, ¿solo Google Scholar?

Tienes que saber lo que estás buscando.

Podría ser 1. Métodos CF que mejoran la precisión 2. Sistemas de recomendación móviles 3. Lo que sea,

Busque sobre trabajos de encuestas en buenas bases de datos.

  1. Ciencia directa
  2. Enlace Springer
  3. DBLP

En las referencias de los documentos de la encuesta, encontrará un buen personal para comenzar.

También busque en las actas de la conferencia ACM sobre sistemas de recomendación y publicaciones periódicas, tales como sistemas expertos con aplicaciones, sistemas basados ​​en conocimiento, sistemas de soporte de decisiones, ciencias de la información, transacciones ACM en sistemas de información y transacciones IEEE en conocimiento e ingeniería de datos.