¿Cuál es la mejor manera de probar los motores de recomendación en los datos históricos del usuario?

Marque mis palabras: no hay una sola métrica que lo ayude hasta que realice su prueba A / B dividida.

Está implementando su recomendación y seguramente tiene algunas métricas que desea observar, como el número de compras, los ingresos totales, los anuncios en los que se hizo clic, lo que sea. Lo único que le dirá si el recomendante es bueno o no es ver cómo cambian las métricas que le importan a medida que implementa diferentes recomendadores.

Es mi opinión que no hay forma de probar un sistema de recomendación porque son bestias muy diferentes en el ámbito del aprendizaje automático.

Considere, por ejemplo, las compras realizadas por sus usuarios, puede ocultar algunas de estas compras y usarlas para probar su algoritmo. Si un recomendante predice algo totalmente diferente a los elementos que escondió, entonces no tiene forma de saber si ese recomendante es bueno o malo, la única forma de saberlo sería ver si el usuario compra los elementos recomendados.

La cuestión es que un recomendante puede tener razón al recomendar algo que el usuario nunca compró porque esa es precisamente la idea de un sistema de recomendación, por lo que de alguna manera los recomendadores no se pueden probar dividiendo el conjunto de entrenamiento en trenes y conjuntos de prueba a menos que sepa que el tren set tiene TODOS los elementos que le gustaron al usuario y no hay nada fuera de esos elementos que le gusten al usuario. Y ese nunca es el caso.

¡Todas las métricas están mal o le devolvemos su dinero!

Toda la información que busca se puede encontrar aquí.

Herlocker, JL, Konstan, JA, Terveen, LG y Riedl, JT (2004). Evaluación de sistemas de recomendación de filtrado colaborativo. Transacciones ACM en Sistemas de Información (TOIS) , 22 (1), 5-53.

Por lo general, se mantiene un pequeño porcentaje del conjunto de datos (¿20%?) Para entrenamiento y el resto para pruebas. Las configuraciones de evaluación más avanzadas utilizan validaciones cruzadas.

Existen bibliotecas de código abierto, como Apache Mahout o Recomendaciones101, que puede usar para ejecutar pruebas.

Suponiendo que los usuarios suelen mirar las 5–10 recomendaciones principales, entonces lo que está buscando es alta precisión.

Lea el documento e intente ejecutar las pruebas usted mismo, de lo contrario no podrá aprender.

More Interesting

¿Cómo un nuevo graduado que no es CS ingresa a la ciencia de datos?

¿Necesito saber / aprender Machine Learning si quiero seguir una carrera en Data Analytics?

¿Cuáles son algunos de los mejores recursos / estudios de caso sobre análisis de datos / prácticas de segmentación de clientes / métricas en las startups?

Cuando trabajamos en aprendizaje automático en big data, ¿podemos usar la biblioteca scikit-learn con MLlib?

¿Cuáles son las 25 principales compañías en ciencia de datos?

¿Es Scala una mejor opción que Python para Apache Spark en términos de rendimiento, curva de aprendizaje y facilidad de uso?

Cómo saber cuántos datos debo entrenar mi algoritmo de Machine Learning y cuánto debo usar para garantizar el principio de generalización

¿Qué curso de ciencia de datos es mejor para un principiante, el nanodegree analista de datos de Udacity o el curso de ciencia de datos?

¿AI y Data Science cambiarán la cara de los negocios? Si es así, ¿cómo será su futuro?

¿Qué debería estudiar Bsc para convertirme en un científico de datos?

¿Qué tan bueno es Master en ciencia de datos o analista de datos?

¿Por qué MSFT necesita un jefe de ciencia de datos cuando tiene todos los investigadores de aprendizaje automático en el mundo?

¿Qué consejo le darías a un aspirante a científico de datos que haga en estas vacaciones?

¿Qué es Big Data y cómo trabajas con él?

¿Cuál es la mejor institución para aprender un curso de análisis de negocios / ciencia de datos en Hyderabad?