¿Cómo agrupamos el comportamiento de navegación de usuarios similares y seleccionamos características separables?

Hola y gracias por la pregunta

Tengo que ser sincero, nunca he trabajado en un problema similar, así que no tome mi respuesta como crédito.

De todos modos, tal vez comenzaría normalizando los datos de cada usuario por sus vistas totales. Y luego usaría algún tipo de algoritmo de agrupamiento, k-means, SOM o bosque aleatorio en su modo no supervisado.

¿Cómo se puede aplicar el aprendizaje profundo a los sistemas de recomendación en el mercado de valores?
¿Por qué la distribución previa no tiene mucho impacto en la distribución posterior cuando tenemos muchos datos?
¿Es necesario aprender Python para seguir la especialización en cursos de Machine Learning, de Coursera?
¿Cuándo debo usar un autoencoder frente a un RBM?
¿Cómo puedo entrenar a un clasificador de imágenes para detectar mi propia cara de un conjunto de datos de 16,000 imágenes?

Considerando las características separables, no veo características en la matriz. Veo la cantidad de visitas de un usuario en particular a una página, pero no veo las características que caracterizan a un usuario y / o una página. Por lo tanto, me resulta difícil ver cómo se pueden seleccionar las funciones. Otro punto es cuando usa la palabra “separable”. Esto generalmente supone la presencia de clases, que no puedo ver en esa matriz.

Puede estar completamente fuera. Como dije, nunca antes había trabajado en un problema así.

Espero eso ayude.

Related Content

En optimización, ¿cuáles son algunos ejemplos geniales de reformulación?

Cómo demostrar que minimizar la suma residual de cuadrados es equivalente a maximizar la función de log-verosimilitud

Para aquellos que han usado redes neuronales u otro aprendizaje automático, ¿cuánto tiempo de procesamiento les ha llevado entrenarlos y qué tan grande fue el conjunto de datos?

Aprendizaje automático: ¿cuándo debo aplicar la normalización / estandarización de datos?

¿Cómo es la aplicación K-Means de maximización de expectativas en Naive Bayes?

¿Cuál es la tecnología más nueva en la fabricación de divisas?

¿Por qué el libro de Murphy dice en el clasificador generativo que no tenemos que volver a entrenar el modelo cuando agregamos más clases?

A2A

Daré un par de consejos basados en mi experiencia aplicando el aprendizaje automático a conjuntos de datos. Tengo la mayor experiencia con datos genómicos, pero los conceptos estadísticos son generales y tenía un conjunto de datos muy similar.

Parece que este conjunto de datos no está etiquetado, por lo que su objetivo es la agrupación no supervisada. Yo mismo no he realizado la agrupación sin supervisión, pero sé que la agrupación k-means es un ejemplo de agrupación no supervisada, y hay otros métodos que puede consultar. K-means básicamente creará grupos en el conjunto de datos basados en distancias euclidianas.

También debe considerar hacer un análisis de componentes principales (PCA) en el conjunto de datos. Básicamente, esto transformará sus datos para que se proyecten en los vectores que tienen la mayor variación. Puede ser útil hacer PCA primero y luego k-significa agrupamiento en el conjunto de datos transformado (aunque existen escollos sutiles para PCA).

Algo más que tal vez desee considerar son los sistemas de recomendación. Básicamente, compañías como Netflix y Amazon tienen buenas técnicas para recomendar películas / libros / aplicaciones / etc. a otras personas en función de su enorme base de datos de clientes. Recuerdo haber escuchado una presentación técnica sobre ellos, pero no recuerdo mucho para dar un ejemplo. Sin embargo, recuerdo que es intrigante.

Todos estos métodos requieren una comprensión de las matemáticas y las estadísticas. Una Introducción al aprendizaje estadístico es un PDF gratuito que fue muy útil para mí, y tiene una sección sobre agrupación no supervisada.

¡Espero que esto ayude!

Actualización: la técnica de recomendación que debe considerar se llama filtrado colaborativo. Puede o no ser útil

Joel Silva

More Interesting

Si enseñamos a un programa de aprendizaje automático cómo hacer operaciones aritméticas, ¿sería más rápido o más lento que los humanos?

¿Qué es la transformación logarítmica en el análisis de regresión?

¿De qué sirven los algoritmos de aprendizaje si no podemos pensar por nuestra cuenta?

¿Cómo puede un programa determinar rápidamente si un tweet es negativo o positivo?

¿Por qué el aumento de gradiente funciona tan bien para tantos problemas de Kaggle?

¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?

¿Cómo funciona el modelo de atención con LSTM?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

¿Vale la pena probar PCA en sus datos antes de alimentar a SVM?

¿Cómo se aplica el aprendizaje profundo en la industria?

¿Se pueden combinar blockchain y machine learning?

¿Cuál sería el mejor desafío de Kaggle para mí como entusiasta del aprendizaje automático de nivel intermedio?

¿Qué son los núcleos de difusión?

Cómo construir sobre modelos de red profunda de detección de objetos pre-entrenados (YOLO) para detectar nuevas clases

Web Analytics