¿Qué tipo de algoritmo de Machine Learning usarías para segmentar a tus clientes en múltiples grupos?

Al igual que con muchos problemas de aprendizaje automático, es difícil responder sin mirar los datos, e incluso entonces, rara vez hay una solución única para todos.

K-means, como se menciona en la otra respuesta, es de hecho uno de los algoritmos de agrupamiento más comunes. Sin embargo, adolece de muchas fallas y no hay garantías de que el clúster que obtendrá le sea de utilidad. Por supuesto, sus datos deben ser probablemente normalizados, para que todas las variables tengan una ponderación similar. Incluso entonces, k-means usa inicialización aleatoria, por lo que diferentes ejecuciones pueden dar como resultado diferentes resultados (si no lo hace, eso también significa que su clúster es algo estable, lo cual es bueno). Si te quedas con k-means, prueba con diferentes semillas de inicialización y ve qué se adapta mejor a tus problemas. También puede considerar la agrupación jerárquica o DBSCAN / OPTICS si tiene datos geográficos. Echa un vistazo a esta página wiki para comenzar.

Sin embargo, el enfoque que probablemente tomaría es etiquetar parte de los datos. Eso significa, predefinir sus grupos (por ejemplo, “pagador alto”, “leal”, “podría irse”, o no sé qué corresponde a su problema) y asignar uno de estos grupos a todos los clientes de su conjunto de entrenamiento. Luego puede entrenar un algoritmo de aprendizaje supervisado, lo que desee (pista: esos días se trata de árboles impulsados por gradiente), y usarlo en el resto de sus datos (para validar y luego aplicar). Por supuesto, es más trabajo y requiere que conozca cierta información sobre sus clientes, pero será mucho más predecible y más probable que lo ayude en su problema.

AlgoritmosAprendizaje automáticoClasificación

Related Content

¿Los algoritmos están optimizados para discos duros normales * no * optimizados para unidades de estado sólido?

¿Podemos usar una cola en quicksort en C?

¿Qué algoritmos usa Bing para clasificar los resultados de búsqueda? ¿La patente de Google les impide usar PageRank? Análisis de enlaces en general?

¿Son necesarios los algoritmos y las clases de estructura de datos para hacer una clase de desarrollo de aplicaciones móviles?

Necesito saber cómo describir el cálculo del PageRank de punto fijo. ¿Alguien sabe algo al respecto?

¿Es posible hacer un programa algorítmico de intercambio oscilante?

¿Cómo funciona la regresión lineal múltiple en variables categóricas?

Agrupación Más específicamente, k-Means Clustering.

Es un algoritmo simple pero muy útil. Todo lo que necesita hacer es especificar un número de grupos, o grupos, k. Luego, el algoritmo agrupa a todos sus clientes en k grupos para que los miembros de cada grupo estén lo más cerca posible de los otros miembros del mismo grupo.

El desafío en el análisis de agrupamiento no es la parte del aprendizaje automático en sí. El desafío es interpretar los resultados y comprender lo que representan los grupos. Además, es posible que deba jugar con diferentes valores de k para ver qué produce los resultados más útiles.

Gerome Pistre

More Interesting

Cómo inicializar una matriz

Cómo insertar un nuevo nodo en un árbol binario (no buscar árbol binario)

¿Qué es el algoritmo ABC?

¿Qué software / algoritmo se usa para hacer partidos de la liga de fútbol o cualquier evento deportivo enorme?

En el software de servidor web, ¿alguna vez se prefiere la ordenación en lugar de la clasificación rápida, porque un ataque DoS podría desencadenar el comportamiento de clasificación rápida en el peor de los casos?

¿Por qué BFS no puede resolver todos los problemas de ruta más corta de una sola fuente?

Cómo explicar la complejidad algorítmica a la abuela en términos simples

¿Algún algoritmo de aprendizaje profundo quedará obsoleto algún día con los algoritmos tradicionales? ¿O los algoritmos de aprendizaje profundo solo son adecuados para problemas específicos?

Cómo ordenar la matriz de una estructura utilizando solo uno de sus miembros de datos en c ++ (STL)

¿Los árboles binarios / árboles de búsqueda binaria se usan realmente en la práctica o se usan principalmente con fines didácticos?

¿Mejorará la velocidad de búsqueda y clasificación de algoritmos o hemos alcanzado el límite?

¿Qué es el ordenamiento binario?

¿Qué representa un peso en los bordes en un gráfico ponderado en la teoría de gráficos?

¿Se pueden implementar dfs sin recursividad?

¿Cómo se crean las redes publicitarias?

Web Analytics