¿Puedo usar la agrupación (k-means, etc.) en un gran conjunto de datos para automatizar el proceso de búsqueda de similitudes y hacer recomendaciones?

La agrupación no está supervisada. Es decir, encuentra elementos similares, basados ​​en elecciones específicas para:

  1. Representación vectorial de cada artículo.
  2. Medida de similitud entre vectores.
  3. Algoritmo de agrupamiento.

Además, depende de la distribución del conjunto de datos. Supongamos que ejecuta un algoritmo de agrupamiento. ¿El resultado se ajusta a algo que un experto humano reconocería? A veces lo hace. ¿Es útil para una empresa / necesidad de investigación (por ejemplo, construir un recomendador)? A veces lo es.

Debe verificar el resultado de la agrupación para ver si tiene sentido. En algunos casos, puede ver cada grupo, nombrarlo como una categoría y vivir felices para siempre. En otros casos, puede obtener el Emporio Celestial de Conocimiento Benevolente. O peor: grupos que parecen subconjuntos aleatorios. La agrupación no es una bala de plata. Buena suerte y cuidate.

More Interesting

¿Cómo puedo probar el método de regresión lineal?

¿Cómo podemos usar la cadena de Monte Carlo Markov y bayesiano no paramétrico para la reducción de dimensionalidad?

¿Cuál es el beneficio de usar métodos de detección de comunidad gráfica sobre los enfoques de agrupación de datos y aprendizaje automático?

Cómo numerar los clústeres en la agrupación jerárquica de documentos en Python

¿Alguna vez usamos la estimación de máxima verosimilitud?

¿Está bien usar software como scikit learn, tensorflow, keras y desarrollar aplicaciones sin profundizar en los conceptos matemáticos?

Procesamiento del lenguaje natural: ¿Hay alguna manera de medir la "informatividad" de una oración en un documento?

¿Qué piensan los científicos de los expertos en SEO?

¿Cuáles son las desventajas de [math] abs (x) [/ math] como función de activación en redes neuronales?

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

¿Cómo funcionan los bots de chat desde una perspectiva de Machine Learning?

¿Puedo usar word2vec para hacer el análisis de co-palabras?

¿Qué temas de matemáticas recomienda Conner Davis a alguien interesado en el aprendizaje automático teórico para aprender en su tiempo libre?

¿Cuáles son las instituciones en India que ofrecen cursos de aprendizaje automático y minería de datos y cuáles son las áreas posteriores?

Cómo optimizar el ANFIS de MATLAB usando el método de descenso de gradiente conjugado