¿Qué es la agrupación?

Imagina que eres un gerente de marketing y tienes un nuevo producto para vender. Estás seguro de que el producto generará grandes ganancias, siempre que se venda a las personas adecuadas. Entonces, ¿cómo puede saber quién es el más adecuado para el producto a partir de la gran base de clientes de su empresa?

Ahí es donde la agrupación viene en tu ayuda.

El agrupamiento ayuda a dividir los datos en varios subconjuntos. Cada uno de estos subconjuntos contiene datos que son similares entre sí. Estos subconjuntos se conocen como grupos.
Ahora que los datos de su base de clientes se dividen en grupos, puede tomar una decisión informada sobre quién cree que es el más adecuado para este producto.

La agrupación, que pertenece a la categoría de aprendizaje automático no supervisado , es uno de los problemas que resuelven los algoritmos de aprendizaje automático.

La agrupación en clúster solo utiliza los datos de entrada para determinar patrones, anomalías o similitudes en sus datos de entrada.

Ahora, un buen algoritmo de agrupamiento tiene como objetivo crear grupos cuyos:

  • la similitud dentro del clúster es alta (los datos que están presentes dentro del clúster son similares entre sí)
  • la similitud entre grupos es menor (cada grupo contiene datos que no son similares al otro)

En campos como compras electrónicas, servicios de salud y financieros, etc., la agrupación se utiliza para el análisis estadístico de datos. Diferentes grupos revelan diferentes detalles sobre los objetos, lo que lo hace diferente de la clasificación o regresión, donde hay un conocimiento previo del resultado.

Un tipo de algoritmo de agrupamiento es el K – significa algoritmo de agrupamiento .
Se utiliza para clasificar o agrupar objetos basados ​​en atributos / características en K número de grupos. K es un número entero positivo. Ayuda a determinar qué objeto dado, en función de su similitud con los objetos con los que se compara.

Espero que esto te ayude a entender. 🙂

Para obtener más información sobre los conceptos de aprendizaje automático, le sugiero que vea este video:

Si está interesado en obtener más información sobre Machine Learning y obtener un conocimiento profundo, consulte nuestra Capacitación de certificación de Machine Learning .

Agrupación si es el proceso de agrupar datos en clases o agrupaciones.
La agrupación se realiza de tal manera que los objetos dentro del mismo grupo son muy similares entre sí, pero son muy diferentes a los objetos en algún otro grupo.

La agrupación es una forma de “aprendizaje por observación”. Es un método de aprendizaje no supervisado y no requiere un conjunto de datos de capacitación para generar un modelo. La agrupación puede conducir al descubrimiento de grupos previamente desconocidos dentro de los datos.

Por ejemplo, en inteligencia empresarial, la agrupación se puede utilizar para organizar una gran cantidad de clientes en grupos, donde los clientes dentro de un grupo comparten características similares.

Diferencia entre clasificación y agrupamiento:

Ejemplo de clasificación : tiene una cesta de frutas y debe dividir las frutas en grupos. Como conocemos los nombres de las frutas, haremos grupos de diferentes frutas. Manzanas en un grupo, mangos en otro grupo, naranjas en otro y plátanos en otro grupo. Entonces, si tiene cuatro frutas diferentes, formará cuatro grupos. Hicimos los grupos sobre la base de los nombres de las frutas. Conocíamos los nombres y, por lo tanto, los usábamos para formar grupos.

Esto se llama Clasificación. Usamos una etiqueta de clase conocida (es decir, el nombre de la fruta) para decidir en qué grupo colocar la fruta. Cuando recogimos una manzana de la canasta, sabíamos que era una manzana, así que la colocamos en el grupo llamado “Manzana”. “.

Ejemplo de agrupamiento : tienes un paquete de cartas. Pero estas tarjetas tienen letras / palabras chinas impresas en ellas. No puede simplemente dividirlos en cuatro grupos de picas, corazones, diamantes y tréboles, ya que no reconoce las letras chinas en ellos. No sabes chino. Entonces, ¿cómo se colocan estas tarjetas en diferentes grupos?

Observas las letras en cada tarjeta. Intenta encontrar las letras que se parecen y coloca estas tarjetas en un grupo. Una vez que encuentre una tarjeta que no se parece a ninguna tarjeta que haya visto hasta ahora, formará un nuevo grupo para esta tarjeta. Eventualmente, habrá formado algunos grupos, en función de cuán similares se veían las letras entre sí.

Esto se llama agrupación. No tenemos ningún conocimiento previo sobre las letras en las tarjetas. Hacemos grupos solo en función de la similitud entre las tarjetas. Las tarjetas en un grupo son lo más similares entre sí como sea posible, mientras que las tarjetas en diferentes grupos son tan diferentes entre sí como sea posible.

Una definición de agrupamiento podría ser “el proceso de organizar objetos en grupos cuyos miembros son similares de alguna manera”.

Aplicaciones:

  • Comercialización : encontrar grupos de clientes con comportamiento similar dada una gran base de datos de datos de clientes que contienen sus propiedades y registros de compras anteriores;
  • Biología : clasificación de plantas y animales dadas sus características;
  • Bibliotecas : pedidos de libros;
  • Seguro : identificación de grupos de titulares de pólizas de seguros de automóviles con un alto costo promedio de reclamo; identificación de fraudes;
  • Planificación urbana : identificación de grupos de casas según su tipo de casa, valor y ubicación geográfica;
  • Estudios de terremotos : agrupamiento de epicentros de terremotos observados para identificar zonas peligrosas;
  • WWW : clasificación de documentos; Agrupación de datos de weblog para descubrir grupos de patrones de acceso similares.

Un grupo de computadoras consiste en un conjunto de computadoras conectadas de manera débil o estrecha que trabajan juntas para que, en muchos aspectos, puedan verse como un solo sistema. A diferencia de las computadoras grid, los grupos de computadoras tienen cada nodo configurado para realizar la misma tarea, controlada y programada por software.

Los componentes de un clúster generalmente están conectados entre sí a través de redes de área local rápidas (“LAN”), y cada nodo (computadora utilizada como servidor) ejecuta su propia instancia de un sistema operativo. En la mayoría de las circunstancias, todos los nodos usan el mismo hardware y el mismo sistema operativo, aunque en algunas configuraciones (es decir, usando Open Source Cluster Application Resources (OSCAR)), se pueden usar diferentes sistemas operativos en cada computadora y / o hardware diferente .

Por lo general, se implementan para mejorar el rendimiento y la disponibilidad en comparación con la de una sola computadora, mientras que, por lo general, son mucho más rentables que las computadoras individuales de velocidad o disponibilidad comparables

En pocas palabras, en el aprendizaje automático La agrupación en clúster es la asignación de un conjunto de observaciones en subconjuntos (llamados grupos ) de modo que las observaciones en el mismo grupo son similares en algún sentido.
La agrupación en clústeres es un método de aprendizaje no supervisado (es una clase de problemas en los que se busca determinar cómo se organizan los datos), y una técnica común para el análisis estadístico de datos que se utiliza en muchos campos.

La agrupación tiene un significado formal.
Un clúster es un grupo de recursos que intentan alcanzar un objetivo común y son conscientes unos de otros.
La agrupación generalmente implica la configuración de los recursos (servidores generalmente) para intercambiar detalles sobre un canal (puerto) en particular y seguir intercambiando sus estados, por lo que el estado de un recurso también se replica en otros lugares.

More Interesting

¿Cuál es la diferencia de enfoque para resolver un desafío de Kaggle y trabajar en un problema de investigación de LA bien definido?

¿Cuáles son algunos buenos recursos para conceptos sobre la identificación de similitudes entre documentos?

¿Existe la idea de utilizar la regularización para evitar el sobreajuste en la econometría, como lo enseñan los economistas?

Deseo obtener un doctorado en Ciencias de la Computación de la India y no de ninguna universidad de los Estados Unidos. ¿Será esta una buena decisión?

¿Qué son los algoritmos recurrentes de redes neuronales?

¿En qué problemas sería buena / mala una máquina neural de Turing?

He realizado el curso de aprendizaje automático de Andrew Ng pero no lo he programado. ¿Debo decir que tengo los conocimientos básicos?

¿Cómo deberíamos comenzar con los conceptos básicos del aprendizaje automático para construir un sistema de recomendación utilizando Python?

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?

¿Puede cualquier máquina interpretar y actuar sobre las respuestas que da Watson en lenguaje humano?

Como estudiante que realiza un curso de algoritmos de aprendizaje automático, ¿en qué debe centrarse el objetivo principal para maximizar el conocimiento aplicable al final del semestre?

Cómo realizar un proyecto de predicción relacionado con la salud utilizando big data y machine learning

¿Existe algún informe publicado que haya aplicado con éxito el aprendizaje profundo para un sistema de recomendación basado en contenido de texto?

¿Cómo se calcula la pérdida WARP de la estadística de orden K para aprender a clasificar las recomendaciones?

Cómo planear mover mi carrera hacia el aprendizaje automático en India