Cómo implementar clustering basado en densidad

Creo que puedes hacer DBSCAN.

Según su descripción, sus datos son 2D, por lo que la distancia euclidiana está bien.

Los parámetros que ajusta son epsilon y minPts, que son el umbral de distancia para encontrar vecinos y el número mínimo de vecinos para dar cuenta de un clúster, respectivamente.

Creo que dado que los datos son tan escasos, la matriz de distancia no es una buena idea, puede usar una “lista ordenada vinculada” para representar las distancias, por lo tanto, la complejidad del tiempo para encontrar vecinos será mucho menor (de N a m para cada nodo donde N es el número de todos los puntos ym es el número de vecinos dentro de épsilon).

Por ejemplo, una lista vinculada ordenada se ve así:

1: (293: 0.003) -> (3323: 0.005) -> (235049: 0.008) …

2: (53453: 0.005) -> (676456: 0.006) -> (342342: 0.007) …

donde los enteros son índices de puntos y los flotadores son distancias.

El ruido es totalmente bueno, DBSCAN maneja bien el ruido.

More Interesting

Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?

¿Será posible predecir cuándo y qué producto comprará alguien con una precisión útil?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

¿Dónde puedo encontrar el conjunto de datos para un sistema de recomendación?

¿Qué algoritmo puedo implementar para hacer una reducción de dimensión con restricción no negativa? (PCA se asignará al espacio negativo)

¿Qué tan buena es la Universidad de Edimburgo, en comparación con la CMU para estudios de posgrado e investigación en aprendizaje automático y neurociencia computacional?

Minería de datos: utilizando el análisis de la cesta de la compra para el pronóstico de ventas, ¿cuál es el mejor algoritmo?

¿Cómo se eligieron las palabras sesgo y varianza (Machine Learning)?

¿Qué distingue una capa de una red neuronal de otras capas?

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

Visión por computadora: ¿Cuáles son los problemas abiertos para la recuperación de imágenes?

¿Qué IIT en India tiene el mejor programa de CS para el aprendizaje automático?

¿Qué debo tomar Machine Learning o realidad aumentada?

¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?