¿Pueden Kmeans y el algoritmo DBSCAN dar el mismo resultado para un conjunto de datos en particular?

Claro, un ejemplo trivial es un solo punto; de lo contrario, considere dos conjuntos (finitos) incrustados en algún espacio métrico cuyo diámetro (la distancia más grande entre cualquiera de los dos puntos) es mucho menor que la distancia más corta que separa los conjuntos (la distancia más pequeña [matemática] d (x, y) [/ matemática ] entre los puntos [matemática] x \ en S_1, y \ en S_2 [/ matemática]). Con alta probabilidad, ambos algoritmos tendrán el mismo resultado.

(Aquí hay una imagen de muestra de lo que quiero decir)

En este caso, ambos algoritmos deberían devolver el mismo resultado. En términos más generales, deberían devolver los mismos grupos (hasta cierta permutación) si los grupos tienen la misma densidad y son ‘casi’ (en algún sentido estadístico) separables por algún diagrama de voronoi (k-medias es, en este sentido, más restrictivo que DBSCAN).

Related Content

Cómo integrar el marco Tensorflow con XGBoost

Cómo obtener colores 'visualmente distinguibles' de las imágenes

Cómo pensar que el 'problema de aprendizaje One Shot' se resolverá con Deep Neural Network

Mientras aprende el aprendizaje profundo, ¿cuál es la mejor manera de pasar de una etapa de principiante a una etapa avanzada?

¿Cómo aprendo el aprendizaje automático y dónde puedo practicarlo?

¿Puede una máquina artificialmente inteligente sentir emoción sin mostrarla como pocos humanos lo hacen?

¿Quién hace los virus informáticos?

Eso es posible.

Pero tenga en cuenta que Kmeans puede darle diferentes respuestas para diferentes carreras. DBSCAN por otro lado es determinista.

Peng Du

More Interesting

¿Cómo funciona el texto predictivo?

Quiero pasar el tiempo dado para el proyecto del último año para aprender ML. ¿Cómo empiezo?

¿Cómo se puede imputar valores perdidos en SAS?

¿En qué debería concentrarme después de aprender el aprendizaje automático si no estoy interesado en el aprendizaje profundo?

¿Hay casos en que las ideas del aprendizaje profundo hayan sido útiles para problemas de datos pequeños?

¿DevOps mejora las operaciones de ciencia de datos y aprendizaje automático?

¿Cuál es la diferencia entre la recuperación de información normal y los sistemas de recomendación?

¿Cómo asociaría un producto con una categoría y subcategoría basada en la descripción de texto del producto?

¿Puedo usar word2vec para entrenar un clasificador de aprendizaje automático?

¿Cuáles son las características únicas de una red neuronal en comparación con otras técnicas de aprendizaje automático?

¿Cuál es su proceso para diseñar funciones de pérdida para problemas de Machine Learning?

¿Cuáles son las principales empresas que trabajan en Deep Reinforcement Learning aparte de DeepMind y OpenAI?

¿Qué libro de los dos es más completo para PNL: el de Jurafsky o el de Manning?

En PCA, ¿cuáles son los roles y los significados físicos de las caras propias?

¿Cuáles son las relaciones entre el aprendizaje de representación y los modelos generativos en el campo de aprendizaje profundo?

Web Analytics