La mayoría de las respuestas sugieren que KNN es una técnica de clasificación y K-means es una técnica de agrupamiento. Agregaré una representación gráfica para que entiendas lo que está sucediendo allí.
En un algoritmo KNN, se da una muestra de prueba como la clase de la mayoría de sus vecinos más cercanos. En palabras simples, si eres similar a tus vecinos, entonces eres uno de ellos. O si la manzana se parece más al plátano, la naranja y el melón (frutas) que el mono, el gato y la rata (animales), entonces lo más probable es que la manzana sea una fruta. A continuación se muestra un ejemplo, tenemos tres clases y el objetivo es encontrar una etiqueta de clase para el ejemplo desconocido [math] x_j [/ math]. En este caso usamos la distancia euclidiana y un valor de k = 5 vecinos. De los 5 vecinos más cercanos, 4 pertenecen a [math] \ omega_1 [/ math] y 1 pertenece a [math] \ omega_3 [/ math], por lo que [math] x_j [/ math] se asigna a [math] \ omega_1 [ / matemáticas], la clase predominante.
- Tengo seis meses donde tengo que aprender Minería de datos y no hacer nada más. ¿Donde debería empezar?
- ¿Hadoop está saliendo? ¿Se avecina una tecnología que pueda reemplazar toda la forma en que MapReduce consulta en un grupo de máquinas? ¿No puede simplemente automatizar la forma en que ejecuta estas consultas? ¿Es esto lo que Blaze está tratando de lograr?
- ¿Cuáles son algunas ideas de proyectos de ciencia de datos de baloncesto?
- ¿Cuál es el mejor curso para big data en Dehradun?
- ¿Qué se considerará más respetable, un puesto de ingeniería de ciencia de datos en IBM Watson o Google?
(Fuente – Técnicas no paramétricas)
La situación con K-means es que, dado algunos datos, los agrupa en grupos K o grupos [1]. K-means pertenece a la familia de algoritmos de centroide en movimiento, es decir, en cada iteración, el centro (o centroide) del clúster se mueve ligeramente para minimizar la función objetivo. En la figura siguiente, comienza con una conjetura inicial de las medias para dos grupos [math] m_1 [/ math] y [math] m_2 [/ math], usa estos medios para agrupar los objetos, luego actualiza estos medios y luego reagrupa y así activado hasta que los medios [matemática] m_1 [/ matemática] y [matemática] m_2 [/ matemática] se detengan para moverse (o cambiar) o se alcance algún umbral (por ejemplo, número de iteraciones).
(Fuente – Agrupación – K-means)
Para comprender la diferencia entre algoritmos supervisados y no supervisados, puede leer aquí: la respuesta de Shehroz Khan a ¿Cuál es la diferencia entre los algoritmos de aprendizaje supervisados y no supervisados?
Notas al pie
[1] La respuesta de Shehroz Khan a ¿Qué es el algoritmo k-Means y cómo funciona?