¿Por qué usamos k-means clustering? ¿Qué usos tiene en un escenario del mundo real?

solíamos filtrar algunos valores irregulares de nuestro conjunto de datos de entrenamiento.

Antecedentes : el conjunto de datos se creó extrayendo el tiempo que toma cada subproceso para realizar una operación en particular. La extracción de esta información de tiempo se realizó utilizando alguna herramienta [confidencial].

Ahora se produjo un escenario en el que en algún momento hubo valores de tiempo demasiado altos debido a algún otro proceso relacionado con el sistema operativo.

Entonces realizamos las mismas operaciones 10 veces como esta (us = microsegundos)

105 nosotros
110 nosotros
98 nosotros
125 nosotros
988 nosotros
122 nosotros
118 nosotros
1004 nosotros
98 nosotros
106 nosotros

Ahora es claramente visible que la iteración 5 y 8 son algunos valores irregulares. Como en ese momento el tiempo aumentó debido a algún otro proceso interno.

Ahora aquí usamos K mean clustering con 2 clases para eliminar estas iteraciones irregulares del conjunto de datos.

Análisis de conglomeradosAprendizaje automático

Related Content

¿Se pueden identificar las características que resultan del proceso de aprendizaje de CNN, o se puede diseñar e incrustar una cantidad de características bien definidas en una CNN?

¿A qué tipo de problemas del mundo real se aplica el aprendizaje no supervisado?

¿Cuáles son los algoritmos actuales de última generación para la detección de objetos en 2017?

¿Qué debo hacer cuando tengo una cita con las características NULL?

¿Qué cursos debería tomar para especializarse en aprendizaje automático, ciencia de datos e IA como estudiante de MS CS en USC?

¿Qué tan difícil es el aprendizaje automático?

¿Se utiliza el aprendizaje automático para resolver otros problemas en lugar de problemas relacionados con la inteligencia artificial?

More Interesting

¿Cuál es el papel de la función de activación en una red neuronal? ¿Cómo funciona esto en un sistema de red neuronal humana?

¿Cómo podría usar el aprendizaje automático para clasificar los datos 1D?

¿Cuáles son algunas de las ventajas del aprendizaje por diferencia temporal y cómo se puede mejorar?

¿Qué parámetros en los datos de entrenamiento / prueba deben considerarse para decidir la elección de un método de clasificación de aprendizaje automático (fuera de SVM, red neuronal, regresión logística, etc.)?

¿Cuál es la diferencia entre el control óptimo adaptativo y el aprendizaje por refuerzo?

¿Cuáles son las debilidades del algoritmo estándar k-means (también conocido como algoritmo de Lloyd)?

Serie temporal: ¿Existe un enfoque para la detección de anomalías que no se base en datos de entrenamiento anteriores?

¿Es posible generar datos de expresión genética artificial? Las imágenes a veces se pueden perturbar para aumentar el tamaño de las muestras con fines de aprendizaje automático.

¿Qué técnicas son buenas para suavizar los clics de las consultas de cola larga en los motores de búsqueda?

¿En qué se diferencia LSTM de RNN? En una explicación laica.

¿Cuáles son las ventajas y desventajas de utilizar PMML como formato de intercambio para modelos de análisis predictivo?

¿Cuáles son algunos algoritmos de aprendizaje automático que puedo aprender sin cálculo?

¿Qué suele hacer que una red neuronal deje de mejorar temprano?

¿Ubuntu es mejor con machine learning que mac?

¿La regresión logística tiene en cuenta el desequilibrio de datos?

Web Analytics