No hay detectores automáticos de valores atípicos realmente buenos y un valor atípico es simplemente un punto “sorprendente”. Surgen muchos problemas, como un punto que se convierte en un valor atípico una vez que se elimina otro punto, o deja de ser un valor atípico solo porque otro punto también es uno.
La única razón real para eliminar los valores atípicos es que están equivocados (por ejemplo, un humano que informa una altura de 6 metros).
Puede observar la influencia de cada punto, esencialmente, eliminándolo y volviendo a calcular todo y luego comparando los resultados (el método formal agrega algo a esto, pero esta es la idea).
- ¿Qué debo elegir: Ciencia de datos o Big Data?
- ¿Orientación profesional para personas de 25 años de edad con inclinación cuantitativa con datos / habilidades de programación?
- ¿Tendrá Gmail que finalizar su límite de almacenamiento que aumenta automáticamente?
- ¿Cuáles son los buenos métodos para muestrear big data?
- El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?
Pero la mejor manera de detectar valores atípicos es usar los ojos. Trace las series de tiempo y busque “blips” y la mejor manera de lidiar con ellos es usar un método que los descarte pero no los elimine.