¿Cuál es el mejor algoritmo para usar para la detección de valores atípicos en el flujo de datos?

¡Depende del contexto! Si conocemos la mejor respuesta para todas las situaciones, ¡no sería una pregunta de investigación! Esto es lo que haría:

Comienza por el principio. ¿Tiene alguna condición inicial para verificar valores atípicos? Úselo para procesar la transmisión, pero también hacia arriba

También actualícelo a medida que avanza.

Además, creo que sería bueno tener un criterio diferente más aceptable para los posibles valores atípicos y mantener una pequeña variedad de aquellos para reevaluarlos después de que haya llegado más flujo y luego se puedan actualizar ambas condiciones atípicas a medida que se refina la noción de valores atípicos … En última instancia, el mejor algoritmo debe determinarse por los resultados reales según el contexto. … Para ser profesional al respecto, confíe en los resultados y métodos del campo de la Estadística.