¿Cómo se debe detectar y conmutar por error una gran pérdida de paquetes en una red de transportista de tránsito?

La detección se debe a todas las organizaciones que quieran hacerlo. En el caso vinculado de Cloudflare, lo detectaron mediante un error 522, que es una forma perfectamente sensata de hacerlo para su uso.

Esto, por supuesto, difiere según cuál sea su negocio. Para un proveedor de red, debería ver que algunos de los destinos son inalcanzables o que necesita una gran cantidad de retransmisiones. El diagnóstico depende de quién necesita el resultado.

Después de detectar el problema y confiar en que sea lo más preciso posible, puede comenzar a construir las acciones para solucionarlo. Por supuesto, esto es más fácil de hacer automáticamente. Como lo hizo Cloudflare, simplemente cerró el enlace ofensivo o cambió los parámetros de BGP como MED, pre-pendiente o incluso comunidades si su proveedor de enlace ascendente los admite. Por supuesto, si tiene un NOC dedicado, pueden hacerlo manualmente de acuerdo con un libro de jugadas que, con suerte, eliminaría los errores de detección y los fallos de encendido de los scripts / automatización.

Espero que esto ayude un poco.