Cómo calcular la latencia y el mayor rendimiento en términos de solicitud web por segundo

Creo que esta pregunta realmente significa preguntar sobre la relación entre el rendimiento de tráfico adicional (ancho de banda o carga de tráfico) y la cantidad de tiempo que tarda cualquier información en llegar a su destino (latencia) en Internet.

Internet está compuesto por un grupo flexible de nodos donde cada nodo realiza una operación de almacenamiento y reenvío en cada paquete que maneja. La configuración de qué nodos debe transitar un paquete y las líneas de transmisión correspondientes cambian constantemente. De hecho, es la magia de Internet que simplemente no importa qué camino tome un paquete para que funcionen las comunicaciones de datos.

Esta es la pregunta básica que constituye el estudio arcano conocido como teoría de colas. No hay respuestas simples a una pregunta tan vaga, pero hay tendencias generales que pueden mencionarse.

Más tráfico en una red de paquetes conmutados como Internet significa más tiempo de tránsito o latencia en la red. La cantidad de aumento en la latencia no es lineal en comparación con los aumentos en el tráfico. El tráfico adicional en cualquier nodo tendrá un pequeño impacto hasta que la carga de tráfico se convierta en una porción significativa del límite teórico de ese nodo. Esto se debe a que el mantenimiento de cada paquete en cada nodo de transmisión requiere esperar en línea (la cola) para que se atiendan los paquetes que están por delante. A medida que la carga aumenta hasta un punto cercano al límite del nodo, el tiempo de espera aumenta exponencialmente. Cuando se alcanza el límite de procesamiento real para el nodo, la espera se acerca al infinito y la red se obstruye irremediablemente. (Este problema se resuelve con algoritmos de “Retroceso” que reducen la carga cuando se pierden paquetes).

Dado que hay un número arbitrario de nodos y cada uno tiene un ancho de banda diferente o aparentemente arbitrario disponible, no hay una forma práctica de estimar los tiempos de latencia en una red real con muchos usuarios. Es posible hacer una simulación razonable de este problema increíblemente complejo, pero la información necesaria para hacer esto para una conexión real a Internet es esencialmente imposible de obtener porque el conocimiento de las posibles rutas de tránsito de nodo a nodo simplemente no está disponible para nadie.

Actualización 16/03/2014

La conmutación de paquetes es un método de asignación de ancho de banda de comunicaciones de acuerdo con la demanda o la asignación asignada a la demanda. Esto significa que la latencia para una conexión o paquete dado depende tanto de los requisitos de ancho de banda del usuario en cuestión como de la carga en la red al mismo tiempo. Debido a la dependencia de los requisitos de datos de otro usuario, es probable que las mismas comunicaciones de un usuario a otro tarden drásticamente diferentes cantidades de tiempo en completarse.