Como con todo en Estadística, la respuesta siempre es “depende”.
Por ejemplo, ¿cuándo se ejecuta el código anterior?
- ¿En el momento de inicio de sesión del usuario?
- ¿En el momento de “solicitud de página” o “uso”?
- ¿Como un trabajo por lotes mientras desgarra a todos los usuarios?
La otra pregunta obvia es “¿Cómo se generan los ID de usuario?”
- ¿Por qué las máquinas de Turing son un equivalente teórico tan prolífico de lo que puede hacer una computadora real?
- ¿Dónde y cómo se superponen la programación y las matemáticas?
- ¿Cuál es la vida útil de una variable?
- Mi cerebro no procesa muy bien la resolución de problemas matemáticos. ¿La programación es para mí?
- ¿Cuál es la explicación rigurosa de por qué n / m es el factor de carga en una tabla hash?
- ¿Se asignan secuencialmente? ¿Estás seguro?
- ¿Son “al azar”? (pseudoaleatorio? grupo de entropía?)
- ¿Son un hash de algo?
Creo que su mayor inconveniente al usar “user_id% 4” será que se perderá alguna categoría de usuarios, como cuentas desconectadas, inactivas o deshabilitadas.
Sin saber las respuestas a muchas de las preguntas anteriores, estará un poco mejor si usa:
if (hash (user_id)% 4) == 0) { // hacer algo }
De esa manera, al menos puede eliminar los problemas con la forma en que se asignan los ID de usuario.