¿Es el operador de módulo (%) adecuado para el muestreo?

Como con todo en Estadística, la respuesta siempre es “depende”.

Por ejemplo, ¿cuándo se ejecuta el código anterior?

  • ¿En el momento de inicio de sesión del usuario?
  • ¿En el momento de “solicitud de página” o “uso”?
  • ¿Como un trabajo por lotes mientras desgarra a todos los usuarios?

La otra pregunta obvia es “¿Cómo se generan los ID de usuario?”

  • ¿Se asignan secuencialmente? ¿Estás seguro?
  • ¿Son “al azar”? (pseudoaleatorio? grupo de entropía?)
  • ¿Son un hash de algo?

Creo que su mayor inconveniente al usar “user_id% 4” será que se perderá alguna categoría de usuarios, como cuentas desconectadas, inactivas o deshabilitadas.

Sin saber las respuestas a muchas de las preguntas anteriores, estará un poco mejor si usa:

  if (hash (user_id)% 4) == 0) { 
     // hacer algo 
 } 

De esa manera, al menos puede eliminar los problemas con la forma en que se asignan los ID de usuario.

Los uso para muestrear los datos que obtengo de Kinect o cualquier cámara de detección de profundidad.

More Interesting

¿Cuáles son las aplicaciones de la teoría de autómatas?

¿Qué tipo de matemática debo esperar para ingresar a una especialización en informática?

¿Existe un equivalente al tono perfecto en matemáticas / programación de computadoras? ¿Un atributo que se considera que no se puede aprender pero que es invaluable si lo posee?

Trabajo como desarrollador de software para una startup. Si sé que nuestro producto es falso, ¿debería cambiarme a otro trabajo?

¿Cuál es el espacio nulo de un operador?

Cómo hacer un simulador de máquina de turing para realizar la suma binaria

¿Cuál es la diferencia entre notación matemática y notación de programación? ¿Por qué usar uno sobre el otro? ¿Por qué no solo usar siempre la programación?

¿Qué debe incluirse en cualquier programa que use la función matemática?

¿Cuántas matemáticas se necesitan en la codificación?

Apelo en matemáticas pero quiero obtener un título de CS porque me encanta la programación. ¿Qué tengo que hacer? ¿Hay alguna alternativa?

¿Por qué P no es igual a NP es tan difícil de probar?

Si tengo una variable, X, en un modelo de regresión que se calcula usando otras tres variables (X = 0.3X1 + 0.5X2 + 0.2X3), ¿está bien que regrese 0.3X1, 0.5X2 y 0.2X3 por separado?

¿Cuándo resolverá AI P frente a NP?

¿Cómo ayuda la máquina de Turing a comprender la mente?

¿Cuánto de aprender un lenguaje de programación de computadoras (como C ++) tiene sus raíces en las matemáticas, es decir, ¿necesito tener un cerebro matemáticamente competente para escribir programas?