Durante la limpieza de datos cuando tiene un número decimal que representa el número de personas, ¿debe redondear hacia arriba o hacia abajo? Además, ¿qué sucede si el número total de todos los números redondeados no coincide con el número total de personas, es un error?

Quizás estás calculando el porcentaje o algo así.
En estadística, redondeamos el número al más cercano en general.
eg1 redondear a un decimal: 34.56 → 34.6; 12.34 → 12.3

Cuando ocurre que hay dos números más cercanos al número, a menudo se utiliza redondeo a par (redondeando mientras se hace la última cifra significativa).
eg2 redondeado a un decimal: 23.45 → 23.4 (no 23.5, para 4 es par); 23.55 → 23.6
Para más información sobre redondeo: redondeo

¿Qué sucede si el porcentaje total no coincide con el porcentaje supuesto, digamos 100%?
En mi opinión , debe ajustar al menos un resultado de redondeo para que el resultado de cálculo coincida. La pregunta es, ¿cómo elegir el “uno”?
Elija el que tendrá el error relativo más pequeño . O, elija el más grande.
eg3 Globos de tres colores: rojo 7, verde 10, azul 13
porcentaje: 0.233 …, 0.333 …, 0.433 …
redondeo general (a dos decimales): 0.23 + 0.33 + 0.43 = 0.99.
Elija el más grande para ajustar: 0.43 → 0.44
Nuevo resultado: 0.23 + 0.33 + 0.44 = 1.00

Además, puede mantener lugares más significativos para reducir la “brecha” entre la suma de redondeo y el “100%”. En algunos casos, la brecha desaparecerá, mientras que en otros, como en el ejemplo 3, la brecha simplemente se reduce (obtienes 0.999, 0.9999, etc.).

Como su decimal representa a varias personas, sabemos que la respuesta correcta debe ser un número entero. El decimal debe redondearse al número entero más cercano ; esto podría ser hacia arriba o hacia abajo.

Si se supone que el decimal es un número entero y no está realmente cerca de un número entero, esto debería considerarse un error y marcarse como tal. (Cómo ‘cerca’ depende de la fuente de los datos).

Con estos procedimientos, el total debe coincidir con el número total de personas, y nuevamente se marcará como un error si este no es el caso.

No sé qué tan seguro es esto, pero, a veces, puede ser apropiado escalar la respuesta a un número entero.

En otras palabras, quizás 0.5 personas de 7 podrían ser 1 persona de 14. Pero tenga cuidado …

Como Alan mencionó, dependiendo del contexto, la respuesta ‘correcta’ puede ser redondear al número entero más cercano … si una tarea requiere 0.01 personas para completarse, probablemente sea más seguro ir con 1, en lugar de 0.