¿Por qué los archivos tienen un tamaño extra en los discos, más que su tamaño real?

La respuesta es simple. Se llama “Slack Space”.

Un disco duro típico tiene particiones. Y cada partición tiene un sistema de archivos. En el caso de Windows XP o superior, el sistema de archivos suele ser NTFS.

La unidad más pequeña de NTFS se denomina “clúster”, que suele tener un tamaño de 4096 bytes. Es decir, incluso si almacena solo 1 byte de datos, NTFS seguirá utilizando 4096 bytes de su espacio en disco. ¡El resto de 4095 bytes simplemente se desperdician!


Ahora, cuando está almacenando un archivo, el archivo se almacena como una secuencia de clústeres. Entonces, cuando almacena un archivo de 10 kb, se divide en 3 bloques (4 kb, 4 kb y 2 kb) según el tamaño del clúster de 4 kb. Y luego cada bloque se almacena en un clúster. Entonces, el último clúster terminará desperdiciando 2 kb.


Todos los archivos se almacenan en una secuencia de clústeres llamada cadena de clústeres. Y dado que la mayoría de los archivos no encajan exactamente en la cadena del clúster, el último clúster casi siempre tiene un espacio “flojo”. Aunque este espacio no es utilizado por ningún archivo, en realidad pertenece a los archivos en lo que respecta a Windows.

Simplemente pon:
tamaño de archivo + espacio flojo = espacio utilizado en el disco.

Entonces, más no. de archivos significa, más espacio libre y más la discrepancia en los tamaños informados por Windows. Esta es la regla de oro.

¡Y nos vuelve locos a todos! 🙂

Están sucediendo algunas cosas diferentes.

Primero, una computadora considera que un KB es 1024 B. Un MB es en realidad 1024 KB, y un GB es en realidad 1024 MB. Entonces, cuando resume las cosas como GB, parece que es más pequeño de lo que es.

El siguiente es el tamaño del clúster (o unidad de asignación) en los discos. El tamaño del clúster es la cantidad más pequeña de espacio que se puede usar para ajustar un archivo. Con NTFS, el tamaño de clúster predeterminado es 4KB. Esto significa que un archivo de 1 KB ocupará 4KB. Esto significa que si su aplicación está compuesta de muchos archivos pequeños, en realidad podría ocupar mucho más espacio de lo que realmente ocupa. Además, si un archivo no tiene el tamaño de la siguiente unidad de asignación, habrá un espacio muerto allí.
[Optimización NTFS]

En Windows 95 y el tamaño del clúster era de 8 KB. Estaba instalando Siebel CRM en las computadoras de las personas, tenía que ser prácticamente lo primero que instalé, ocupaba casi el doble de la cantidad de espacio que realmente usaba debido a todos los archivos pequeños y el tamaño de unidad de asignación relativamente grande.