¿Cuál es la diferencia entre tamaño y tamaño en el disco?

Observando las propiedades de un archivo de Windows, obtengo dos atributos, "Tamaño" y "Tamaño en disco", y "Tamaño en disco" siempre es mayor.

¿Qué significan estas dos métricas?

Tamaño es el tamaño real del archivo en bytes.

El tamaño en disco es la cantidad real de espacio que se está ocupando en el disco. Se diferencian porque el disco se divide en pistas y sectores, y puede asignar bloques de tamaño discreto.

Edición

Para una explicación más detallada, vea este texto que copié de otro sitio:

Sabemos que un disco está compuesto de pistas y sectores. En Windows, el sistema operativo asigna espacio a los archivos en "clústeres" o "unidades de asignación".

El tamaño de un clúster puede variar, pero los rangos típicos son de 512 bytes a 32K o más. Por ejemplo, en mi unidad C: \, la unidad de asignación es 4096 bytes. Esto significa que Windows asignará 4096 bytes para cualquier archivo o porción de un archivo que tiene de 1 a 4096 bytes de longitud.

Si tengo un archivo que es 17KB (kilo bytes), entonces el tamaño en disco sería 20.48 KB (o 20480 bytes). El cálculo sería 4096 (1 unidad de asignación) x 5 = 20480 bytes. Toma 5 unidades de la asignación para sostener un archivo 17KB.

Otro ejemplo sería si tengo un archivo que tiene 2000 bytes de tamaño. El tamaño de archivo en disco sería 4096 bytes. La razón es que, aunque todo el archivo puede caber dentro de una unidad de asignación, todavía ocupa 4096 de espacio (una unidad de asignación) en disco (sólo un archivo puede utilizar una unidad de asignación y no puede ser compartido con otros archivos).

Así que el tamaño en disco es el espacio de todos los sectores en los que se guarda el archivo. Eso significa que, por lo general, el tamaño en el disco es siempre mayor que el tamaño real.

Por lo tanto, el tamaño real de un archivo o carpeta (s) siempre debe tomarse del valor de Tamaño al ver la ventana de propiedades.

Fuente: Cuál es la diferencia entre el tamaño y el tamaño en disco en las propiedades de la carpeta de Windows .

Tiene que ver con los tamaños de unidad de asignación utilizados en el disco cuando se formateó por primera vez.

Imagínese que usted tiene dos latas de gas de 2 x 10 galones en su coche. Cada lata de gas es una unidad de asignación. Usted necesita conseguir 12 galones de gas, así que usted necesita utilizar ambas latas. Básicamente usando 20 galones de espacio asignado – pero llenando solamente 12 galones.

Aquí está el tamaño predeterminado para Windows XP

Drive size (logical volume) Cluster size Sectors ---------------------------------------------------------- 512 MB or less 512 bytes 1 513 MB - 1,024 MB (1 GB) 1,024 bytes (1 KB) 2 1,025 MB - 2,048 MB (2 GB) 2,048 bytes (2 KB) 4 2,049 MB and larger 4,096 bytes (4 KB) 8 

Si piensa en el tamaño del Cluster como cada uno de sus latas de gas: Mantenga 4KB de "gas" cada uno. Pero su archivo es de 2 KB, entonces el tamaño de los rellenos es 2K, pero el tamaño en el disco es de 4 KB

Cluster Slack Space

No puede acceder a cada byte individual en un medio de almacenamiento por separado. Hacerlo sería terriblemente ineficaz porque el sistema necesita algún modo de hacer un seguimiento de cuáles son usados ​​y cuáles son gratuitos (es decir, una lista), por lo que hacerlo para cada byte por separado crearía demasiado oír (para cada byte individual, Es decir 1-a-1, la lista sería tan grande como el propio medio!)

En su lugar, el medio se divide en bloques, bloques, unidades, grupos, como quiera llamarlos (el término técnico es clusters ), cada uno de los cuales contiene un número consistente de bytes (normalmente se puede especificar el tamaño del Porque diferentes usos requieren diferentes tamaños para reducir los residuos).

Cuando un archivo se guarda en disco, el tamaño del archivo se divide por el tamaño del clúster y redondeado si es necesario. Esto significa que a menos que el tamaño de archivo sea exactamente divisible por el tamaño del clúster, algunos de los clústeres terminan siendo no utilizados y por lo tanto desperdiciados.

Cuando ve las propiedades de un archivo, verá el tamaño real del archivo, así como el tamaño que ocupa en el disco, que incluye cualquier " holgura ", es decir, los "consejos de clúster" que no se utilizan. Normalmente no es mucho por archivo y el tamaño en el disco suele ser casi igual al tamaño real, pero cuando se suma el espacio perdido de todos los miles de archivos de una unidad, pueden sumarse. Por lo tanto, cuando ve el tamaño de una carpeta grande, especialmente uno con muchos archivos minúsculos que son más pequeños que un clúster, el tamaño en disco (es decir, la cantidad de espacio de disco marcado como utilizado) puede llegar a ser significativamente mayor que el real Tamaño (es decir, la cantidad de espacio que requieren los archivos reales).

En un caso como el anterior, lo que puede intentar es reducir el tamaño del clúster para que cada archivo pierda menos espacio. Generalmente, una unidad con la mayoría de los archivos perdidos debe usar el tamaño de clúster más pequeño posible (para reducir el desperdicio) y una unidad con archivos mayormente grandes debe usar el mayor tamaño de clúster posible (de esta manera las estructuras de contabilidad terminan siendo más pequeñas).

Incluso en un nivel inferior, si cada clúster es sólo un sector , a menos que un archivo sea un múltiplo exacto del tamaño de los sectores en la unidad (normalmente 512 bytes tradicionalmente, ahora a menudo 4.096 con discos de formato avanzado ), entonces todavía habrá Espacio no utilizado entre el final del archivo y el final del sector.

Compresión

Otro escenario donde se puede ver una diferencia entre el tamaño del archivo real y el tamaño en el disco es con la compresión. Cuando se comprime una unidad (por ejemplo, utilizando DriveSpace , compresión NTFS , etc.), habrá una diferencia entre el tamaño del archivo real (que se debe saber) y el tamaño real que ocupa el archivo (es decir, usa O "toma") en el disco.

Accesos directos y enlaces duros

Sin embargo, otro escenario que podría resultar en una diferencia es con los enlaces duros . Con sistemas de archivos que admiten hardlinks, cuando se crea un archivo duplicado, en lugar de crear un archivo nuevo que ocupa espacio, el sistema de archivos crea un acceso directo al archivo para que ambos (o los tres, etc.) Copias apuntan al mismo archivo físico en el disco. Por lo tanto, cuando hay dos archivos que apuntan a los mismos datos, cada uno tiene el mismo tamaño, pero ocupan sólo un poco más que el espacio para almacenar una sola copia.