Desde el punto de vista de la velocidad de búsqueda, ¿es mejor tener dos discos duros de 500 GB en lugar de un solo disco duro de 1 TB?

Si y no. Mayormente sí. Aquí hay una lección completa: discutiré RAID 0 y simplemente tener dos volúmenes de almacenamiento separados.

Mi consejo general es el siguiente: por simplicidad, en todos los aspectos (hardware, software, control de usuario, instalación, configuración), recomiendo usar un solo disco con un solo volumen siempre que sea posible.

Todo lo siguiente se aplica a los discos duros. Si tiene SSD, casi siempre verá un beneficio.

RAID 0: si las unidades son completamente nuevas y no están defectuosas de ninguna manera, y están configuradas en RAID 0, entonces sí, será un poco más rápido.

La esencia de RAID 0 es esta: dos unidades están emparejadas juntas y pretenden ser una sola unidad. La mitad de los datos entrantes se escriben en una unidad, mientras que la otra mitad se escribe en la otra. Los datos para ser leídos se manejan de la misma manera, solo a la inversa. Esto reduce la carga general en cada unidad y significa que puede completar lecturas y escrituras secuenciales (gran parte) en un pico de 2 veces más rápido de lo normal.

Sin embargo, las velocidades de acceso aleatorio no se mejoran directamente. Ambas unidades deben mover sus partes en tándem. El único momento en que RAID 0 mejoraría una lectura o escritura aleatoria es si el archivo al que se accede es lo suficientemente grande como para ver la mayor velocidad de E / S secuencial y, por lo tanto, las unidades se llevan a su próxima tarea aleatoria antes.

Problemas, cuando las unidades se desgastan, encuentran sectores en los que ya no pueden escribir. Las unidades modernas evitan esto al tener una pequeña ubicación secundaria para usar en lugar de esta dañada. El disco duro, cuando se encuentra con esto, debe reorganizar físicamente los datos.

Eso ya es lo suficientemente lento: piense en archivar algo en un gabinete en un lugar específico, junto con todos los demás archivos similares, solo para darse cuenta de que no puede ponerlo allí. Luego tiene que ir a un gabinete diferente y colocarlo allí, y hacer una pequeña nota en el primer gabinete que diga “oye, aquí es donde está este archivo”.
Ahora imagine si divide un montón de estos archivos con otro trabajador. Imagine que no puede pasar a su próxima tarea hasta que se confirme que tanto su archivo actual como el archivo actual de su compañero de trabajo están completos. Usted termina teniendo que archivar algo en un gabinete secundario debido al problema antes mencionado. Su trabajador TAMBIÉN encuentra este problema, pero con un archivo DIFERENTE en un lugar diferente. Entonces, en diferentes momentos, tanto usted como el otro trabajador estaban esperando al otro debido a errores.

Esto se aplica a RAID 0, todo el tiempo. Si cualquiera de las unidades tiene un sector defectuoso, una unidad básicamente está esperando a la otra. Esto aumenta hasta que tu velocidad se reduce a un arrastre.

Indexación: en general, las velocidades de búsqueda se mejoran con un índice [1] [2]. Esta lista es principalmente una lectura compacta y secuencial. En este caso, RAID 0 se beneficiaría la mayor parte del tiempo. Si tiene dos volúmenes de almacenamiento separados, el índice solo se mantiene en uno, por lo que no verá ningún beneficio al tener dos volúmenes. A no ser que:

Si está buscando algo que no está indexado, los dos volúmenes separados, si se buscan ambos al mismo tiempo, verían aproximadamente el mismo beneficio de rendimiento que un RAID 0. Ambas unidades estarían trabajando por su cuenta devolviendo su Datos propios.

Si sus archivos están fragmentados, si su índice está fragmentado, si sus unidades están fallando, bla, bla, tener RAID 0 lo ralentizará. Si está buscando archivos indexados, no verá ningún beneficio si tiene dos volúmenes separados. Si está buscando archivos no indexados, tener dos volúmenes separados probablemente tendrá el mayor beneficio.

Notas al pie

[1] Servicio de indexación – Wikipedia

[2] Características de indexación de Windows

La partición de unidades y la jerarquía de carpetas de archivos pueden ayudar a encontrar archivos más rápido.

Puede agrupar archivos por tipo de archivo y almacenar los archivos en particiones separadas, como documentos personales, documentos comerciales, correo electrónico, fotos, imágenes, música, películas, videos personales, videos comerciales, etc.

En Correo electrónico, puede tener subcarpetas de archivo por año: Correo electrónico 2017, Correo electrónico 2016, etc.

Para una unidad de disco duro, una búsqueda de disco tomará aproximadamente 20 milisegundos para llegar a la pista adecuada. Si la pista está en una partición dedicada para ese tipo de archivo, como Email 2016, otros archivos similares estarán cerca, minimizando el tiempo de búsqueda para acceder a archivos similares. Las pistas adyacentes solo tardan aproximadamente 1 milisegundo en buscarse, no 20 milisegundos.

Las particiones se pueden desfragmentar y optimizar para hacer que las secciones de los archivos sean contiguas para minimizar las búsquedas en el disco y agrupar los archivos usados ​​recientemente para un rendimiento más rápido.

Si todos los archivos ya han sido indexados, los archivos se pueden encontrar rápidamente con una búsqueda. Si los archivos no están indexados, o el índice no está actualizado, el uso de particiones, subcarpetas y optimización de disco separadas puede acelerar la búsqueda manual.

Si tiene 2 unidades, llamadas Archivos de datos y Archivos multimedia, cada una con 500 GB de archivos, no necesitará buscar en la unidad Archivos multimedia si está buscando un documento de Word. Si tiene 1 unidad, llamada Todos los archivos, necesitaría buscar el doble de almacenamiento.

Si tiene mucha RAM, hay más probabilidad de que un archivo usado recientemente ya esté en RAM y no se necesite una búsqueda de disco.

Los archivos de uso frecuente deben almacenarse en un SSD o unidad flash USB, y los archivos de uso menos frecuente deben almacenarse en un HDD más lento.

Hay circunstancias en las que es posible realizar una búsqueda de una manera que se beneficiaría considerablemente si los datos a buscar se distribuyeran en cantidades similares en varias unidades. Simplemente puede tener un proceso de búsqueda (o hilo) separado que ejecute la búsqueda en cada unidad. La CPU normalmente podría manejar las velocidades máximas de datos de varias unidades simultáneamente, siempre que el algoritmo para encontrar lo que estaba buscando sea sencillo, por lo que la búsqueda podría continuar a la velocidad máxima para cada unidad. El único problema es que su programa de búsqueda estándar no lo hará de esta manera, ya que normalmente se espera que el conjunto de datos a buscar resida en una sola unidad. (Al menos en un sentido lógico. La introducción de RAID en este contexto me parece que aborda una pregunta diferente). Sin embargo, no hay nada que le impida iniciar dos instancias de un programa de búsqueda, una instancia buscando en una carpeta en una unidad y la otra instancia buscando en una carpeta en la otra unidad.

En teoría, dos discos duros de 500 GB en una configuración RAID 0 serían más rápidos que un solo disco duro de 1 TB.

Si los dos discos duros de 500 GB NO están en una configuración RAID 0, creo que las diferencias serían bastante menores, aunque técnicamente los dos discos duros de 500 GB deberían tener una pequeña ventaja.

El elemento clave de la velocidad de búsqueda es tener acceso a los metadatos del archivo rápidamente y tener los archivos en el disco duro ya indexados.

El tiempo de búsqueda, como se le llama, no depende del tamaño de la unidad, sino de la velocidad de rotación. Vea este artículo de Wikipedia para más detalles:

Unidad de disco duro – Wikipedia

¿Que estás buscando? requiere una búsqueda de exploración completa, en otras palabras, leer cada byte de cada archivo de principio a fin que sí, dos unidades de 500 GB son mejores a menos que el archivo se escriba contiguamente en el disco, entonces es más probable que la mayor cantidad de bits por disco pueda acelerar es más rápido que los dos discos que tienen que buscar continuamente

Por otro lado, hay varios métodos para indexar datos que le permiten ir directamente a los datos que necesita sin tener que leer GB de datos.