¿Qué placa base y CPU o GPU se recomiendan para administrar 160 TB (8 TB x 20) de datos que tienen principalmente archivos de texto individuales, y se puede usar GPU acc para buscar archivos rápidamente?

El hardware del servidor de proveedores como HP o Dell debería estar bien para sus requisitos. La cantidad de hardware que necesita depende más de la escala de acceso a los datos que de la cantidad de datos que hay. Necesita 160 TB solo para almacenar los datos, por lo que necesitará un servidor con una gran matriz RAID o una matriz de almacenamiento para conectar a su servidor. Hay muchas opciones cuando se almacena esta cantidad de datos, lo que debe elegir depende de sus requisitos y presupuesto específicos.

La clave para la búsqueda rápida es indexar los datos. Mire los paquetes de código abierto Elasticsearch o Apache Solr para su software de búsqueda. Ambos le permiten crear índices personalizados de sus datos para la búsqueda. La indexación de sus datos requiere espacio en disco adicional, tal vez varias veces el espacio requerido para los datos en sí, dependiendo de cómo diseñe sus índices. Probablemente esté buscando un mínimo de 500 TB de almacenamiento, tal vez más como 1 PB (petabyte).

Luego, dependiendo de cuántas personas accederán a los datos, necesitará una cantidad adecuada de servidores de indexación y búsqueda (hardware) para escalar su sistema. Considere la escala que opera la búsqueda de Google y verá lo que quiero decir.

Hay esfuerzos de investigación en torno a la aceleración de GPU, pero nada en producción que he visto. Ver este enlace:

Soporte de GPU · Edición # 19148 · elastic / elasticsearch

para discusión entre el equipo de Elasticsearch con respecto a la aceleración de GPU, y este enlace:

Explore la aceleración de GPU

relacionado con la aceleración de GPU en Lucene, que sustenta a Apache Solr.

La GPU es probablemente irrelevante. Como no proporciona detalles sobre lo que intenta lograr, la CPU probablemente tampoco importe demasiado. Desea un almacenamiento rápido (RAID, SSD, etc.) y un motor de indexación de archivos o una base de datos. Usaría el índice o la base de datos para buscar.

More Interesting

Al eliminar un archivo, ¿por qué la computadora no puede volver a convertir los datos a 0? ¿No haría eso para que nadie pueda recuperar esos datos en lugar de esperar a que la computadora los sobrescriba en algún momento?

¿Por qué las teclas de flecha arriba / abajo no están impresas en el medio de las teclas de los teclados?

¿Por qué mi teléfono se apagó al 27%?

¿Dónde puede encontrar información sobre si un ping alto en su computadora es algo bueno o malo?

¿Cuáles son los diferentes tipos de computadoras personales?

¿Por qué la sobrecarga informática?

¿Cuáles son 7 cosas poco conocidas que no sabías sobre tu computadora?

¿Cómo puedo hacer que mi computadora convierta automáticamente guiones dobles en guiones largos al ingresar texto?

¿Todas las familias estadounidenses tienen computadoras Apple en su casa?

Cómo hacer que los altavoces de su computadora portátil sean más fuertes

¿Importa la velocidad de un disco duro externo en comparación con la interfaz?

¿Cuál es la mejor tarjeta gráfica presupuestada para mi PC?

¿Cuál puede ser la posible razón detrás de la pantalla negra de la computadora portátil?

¿Son los procesadores x86 modernos realmente completamente compatibles con versiones anteriores hasta 8086? ¿Es posible recrear un sistema completo de 16 bits de los años 70 utilizando un procesador Broadwell?

¿Hay alguna manera de averiguar si un archivo de música de 320 kbps es realmente un archivo de música convertido de baja calidad (aparte de escucharlo)?