¿Es el big data eventualmente un problema para recuperar?

No eventualmente pero definitivamente, especialmente para el análisis. En igualdad de condiciones, esto no es un problema en los sistemas basados ​​en servidores automatizados. El problema que encuentro con la recuperación de big data (o de big data) es cuando un conjunto de datos muy simple, incluso si es grande, debe estar disponible para un analista.

No es que sea difícil acceder a los datos o buscarlos, hay mucha tecnología para respaldar eso. A menudo es el tiempo que lleva recuperarlo. Como ejemplo, una solución columnar de datawarehouse como Redshift permite consultar fácilmente miles de millones de filas. La consulta en sí puede ser bastante rápida, he realizado consultas simples sobre 4 mil millones de filas que generaron datos en el orden de millones de filas en segundos SI la envié a un S3. Pero no está disponible para el análisis, necesito obtenerlo del S3.

Diría que el problema de la recuperación de grandes datos es más un problema de transmisión de datos que cualquier otra cosa. Pero es un problema real.