El mayor problema con “Big Data” es lograr cualquier tipo de acuerdo sobre exactamente qué es. Como se señaló en la respuesta del Sr. Blumenkranz, estábamos tratando con conjuntos de datos tremendamente grandes para solo uno o dos municipios de sísmica 3D a fines del siglo XX. Y los procesaríamos en interpretaciones más grandes y más detalladas, etc., manteniendo la integridad de la adquisición inicial. La terminología llegó mucho más tarde, pero la gestión de datos de hoy en día tiene más que ver con exactamente cómo mantener esos datos. mantenga un historial de lo que le sucedió, confirme la integridad de cada versión, copia o iteración y así sucesivamente.
Agregue a eso las operaciones más nuevas de producción de pozos y los sensores de fondo de pozo para temperatura, flujo y presión registrados cada 20–30–40 pies desde TD hasta la superficie muestreada cada 30 segundos y luego vuelva a ver algunos datos importantes.
La conclusión es que la mayoría de las empresas nunca se preocupó por la gestión de datos durante décadas y gran parte de ella se filtró por los agujeros que nunca se volverán a encontrar. Todavía está sucediendo hoy.
- ¿Qué es mejor: Metis o información para el campo de entrenamiento de ciencia de datos?
- ¿Cuál es el mejor sitio para aprender análisis de datos?
- Cómo anonimizar datos de búsqueda de usuarios con machine learning
- ¿Cuál es el mejor instituto para aprender ciencia de datos en línea?
- ¿Qué campo tiene mejores perspectivas de carrera, Big data o data science?