¿Te refieres a redundante o irrelevante? Si es redundante, aquí hay algunas condiciones de alto nivel necesarias para llegar a esta etapa:
- La velocidad global de descubrimiento, indexación y captura de datos excede la velocidad de generación de datos. Esto también se aplica a los datos M2M / IOT. En teoría posible, prácticamente imposible.
- Cuando puede indexar y almacenar en caché todas las páginas web, comentarios sociales, datos empresariales, registros gubernamentales, transacciones de blockchain en tiempo real.
- Debería poder sobrepasar todos los métodos legales, de cumplimiento, seguridad y encriptación implementados por los generadores de datos para evitar este escenario.
- Puede copiar todos y cada uno de los datos de los servicios p2p, la web oscura y los datos de la cadena de bloques (que se está volviendo independiente de la propia Internet pública).
- Se fabrican suficientes dispositivos de almacenamiento y redes y se ponen en producción para realizar técnicamente todas las tareas anteriores
El cumplimiento de todas las condiciones anteriores es casi imposible debido a muchas condiciones, pero si hay alguna entidad (empresa, gobierno, persona) que pueda acercarse (casi redundante) a esto, sería google. Tienen el dinero, el talento, la capacidad y la intención de ejecutar esto.
- ¿Puedo usar RStudio para la minería de datos donde necesito tomar un conjunto de datos de detección de intrusos? ¿Alguna sugerencia?
- ¿Cuánto de R (o minería de datos) debo aprender para la investigación de mercado y para un negocio personal / propio?
- ¿Qué servidor utiliza Google para guardar grandes datos?
- ¿Qué es la protección de pérdida de datos?
- ¿Por qué amas la ciencia de datos?