Hola,
Big data tiene algunos problemas inherentes que deben abordarse. El primero es la privacidad. Debido a que nunca antes hemos podido recopilar o analizar datos en esta escala, nunca hemos tenido que elaborar reglas que rijan la privacidad en torno a sus hábitos de compra, hábitos de navegación en Internet o, si está usando un rastreador de salud, incluso su caminar hábitos. Las leyes y regulaciones de privacidad no han alcanzado las capacidades de recopilación de datos de Big Data.
El segundo problema es el hecho de que cualquier conjunto de datos está lleno de sesgos ocultos. Los humanos crean los conjuntos de datos. Decidimos qué se debe incluir y excluir, y luego interpretamos esos conjuntos de datos. Mucha gente cree que los datos son infalibles: los números no pueden ser falsificados, ¿verdad? Pero ese simplemente no es el caso. Un ejemplo de esto sería correlacionar los puntajes de los exámenes de los estudiantes con el desempeño del maestro. Los puntajes de los exámenes miden qué tan bien los estudiantes completaron las preguntas que se les hicieron. De eso debemos inferir si el maestro fue efectivo o no, y ahí es donde las cosas pueden ponerse turbias.
- ¿Cuál es el conjunto de datos útil para el análisis de flujo de datos en tiempo real?
- ¿Cómo se ve la arquitectura de datos de una red publicitaria?
- ¿Cuál es la diferencia entre ingeniería de datos y minería de datos?
- ¿Qué idioma utilizas para la manipulación de datos?
- ¿Entrar en Big Data es una buena opción ahora?
Gracias,
Priyanka
Entrenamiento en línea de Hadoop India.