¿Cómo funciona técnicamente el big data?

Aquí vamos de nuevo…

“Big data” es en realidad un término muy general para grandes conjuntos de datos que son demasiado grandes para ser tratados con herramientas y técnicas tradicionales. Mehdy Jalaly hace un buen trabajo desempacando lo que implica “tratar” con un conjunto de datos.

Entonces, como con cualquier conjunto de datos, los datos deben ser encontrados, adquiridos, limpiados, almacenados y procesados. La canalización de datos de alto nivel no es tan diferente de los datos tradicionales no grandes, pero las herramientas y procesos de bajo nivel son diferentes para acomodar el volumen de datos.

Un buen ejemplo de esta diferencia serían las consultas que requieren transformación y contabilidad: en un pequeño conjunto de datos almacenado en una base de datos SQL estándar, esto generalmente se realiza mediante una sola consulta. Para un gran conjunto de datos, tal vez almacenado en numerosos archivos de registro, esto a veces se hace utilizando el modelo de reducción de mapas, que permite distribuir el acceso y el cálculo en muchas máquinas.

Related Content

Necesito una persona de Python Advanced para evaluar a un candidato de Data Science. ¿Puede usted ayudar?

¿Qué es el álgebra relacional y para qué se utiliza? ¿Cómo se relaciona con la ciencia de datos?

¿Qué software recomendaría para el análisis de datos cualitativos de 30 entrevistas? Hay 11 códigos y, en promedio, cada respuesta tiene 5 códigos concurrentes.

¿Cómo ayudan los grandes datos o la ciencia de datos a los equipos deportivos y otras empresas relacionadas con la industria?

¿Cuál es el mejor curso fuera de línea para big data y data science en Navi Mumbai?

¿Por qué los enrutadores no tienen la marca basada en el tipo de computadora más adecuado para estos productos?

Estoy investigando Harvard CS 109. ¿Cuánto tiempo de compromiso semanal necesitaré? ¿Hay alguna forma de reducir eso mediante una preparación previa?

No es tan simple escribir sobre big data en pocas palabras, pero básicamente es así: tiene un gran conjunto de datos, intenta investigarlo a través de herramientas estadísticas y encontrar algunas tendencias para predecir el resultado de algunos datos fuera de su conjunto de datos.

El proceso puede resumirse como:

Encontrar datos
Adquiriendo datos
Limpieza y transformación de datos.
Comprender las relaciones en los datos
Entrega de valor a partir de datos

Por cierto, este es todo el proceso utilizado en la ciencia de datos que también contiene grandes datos.

Para más información también puedes leer esto:

http://cra.org/ccc/wp-content/up …

Mehdy Jalaly

More Interesting

¿Por qué no se puede usar el porcentaje (%) para la normalización de datos en estadísticas?

Cómo aprender análisis de big data fácilmente desde un entorno que no sea de TI

¿Cómo se ve la arquitectura de datos de una red publicitaria?

¿Que competencia de kaggle debería elegir?

¿Por qué necesitamos una matriz de confusión en la minería de datos?

¿Cómo es la práctica en Tesla como científico de datos?

¿Qué significa estar basado en datos?

¿El plan de estudios de Hack Reactor cubre alguna ciencia de datos?

¿Qué puedo seguir en el dominio de la ciencia de datos? Tengo conocimiento en el programa R.

¿Qué mini proyecto simple para big data puedo hacer?

¿Cómo es la ciencia de datos diferente del análisis de Big Data?

Como uno de los primeros practicantes de inteligencia artificial y reconocimiento de voz, ¿qué piensa James Baker del rumor en torno al aprendizaje automático y la ciencia de datos en la década de 2010?

Empecé a aprender ciencia de datos. ¿Dataquest.io vale la suscripción?

¿Cuáles son las opciones de salida de Mu Sigma?

¿Cuáles son algunas áreas de investigación desafiantes / declaraciones de problemas en la minería de datos?

Web Analytics