¿Cuál es su definición personal para big data?

“Big Data” significa cosas diferentes para diferentes personas y no existe, y probablemente nunca lo sea, una definición comúnmente acordada.

Así que aquí está mi definición rápida y sucia:

La idea básica detrás de la frase ‘Big Data’ es que todo lo que hacemos está dejando cada vez más un rastro digital (o datos), que nosotros (y otros) podemos usar y analizar. Big Data, por lo tanto, se refiere a los datos que se recopilan y a nuestra capacidad para utilizarlos.

Por supuesto, la recopilación de datos en sí no es nueva. Nosotros, como humanos, hemos estado recopilando y almacenando datos desde 18,000 a. C. Lo nuevo son los recientes avances tecnológicos en tecnología de chips y sensores, Internet, computación en la nube y nuestra capacidad para almacenar y analizar datos que han cambiado la cantidad de datos que podemos recopilar.

Las cosas que han sido parte de la vida cotidiana durante décadas: ir de compras, escuchar música, tomar fotos, hablar por teléfono, ahora suceden cada vez más total o parcialmente en el ámbito digital y, por lo tanto, dejan un rastro de datos.

El otro gran cambio está en el tipo de datos que podemos analizar. Solía ​​ser que los datos encajan perfectamente en tablas y hojas de cálculo, cosas como cifras de ventas y precios al por mayor y la cantidad de clientes que ingresaron.

Ahora los analistas de datos también pueden ver datos “no estructurados” como fotos, tweets, correos electrónicos, grabaciones de voz y datos de sensores para encontrar patrones.

Para una visión más profunda, puede consultar este blog: https://goo.gl/koRpLP

¡Feliz aprendizaje!

More Interesting

Soy un desarrollador de Ruby on Rails. ¿Cómo hago una transición a un rol de Data Scientist?

¿Qué acciones técnicas y contractuales puede tomar el gerente de proyecto en caso de corrupción de datos durante la migración de datos?

¿Cuál es la mejor manera de comenzar una carrera en análisis y big data?

¿Qué son los patrones ocultos en big data?

¿Cómo se protegen los datos sanitarios de los ciberataques?

¿Cuál es la mejor estadística para buscar una correlación entre los datos de tipo Likert y los datos nominales (sí / no)?

Como científico de datos, ¿con quién preferirías jugar: Google o Facebook?

¿Cuál es el mejor instituto para un curso de ciencia de datos en India?

¿Es más probable que la minería de datos o la programación web generen altos salarios y oportunidades de empleo en el futuro cercano?

¿Debo aprender conceptos de programación orientada a objetos en Python como científico de datos?

¿Qué es más preferible en el aprendizaje automático, la precisión del modelo A es del 50% en los datos de entrenamiento y del 97% en los datos de las pruebas, o el modelo B tiene una precisión del 80% en los datos del tren y el 75% en los datos de las pruebas? (Más detalles en el comentario abajo) gracias!

¿Qué campos dentro de Data Science son los más relevantes?

¿Cuáles son algunas bases de datos meteorológicas históricas?

¿Qué opinas de los programas de maestría ofrecidos por Data Science Tech Institute (París)?

¿Qué se entiende por big data?