¿De qué se trata este bombo de big data?

La exageración de Big Data es el resultado de 3 tendencias convergentes que se han horneado en las últimas décadas:

1) datos

Los datos están en todas partes, más que nunca. La revolución de los teléfonos inteligentes, RFID, dispositivos portátiles significa que cada uno de nosotros está generando datos muy valiosos a tasas rápidas. Y esta tendencia solo se acelerará en el futuro. La revolución de Internet de las cosas acaba de comenzar. Muy pronto nuestras casas, autos y ropa tendrán docenas de sensores y actuadores listos para recopilar los datos, procesarlos y actuar sobre ellos.

2) Almacenamiento y Computación

El almacenamiento y la computación nunca han sido tan baratos y accesibles como antes. La computación en la nube ha democratizado el análisis a gran escala: las empresas ya no necesitan alojar y mantener 10s de servidores para poder realizar análisis de datos de manera eficiente / escalable. Esto también significa que hay una ventanilla única donde puede almacenar sus datos, analizarlos y almacenar los resultados. Esto no era cierto hace solo unos años.

Al mismo tiempo, los avances en tecnologías como las GPU permiten que los algoritmos de análisis de datos escalen a varios órdenes de magnitud más datos que antes. Algoritmos que en el pasado eran demasiado lentos, ahora son factibles y pueden lograr excelentes resultados (por ejemplo, aprendizaje profundo).

3) La información es dinero

La verdad es que los datos son valiosos. Esto siempre ha sido cierto en campos más antiguos como los seguros y las finanzas. Pero una nueva generación de compañías como Uber, Facebook y Google tienen modelos comerciales muy exitosos basados ​​en la extracción de datos personales. Y todos quieren ser el próximo Google.

3 razones por las que creo que Big Data está publicitado en este momento:

  1. A la gente se le paga mucho dinero por estar en el campo: ¿salario medio de 120k? WTF?!?! Salario: Científico de datos
  2. Hay una escasez prevista de solicitantes: aparentemente la demanda excederá la oferta en un 60% Se necesita ayuda: cinturones negros en los datos
  3. Es un área donde la gente técnica finalmente está recibiendo mucha atención y fama; una especie de venganza del tipo de trato nerds. La gente que gana mucho dinero ya no está en Wall Street. Son los geeks de la informática que fueron intimidados por los muchachos de Wall Street (tengo una teoría similar de por qué tenemos una nueva película de superhéroes que sale una vez al mes; los nerds están a cargo de la industria ahora).

More Interesting

¿Se considera que R no es adecuado para Big Data en comparación con Python?

¿Es una buena idea pasar a Big Data (Hadoop)? Tengo más de 11 años de experiencia en .NET y C ++.

Cómo aprender y probar la tecnología de big data utilizando GitHub

¿Cuáles son las habilidades ideales de un gerente de producto 'big data'?

¿Cuál es la mejor manera de descubrir un modelo de datos para una aplicación?

¿Qué campo es mejor (para el crecimiento profesional en TI y seguridad laboral en los próximos cinco años), RPA (Robotics Process Automation) o Data Science?

¿Cómo hacemos un envío de código en Kaggle?

¿Cómo es útil la econometría tradicional como la que se enseña en los programas de posgrado en economía para los científicos de datos en la práctica?

¿Puede un chico con cero experiencia en codificación, pero con un MBA terminado, superarlo si está muy interesado en aprender ciencia de datos?

¿Dónde podemos encontrar conjuntos de datos para procesar? Quiero usar estos datos para mi proyecto Hadoop.

¿Cuáles son los inconvenientes de Mongo DB? ¿Es bueno comenzar una carrera con la ciencia de datos?

¿Deberían los científicos de datos estar bien versados ​​en informática o ciencias computacionales?

¿Qué es mejor para un conjunto de habilidades Java / J2EE: análisis de big data o middleware de WebSphere?

Si mi interés principal son las series temporales, ¿debería enfocar mi energía en aprender Python o R?

¿En qué se diferencian los proyectos de aprendizaje automático de los proyectos de ciencia de datos?