Respuesta corta
Big Data es una palabra de moda que hemos aprendido a usar cuando los datos son demasiado grandes para manejarlos en los medios tradicionales.
DBMS es un término genérico para un sistema de software que maneja sus datos “tradicionales” en estilos tradicionales.
Respuesta larga
Si eres un estudiante o practicante de ciencias de la computación, ya tienes una idea sobre DBMS. No vamos a entrar en eso. Hablemos de Big Data.
Hemos estado almacenando una gran cantidad de datos desde el momento en que IBM gobernaba el mundo. Los datos seguían creciendo y el crecimiento exponencial de las computadoras e Internet, y de repente llegamos a un punto en que los sistemas actuales no podían trabajar para nosotros. Teníamos datos de redes sociales, correos electrónicos, sistemas de transacciones, incluso haga clic en los registros cada vez que haga clic en algo. Hubo dos problemas principales: –
1. ¿Cómo almacenar esos datos?
2. ¿Qué hacer con esos datos?
Quizás el profesor Francis X. Diebold es el culpable que utilizó este término por primera vez en alguna literatura relacionada con la economía en 2003 . “Modelos de factores dinámicos de Big Data para la medición macroeconómica y el pronóstico”. Otros sospechosos son Erik Larson y John Mashey . Pero las cosas estaban bien hasta finales de 2010, cuando la referencia habitual a Big Data se convirtió en un término llamado Big Data (las mayúsculas importan).
El informe especial en un diario semanal llamado Nature difundió este término en septiembre de 2008 en su edición especial en Big Data donde discutieron las capacidades de almacenamiento y procesamiento de la escala de petabytes de Google, y la próxima tendencia en almacenamiento, disputas y análisis de datos. Mientras tanto, Hadoop se estaba abriendo camino en el mercado y parecía una buena solución para todos los problemas nuevos. Para 2011-12, Cloud Computing y Big Data estaban en todas partes.
Mientras tanto, las comunidades en línea siguieron esta tendencia y los especialistas en marketing comenzaron a usar este término para separarse del resto de la multitud “DBMS pasada de moda”. En 2012, Boyd y Crawford publicaron un artículo donde explicaban Big Data como:
Un fenómeno cultural, tecnológico y académico que se basa en la interacción de:
(1) Tecnología: maximizando la potencia de cálculo y la precisión algorítmica para recopilar, analizar, vincular y comparar grandes conjuntos de datos.
(2) Análisis: aprovechando grandes conjuntos de datos para identificar patrones para hacer reclamos económicos, sociales, técnicos y legales.
(3) Mitología: la creencia generalizada de que los grandes conjuntos de datos ofrecen una forma superior de inteligencia y conocimiento que puede generar ideas que antes eran imposibles, con el aura de verdad, objetividad y precisión.
Al mismo tiempo, los educadores se dieron cuenta de la fiebre del oro. Para 2012, ciudades como Hyderabad y Bangalore tenían cientos de institutos de capacitación que prometían a sus estudiantes que los convertirían en “expertos en Big Data”. Las cosas eran similares en el lado opuesto del mundo. El bombo estaba encendido. Los desarrolladores regulares que querían cambiar a un nuevo dominio les dieron un buen negocio. Hadoop se convirtió en otra palabra normal. Todos los días hay al menos un feed en mi página de inicio de LinkedIn que menciona Big Data.
Mi perspectiva y conclusión:
No sigas la frase. Quizás esté deseando trabajar en este dominio. No hay nada llamado Big Data. Tienes que aprender herramientas y paradigmas. Puede comenzar con Hadoop y profundizar en su ecosistema. Puede buscar herramientas NoSQL (a diferencia de RDBMS) como MongoDB (más fácil de aprender, en mi opinión) o Neo4J que le proporcionaría una perspectiva totalmente diferente de los datos, mientras que garantiza las capacidades de escalado horizontal (no se preocupe si los datos crecen), Redundancia (no se preocupe si algo falla) y procesamiento distribuido (no se preocupe si los cálculos son complejos). Otra alternativa es entrar en Analytics en lugar de Infraestructura o desarrollo de software. Hay buenos cursos gratuitos en línea.
Otras lecturas:
¿Cómo comienzo en Big Data con Python?
¿Cómo debería alguien comenzar a aprender el análisis de Big Data?
Soy un MBA, profesional de comunicaciones de marketing con más de 15 años de experiencia. Tengo curiosidad por entrar en Big Data. ¿Cuál sería el trabajo ideal para mí en el ámbito de Big Data?