SQL se usa principalmente en bases de datos relacionales, RDBMS. Donde la base de datos se estructura en tablas y tiene un tamaño pequeño o mediano de almacenamiento y recuperación de datos utilizando operaciones ddl, dml, dql
Big data son datos no estructurados, por ejemplo: la bolsa de valores y los precios de las acciones de NASDAQ, los usuarios de Facebook cargan fotos, actualizaciones diarias de estado y viajes diarios de pasajeros de aeropuerto, comunicando sistemas de señales de seguimiento de aviones que generan un gran volumen de datos y todos están desestructurados; El uso de herramientas de big data como HDFS de hadoop, hilado, impala, colmena resuelven el problema de estos datos no estructurados en análisis deseados personalizados o datos que apoyan decisiones basadas en datos que se almacenaron en bases de datos o almacenes de datos relevantes. Big data funciona en un gran volumen de datos, como tera bytes o peta bytes de capacidad; Big Data utiliza la técnica de triple V 1. Volumen 2. Velocidad 3. Variedad
- Tengo 24 años y tengo habilidades básicas de análisis de datos (R, Python, SQL, estadísticas, cálculo, etc.). Actualmente trabajo para una empresa de comercio de bonos, pero no soy lo suficientemente bueno (ni quiero) ser analista o ingeniero de datos profesionales. ¿Qué trabajos involucran estas habilidades en menor grado / qué otras habilidades los complementarían?
- ¿Cómo funciona la minería de datos en el caso de datos faltantes?
- ¿Cuáles son las competencias básicas para un ingeniero de datos?
- ¿Debo usar big data como tema de investigación para mi tesis? ¿Cuál es la diferencia entre cloud computing y big data?
- ¿Cuál es la diferencia entre los datos del panel, los datos en serie de tiempo y los datos de sección transversal?