Los datos han sido el centro de atención en la industria, así como en los medios de comunicación durante bastante tiempo. Algunas de las principales tendencias que se pueden considerar en el escenario de Big Data Analytics incluyen:
- Seguridad de datos: uno de los próximos proyectos para abordar este problema es Apache Sentry , un módulo de autorización granular basado en roles para Hadoop . Lo que hace Sentry es que proporciona la capacidad de controlar el establecimiento de niveles precisos de privilegios en los datos para usuarios y aplicaciones autenticados en un clúster de Hadoop.
- Almacenamiento de datos Anteriormente, durante la década de los 90, la aparición del almacenamiento de datos tenía un tamaño de terabytes que se consideraba una gran cantidad en ese momento. Los sistemas actuales de almacenamiento de datos cuentan datos hasta mil veces más grandes, medidos en petabytes. Esta es la razón por la que muchas empresas e industrias están actualizando sus sistemas y tecnologías de almacenamiento de datos para hacer frente.
BigQuery y Snowflake de Google son algunos de los mejores ejemplos que se pueden usar en las tendencias emergentes del escenario de almacenamiento de datos.
- ¿Cuál es la mejor manera de ganar mucho dinero en menos tiempo?
- Cómo mostrar que dos conjuntos de datos tienen distribuciones diferentes
- ¿Cómo debe establecerse el propósito de un servidor de datos?
- ¿Cuál es la diferencia entre minería de datos, ciencia de datos y bigdata?
- Si está aprendiendo Data Science, ¿qué tan importante es saber cómo implementar modelos de Machine Learning en lenguajes de nivel inferior (por ejemplo, C ++ o Java)?
- NoSQL Las bases de datos tradicionales que fueron utilizadas por las empresas, han sido reemplazadas por los sistemas de bases de datos NoSQL. Con el surgimiento de varias aplicaciones de software NoSQL, los ejecutivos de negocios y gerentes de TI tienen más opciones en el despliegue de las bases de datos.
Algunas de las razones por las cuales el sistema NoSQL de bases de datos se esfuerzan en el mercado pueden deberse a las siguientes razones: - Las bases de datos NoSQL escalan hacia arriba para la computación en la nube.
- Las bases de datos NoSQL han interrumpido el monopolio de la base de datos relacional debido a la amplia gama de opciones que conlleva.
A lo largo de los años, han aparecido muchos sistemas NoSQL en el mercado. Algunos de los más populares que podrían mencionarse aquí serían MongoDB, DataStax y Redis Labs .
- Datos rápidos Habrá una creciente demanda por parte de los usuarios finales de las mismas capacidades de exploración rápida de datos que esperan de los almacenes de datos tradicionales. Algunos de los grandes ejemplos en el mismo podrían ser los siguientes.
- Cloudera Impala, que es un motor de consulta SQL de código abierto de procesamiento masivo en paralelo (MPP) para los datos almacenados en un clúster que ejecuta Apache Hadoop.
- AtScale , una herramienta que los usuarios pueden consultar datos a medida que aterriza en su clúster Hadoop, sin movimiento de datos, se está utilizando ampliamente para Business Intelligence (BI) en la industria.
- Jethro Data es una gran herramienta de análisis que hace que Business Intelligence en tiempo real funcione en Big Data. Algunas de las compañías que han implementado este sistema incluyen Tata Consultancy Services (TCS) , Fiat Chrysler Automobiles (FCA), Symphony Health Solutions y muchos otros.