¿Cuáles son las herramientas de big data?

Las herramientas de Big Data por sí solas no son muy útiles, una arquitectura de Big Data funciona. Desde esa perspectiva, pienso algo como:

Exasol -> excelente en la base de datos mem que funciona también en la nube, es rápido y de bajo mantenimiento (no hay índices para jugar)

Alteryx y / o Python -> procesamiento de datos, trabajo etl simple, modelado

Tableau, PowerBI o Superset -> presenta el resultado final en un informe o informe de Dios

Lo haré

Dicho esto, tenga en cuenta que las herramientas tienen que encajar con las capacidades de sus equipos. Si su equipo nunca ha escrito 1 línea de código, use Alteryx, si todos usan Python, ni siquiera les mencione Alteryx.

Verifique también el nivel de soporte de TI que puede obtener. Cuanto menor sea el soporte de TI, mejor será el uso de herramientas en la nube frente a las instalaciones.

Big Data Tools permite la gestión de datos de extremo a extremo y la inteligencia empresarial con soluciones para recopilar, integrar, analizar y predecir datos de diferentes maneras.

· SpliceMachine: una base de datos SQL en Hadoop en tiempo real, lleva a Big Data más allá del análisis con la capacidad de obtener información procesable en tiempo real para una rápida toma de decisiones.

· Palantir: Ofrece un conjunto de soluciones de Big Data para integrar, visualizar y analizar información, enfatizando la escalabilidad, la seguridad, la facilidad de uso y la colaboración. Las soluciones de Palantir se utilizan con mayor frecuencia en aplicaciones de inteligencia, defensa, finanzas y aplicación de la ley.

· Attivio: el Active Intelligence Engine combina Big Data y Big Content para analizar todo, incluido el texto generado por humanos a través de análisis de texto avanzado.

· Google Charts: Google Charts es una herramienta gratuita con una amplia gama de capacidades para visualizar datos de un sitio web. Google Charts se implementa fácilmente mediante la incorporación de un código JavaScript simple en un sitio web.

· Mortero: el mortero está diseñado para ayudar a los científicos de datos a pasar más tiempo analizando sus datos y obteniendo ideas procesables, en lugar de dedicar un tiempo valioso a la construcción de infraestructura y la reconfiguración de sistemas.

· Gráficos Fusion: los gráficos Fusion le permiten crear gráficos JavaScript sofisticados y compatibles con dispositivos cruzados con animación, rica interactividad y un diseño impresionante con facilidad.

· MarkLogic: MarkLogic está diseñado para admitir las cargas de datos más grandes del mundo, devolviendo todo tipo de contenido relevante a los usuarios que pueden convertirlo en acción. MarkLogic es ideal para empresas que cuentan con ingresos a través de la búsqueda de contenido pagado.

· Guavus: Guavus impulsa una mejor toma de decisiones con potentes capacidades analíticas combinadas con ciencia de datos avanzada y la capacidad de recopilar datos en tiempo real para obtener información procesable en el momento preciso de la oportunidad.

· Pentaho: Pentaho reúne a los usuarios de TI y de negocios al unir la integración de datos y el análisis empresarial para integrar, visualizar, analizar y combinar Big Data de formas nunca antes posibles para obtener mejores resultados comerciales.

· Karmasphere: diseñado para equipos de analistas que necesitan explorar y analizar Big Data en Hadoop.

Agregaría a esta lista IRI Voracity, la plataforma de análisis, integración, migración, gobernanza y análisis de big data introducida en 2016 para abordar los problemas de rendimiento, seguridad, calidad, complejidad y costo en proveedores tradicionales y herramientas especializadas.

Dependiendo de lo que intente hacer con Big Data, hay muchas herramientas disponibles.