¿Cómo hace su empresa para que sus herramientas de ‘big data’ sean fáciles de usar? La tecnología cambia la vida futura

Trabajando como Arquitecto de Soluciones de Datos, estamos constantemente resolviendo este problema para nuestros clientes. La buena noticia es que muchas de las herramientas que utiliza para administrar los datos son cada vez más fáciles de entender.

Si trabaja en visualización, es fácil descargar una versión gratuita de Tableau y comenzar a jugar con sus datos. Empresas como Microsoft están utilizando su plataforma en la nube para lanzar canales de visualización de datos que no tienen que ser administrados. PowerBI, las herramientas de Business Intelligence de Microsoft, no requieren servidores administrados para implementar en su organización. Algún día, probablemente llegaremos a un punto en el que la mayoría de las plataformas de BI no se administran internamente, lo que permite a las empresas centrarse en hacer que sus datos sean útiles.

Incluso las herramientas en el espacio de Analytics son cada vez más fáciles de administrar. Hace unos años, necesitaría tener una comprensión firme sobre cómo ejecutar R o Python desde su computadora portátil para comenzar a ejecutar programas de Machine Learning. Ahora, Microsoft Azure y AWS ofrecen Machine Learning en la nube, brindándole una interfaz simple para arrastrar y soltar lo que desea que haga su programa. De repente, ser un desarrollador es menos necesario para poder ejecutar un código ML sólido.

Por lo tanto, para nuestros clientes, recomendamos utilizar estas herramientas cuando sea posible para ahorrar la molestia administrativa. Sin embargo, hay un problema en el que las cosas no se han vuelto menos complejas: ¿cómo gestionar realmente sus datos? Si bien las herramientas de visualización y aprendizaje automático se han vuelto más fáciles ( mucho más fáciles), las herramientas para ayudar a crear conjuntos de datos no lo han sido.

Si tengo 500 horas para desarrollar, fusionar tres fuentes de datos y crear una serie de informes de BI, voy a pasar 300 horas para comprender los datos, crear un almacén de datos y validarlos. Es un proceso increíblemente manual y es algo que no se ha simplificado. Debido a esto, nuestras herramientas más importantes para administrar este proceso son buenos análisis de negocios de moda. Descubrimos que si pasa más tiempo en el front-end realmente entendiendo lo que necesita el usuario final, puede planificar y ejecutar mejor más adelante en el proceso.

Hasta que las fuentes de datos sean mucho más simples y limpias, este seguirá siendo el caso por algún tiempo.