¿Cómo hace su empresa para que sus herramientas de ‘big data’ sean fáciles de usar?

Trabajando como Arquitecto de Soluciones de Datos, estamos constantemente resolviendo este problema para nuestros clientes. La buena noticia es que muchas de las herramientas que utiliza para administrar los datos son cada vez más fáciles de entender.

Si trabaja en visualización, es fácil descargar una versión gratuita de Tableau y comenzar a jugar con sus datos. Empresas como Microsoft están utilizando su plataforma en la nube para lanzar canales de visualización de datos que no tienen que ser administrados. PowerBI, las herramientas de Business Intelligence de Microsoft, no requieren servidores administrados para implementar en su organización. Algún día, probablemente llegaremos a un punto en el que la mayoría de las plataformas de BI no se administran internamente, lo que permite a las empresas centrarse en hacer que sus datos sean útiles.

Incluso las herramientas en el espacio de Analytics son cada vez más fáciles de administrar. Hace unos años, necesitaría tener una comprensión firme sobre cómo ejecutar R o Python desde su computadora portátil para comenzar a ejecutar programas de Machine Learning. Ahora, Microsoft Azure y AWS ofrecen Machine Learning en la nube, brindándole una interfaz simple para arrastrar y soltar lo que desea que haga su programa. De repente, ser un desarrollador es menos necesario para poder ejecutar un código ML sólido.

Por lo tanto, para nuestros clientes, recomendamos utilizar estas herramientas cuando sea posible para ahorrar la molestia administrativa. Sin embargo, hay un problema en el que las cosas no se han vuelto menos complejas: ¿cómo gestionar realmente sus datos? Si bien las herramientas de visualización y aprendizaje automático se han vuelto más fáciles ( mucho más fáciles), las herramientas para ayudar a crear conjuntos de datos no lo han sido.

Si tengo 500 horas para desarrollar, fusionar tres fuentes de datos y crear una serie de informes de BI, voy a pasar 300 horas para comprender los datos, crear un almacén de datos y validarlos. Es un proceso increíblemente manual y es algo que no se ha simplificado. Debido a esto, nuestras herramientas más importantes para administrar este proceso son buenos análisis de negocios de moda. Descubrimos que si pasa más tiempo en el front-end realmente entendiendo lo que necesita el usuario final, puede planificar y ejecutar mejor más adelante en el proceso.

Hasta que las fuentes de datos sean mucho más simples y limpias, este seguirá siendo el caso por algún tiempo.

More Interesting

Cómo comenzar a construir un proyecto sobre minería de datos desde cero

¿Cuáles son los mejores recursos para aprender la visualización de datos?

¿Cómo se transfiere una persona trabajadora a tiempo completo a la ciencia de datos?

¿Cuál es la próxima gran cosa que NO está relacionada con los datos o la informática?

Si hay Big Data, ¿hay también Small Data? ¿Por qué no nos enteramos de eso?

Después de la ingeniería, ¿cuál es mejor, capacitación en ciencias de datos o un curso de diploma de ciencias de datos PG?

¿A qué proyectos de código abierto relacionados con la ciencia de datos podría contribuir como programador novato?

¿Existe una relación entre big data, aprendizaje automático y sistemas distribuidos?

En el aprendizaje automático, si no sé mucho sobre la corrección de lo anterior, ¿puedo tratar de corregir el modelo a través de grandes cantidades de datos de entrenamiento?

¿En qué se parecen y se diferencian los problemas establecidos en CS 109 al trabajo como científico de datos real?

¿Cuáles son algunas ideas de proyectos de graduación en el campo del análisis de datos, en relación con la ingeniería industrial u otras especialidades de ingeniería?

Hay tantas cosas en Python. ¿Qué conceptos necesito saber para el análisis de datos?

Cómo realizar prácticas como analista de datos en un equipo deportivo

¿Qué habilidades y práctica necesito para ingresar al campo de la ciencia de datos? Además, ¿cuáles son las diferentes oportunidades y opciones para lo mismo?

¿Qué es la ciencia de datos y el aprendizaje automático? ¿Cuáles son las similitudes y diferencias entre ellos?