¿Cuáles son las principales herramientas de ciencia de datos utilizadas por las organizaciones líderes?

Estas herramientas son para la mayoría de código abierto.

Las principales organizaciones tecnológicas (piense en Airbnb, Uber, Facebook, Google, etc.) construyen sus sistemas internos utilizando estas herramientas de código abierto para resolver problemas específicos.

Si los problemas resueltos no son críticos para su negocio, abrirán el código de las herramientas que han desarrollado y contribuirán así al ecosistema de código abierto.

Un círculo virtuoso.

Aquí hay dos ejemplos:

  1. Airbnb construyó el superconjunto [1] para facilitar la exploración de datos. Esta herramienta utiliza muchas otras bibliotecas de código abierto: Flask [2] y SQLAlchemy [3] para nombrar algunas.
  2. Facebook creó el profeta [4] para facilitar el trabajo con series temporales. Nuevamente, esta biblioteca utiliza otros proyectos de código abierto: Pystan [5] y Pandas [6] por nombrar algunos.

Ahora, si solo está buscando una lista, le recomiendo la Awesome Data Science [7].

¡Espero que esto ayude!

Notas al pie

[1] airbnb / superset

[2] Frasco (un microframe de Python)

[3] El kit de herramientas de base de datos para Python

[4] facebookincubator / profeta

[5] PyStan: la interfaz de Python con Stan

[6] Biblioteca de análisis de datos de Python

[7] bulutyazilim / awesome-datascience

Visite el siguiente enlace:

19 herramientas de ciencia de datos