Estas herramientas son para la mayoría de código abierto.
Las principales organizaciones tecnológicas (piense en Airbnb, Uber, Facebook, Google, etc.) construyen sus sistemas internos utilizando estas herramientas de código abierto para resolver problemas específicos.
Si los problemas resueltos no son críticos para su negocio, abrirán el código de las herramientas que han desarrollado y contribuirán así al ecosistema de código abierto.
- Mis tesis de licenciatura y maestría son en procesamiento de imágenes y aprendizaje automático. ¿Está mal intentar otros temas en mi doctorado?
- ¿Cuál es la diferencia entre la captura de datos de cambio y el abastecimiento de eventos?
- ¿Quiénes son los mejores expertos en aprendizaje automático (ML)?
- ¿Cuál es la diferencia entre análisis cuantitativo y ciencia de datos?
- ¿Cuál es la herramienta de big data más fácil que se puede utilizar para el aprendizaje automático?
Un círculo virtuoso.
Aquí hay dos ejemplos:
- Airbnb construyó el superconjunto [1] para facilitar la exploración de datos. Esta herramienta utiliza muchas otras bibliotecas de código abierto: Flask [2] y SQLAlchemy [3] para nombrar algunas.
- Facebook creó el profeta [4] para facilitar el trabajo con series temporales. Nuevamente, esta biblioteca utiliza otros proyectos de código abierto: Pystan [5] y Pandas [6] por nombrar algunos.
Ahora, si solo está buscando una lista, le recomiendo la Awesome Data Science [7].
¡Espero que esto ayude!
Notas al pie
[1] airbnb / superset
[2] Frasco (un microframe de Python)
[3] El kit de herramientas de base de datos para Python
[4] facebookincubator / profeta
[5] PyStan: la interfaz de Python con Stan
[6] Biblioteca de análisis de datos de Python
[7] bulutyazilim / awesome-datascience