Podría haber mucho debate sobre esto. Estas son las herramientas que uso y que he encontrado más útiles en mi trabajo:
Tableau : con mucho, la herramienta más fácil y rápida que he usado para visualizar, explorar y comunicar información de datos. Me ha salvado a mí y a las organizaciones en las que he trabajado durante cientos de horas y mucho dolor de cabeza. Es una gran herramienta para facilitar reuniones y debates informados con datos importantes.
BigQuery : SQL que debe conocer en general, por supuesto, pero recientemente he encontrado que BigQuery es una herramienta extremadamente útil. Puede hacer todos los sofisticados comandos SQL que normalmente usaría en cualquier otra base de datos empresarial, pero además de eso, tiene el poder de Google detrás de usted. ¿Necesitas hacer 100 filas? multa. ¿Necesitas hacer 10 millones de filas? También está bien. No necesita preocuparse por el aprovisionamiento de servidores, clústeres o hardware, simplemente escriba su SQL y listo. Además, tienen capacidad de función definida por el usuario para que pueda agregar JavaScript.
- ¿Dónde puedo encontrar conjuntos de datos abiertos gratuitos para ganar experiencia como Business Intelligence y Data analyst?
- ¿Cuál es el mejor instituto en Hyderabad para aprender Hadoop y big data?
- ¿Cuál es la mejor manera de aprender ciencia de datos sin ir a una institución?
- No me gusta la minería de datos, pero estoy interesado en el aprendizaje automático, ¿debería seguir estudiando ML para estudios superiores?
- ¿Cuál es la diferencia entre CART y los árboles de regresión potenciados?
Python : se está apoderando del mundo de la ciencia de datos. Pandas para la manipulación de datos, SciKit-Learn para el aprendizaje automático, TensorFlow y Keras para el aprendizaje profundo, etc. etc. La comunidad es vibrante y en crecimiento y creo que habrá más y más bibliotecas y paquetes escritos y actualizados en Python para Ciencia de los datos. Es casi imprescindible en este momento.
Trifacta : es un participante nuevo, pero es la mejor herramienta que he visto (y he estado buscando durante mucho tiempo) para la preparación de datos. Hace que todas esas tareas tediosas, difíciles y dolorosas de corregir errores, encontrar anomalías y procesar sus datos sean fáciles y * casi * divertidas. Tiene una excelente interfaz visual y una práctica ruta de recetas de datos. Me ha impresionado tanto la herramienta que nuestro podcast realmente hizo un entrenamiento recientemente sobre él, disponible en Skillshare o Udemy.