¿Cuáles son las herramientas más útiles para aprender sobre análisis de datos e informes?

Podría haber mucho debate sobre esto. Estas son las herramientas que uso y que he encontrado más útiles en mi trabajo:

Tableau : con mucho, la herramienta más fácil y rápida que he usado para visualizar, explorar y comunicar información de datos. Me ha salvado a mí y a las organizaciones en las que he trabajado durante cientos de horas y mucho dolor de cabeza. Es una gran herramienta para facilitar reuniones y debates informados con datos importantes.

BigQuery : SQL que debe conocer en general, por supuesto, pero recientemente he encontrado que BigQuery es una herramienta extremadamente útil. Puede hacer todos los sofisticados comandos SQL que normalmente usaría en cualquier otra base de datos empresarial, pero además de eso, tiene el poder de Google detrás de usted. ¿Necesitas hacer 100 filas? multa. ¿Necesitas hacer 10 millones de filas? También está bien. No necesita preocuparse por el aprovisionamiento de servidores, clústeres o hardware, simplemente escriba su SQL y listo. Además, tienen capacidad de función definida por el usuario para que pueda agregar JavaScript.

Python : se está apoderando del mundo de la ciencia de datos. Pandas para la manipulación de datos, SciKit-Learn para el aprendizaje automático, TensorFlow y Keras para el aprendizaje profundo, etc. etc. La comunidad es vibrante y en crecimiento y creo que habrá más y más bibliotecas y paquetes escritos y actualizados en Python para Ciencia de los datos. Es casi imprescindible en este momento.

Trifacta : es un participante nuevo, pero es la mejor herramienta que he visto (y he estado buscando durante mucho tiempo) para la preparación de datos. Hace que todas esas tareas tediosas, difíciles y dolorosas de corregir errores, encontrar anomalías y procesar sus datos sean fáciles y * casi * divertidas. Tiene una excelente interfaz visual y una práctica ruta de recetas de datos. Me ha impresionado tanto la herramienta que nuestro podcast realmente hizo un entrenamiento recientemente sobre él, disponible en Skillshare o Udemy.

Hoy en día, creo que Python tiene una ventaja en todos los campos y también es bueno para el análisis de datos. R es otro lenguaje que tiene varios paquetes disponibles para análisis.

Algunas otras herramientas para el análisis de datos e informes

SAS

SPSS

Cuadro

Qlikview

SSRS

Estas son solo algunas de todas las herramientas disponibles en el mercado actual que he usado y que creo que vale la pena mencionar. También puede encontrar muchas otras herramientas en línea. Espero que esta publicación responda tu pregunta

More Interesting

¿Qué motivó la minería de datos?

¿Dónde obtengo datos para el aprendizaje automático?

¿Por qué amas la ciencia de datos?

¿Cómo se ha reflejado la revolución de los grandes datos en otros países además de los Estados Unidos?

¿Cómo debo ir de donde estoy ahora a una carrera en ciencia de datos?

¿Qué clases debería tomar en Columbia si quiero ser un científico de datos?

¿Existe alguna relación entre las habilidades de un desarrollador web full stack y un científico de datos?

¿Cómo se puede pasar del desarrollo de software típico al big data y la ciencia de datos?

Cómo cambiar de ingeniería de datos a modelos de construcción, aprendizaje automático, etc.

¿Cuál es un buen método para encontrar series de tiempo crecientes o caracterizar la pendiente de una serie de tiempo?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

¿Cuál es el mejor idioma para aprender a entrar en la ciencia de datos o big data en los requisitos actuales como graduado de comercio?

¿Cómo puede alguien que tiene una formación matemática decente pero cero experiencia en programación convertirse en un gran científico de datos?

Al hacer una prueba A / B sobre la tasa de conversión (proporción de visitas que incluyen una compra), ¿cómo abordo el hecho de que no todas las visitas son independientes?

¿De qué maneras es importante la investigación matemática fundamental en espacios de alta dimensión (por ejemplo, geometría / topología) importante para la ciencia de datos y el aprendizaje automático?