Bueno, con 15 minutos no vamos a hablar de pensamientos técnicos profundos o incluso de sintaxis CS en absoluto; Así que mencionaré un consejo de visualización rápida ya que a menudo tenemos que mostrar nuestros datos a las personas:
Personalice todos sus trazados en el entorno en el que los va a mostrar. Las opciones de trazado predeterminadas en casi todos los paquetes de visualización son MUY MALAS.
Un gran infractor es Excel, las líneas de la cuadrícula son muy ruidosas y terminan abruptamente sin un borde de gráfico, y las fuentes del eje son demasiado pequeñas. Otros delincuentes incluyen MATLAB, R y matplotlib. Estas son todas herramientas hermosas una vez configuradas correctamente, y pueden hacer gráficos de primer nivel, es una pena que los valores predeterminados sean tan malos.
- Durante el análisis de datos con R, ¿qué debería importarnos primero: los valores atípicos o los valores faltantes?
- ¿Es posible obtener una 'posición cuantitativa' o trabajar en 'análisis de datos' después de hacer un trabajo de ingeniero de software durante varios años?
- Algoritmo simple para la detección de tendencias en datos de series temporales?
- ¿Cómo se puede aplicar la ciencia de datos a los negocios de banca privada o gestión de patrimonio en los bancos de inversión?
- ¿Cómo es ser un científico de datos en Instagram?
Debería poder leer las fuentes en cualquier gráfico que vaya a mostrar desde la fila de atrás de cualquier habitación en la que se presente.