Estos son algunos de los obsequios que un profesional de análisis estaría encantado de recibir para mejorar o facilitar su vida profesional:
- Nada puede complacer más a un profesional de análisis que una información limpia y estructurada de una fuente unificada.
- El tamaño importa . Cuanto más grande sea el conjunto de datos, más fácil será llegar a una conclusión.
- Proporcionar una definición clara del problema y apegarse a ella . Desprecio cuando alguien me pide que cambie (o más bien forzar) los resultados para demostrar que su hipótesis es correcta. No todo tiene que ser asombroso. Ninguna idea de los datos es también una idea.
- MEMORIA MEMORIA MEMORIA! Lo último que quiero es esperar cuatro horas para que se ejecute mi script R y luego arroja un error de memoria insuficiente.
- CAJA DE ARENA . Danos un área de sandbox en la base de datos SQL con acceso de lectura / escritura para jugar con los datos a nuestro antojo y crear tablas intermedias. A veces solo queremos explorar los datos y realizar una subconsulta en una tabla de un millón de registros cada vez que cambio mi condición de “dónde” no es un uso eficiente de nuestro tiempo.
- Monitores La mayoría de los equipos proporcionan 2 monitores para que los analistas trabajen. A medida que profundiza en el trabajo, se da cuenta de que debe cambiar constantemente entre pestañas (Outlook, SQL, R, Tableau, Navegador, Explorador de archivos, Slack, Whatsapp, Reproductor multimedia, Bloc de notas, Notas adhesivas). 3 monitores son óptimos para mantener la mayoría de las cosas frente a los ojos.
Aunque me encantaría tener todo esto en mi vida, haría que mi vida fuera mundana muy pronto. Parte del proceso que me impulsa a trabajar todos los días es esforzarme por lograr los puntos 1, 2, 3. Lo disfruto. Hay una razón por la que se llama ‘ensuciarse las manos con los datos’ y no ‘limpiarse las manos con los datos’.
¡Espero que ayude!
- ¿Elige escalar su DW / DB o implementar Hadoop cuando la cantidad de datos o la concurrencia se vuelve muy grande?
- ¿Que competencia de kaggle debería elegir?
- ¿Es útil el nanogrado de Udacity para cambiar el campo de la ingeniería mecánica a la ciencia de datos?
- ¿Cuáles son las razones que explican que Random Forest funcione mejor que los métodos sin ensamblaje?
- ¿Vale la pena pagar el campamento de datos por Python?