Un científico de datos sin datos es como una impresora sin tinta: llena de capacidad pero incapaz de funcionar sin la materia prima requerida.
Pero las impresoras necesitan más que tinta para funcionar bien . Así como una impresora tiene la tarea de imprimir contenido útil en lugar de rociar tinta al azar en una página, los científicos de datos también necesitan casos de uso y proyectos bien formados para investigar.
El arte de traducir los problemas empresariales en casos de uso de la ciencia de datos, y obtener los datos necesarios para hacerlo, es una habilidad crucial pero subestimada. Y sospecho que la falta de esta habilidad es la causa de muchas fallas en las inversiones en ciencia de datos. Hacer que los altos ejecutivos contraten a un equipo de científicos de datos para declarar con mucha fanfarria “¡adelante y haga IA y aprendizaje automático!” No es necesario ni suficiente.
- ¿Los desarrolladores de iOS y Android tienen más demanda debido a Data Science?
- ¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?
- Al ejecutar una prueba A / B, ¿durante cuánto tiempo ejecuta el experimento?
- ¿Cómo afectan los big data, el aprendizaje automático y la ciencia de datos al campo de la educación?
- ¿Cuáles son las diferencias entre una base de datos, data mart, data warehouse, un lago de datos y un cubo?
Después de pasar por esta búsqueda de casos de uso y adquisición de datos docenas de veces con mi equipo, aquí hay cinco cosas que he encontrado útiles para obtener acceso a los datos:
- No presumas de tecnología: presume de potencial para resolver problemas. Un ejecutivo de la cadena de suministro no está particularmente interesado en su árbol impulsado por gradiente extremo. Pero sus ojos pueden iluminarse cuando muestra un poco de código de optimización para solucionar su problema de exceso de inventario.
- Las visualizaciones de datos atractivas son tu amigo. Hay análisis que son estadísticamente sólidos, analíticamente robustos e innovadores en la implementación de bibliotecas de aprendizaje automático de vanguardia. Pero a veces nada de eso es importante para muchos ejecutivos senior, y (perdón por decir) gráficos bonitos e interfaces de usuario agradables lo llevarán a donde el código python más elegante no puede.
- Alinee cada proyecto con la estrategia comercial. Existen múltiples proyectos posibles en cada departamento comercial. Pero los que finalmente recibirán soporte son generalmente los que tienen un impacto más directo y significativo en las métricas comerciales.
- Ejecute sesiones de aprendizaje abiertas utilizando datos generados para aproximar conjuntos de datos reales. Hay mucho interés en la ciencia de datos, el aprendizaje automático y la inteligencia artificial en este momento. Representa una oportunidad para educar y desestimar, mientras ‘pesca’ para proyectos. He descubierto que las demostraciones y sesiones de aprendizaje más útiles son las que se basan en conjuntos de datos que son similares a los que usa la audiencia: el resultado deseado es ese momento ‘aha’ donde la audiencia pasa de ‘esto es interesante’ a ‘ oye, ¿podrías hacer eso por mí?
Y más importante:
- Comunícate con empatía con tu audiencia. Comprenda que muchos conceptos que los científicos de datos usan en su trabajo diario pueden ser ajenos a la mayoría de sus colegas. Deje atrás el discurso académico, resuma cualquier jerga técnica y sea simple y conciso.