¿Cuál es la mejor manera de encajar los equipos de ciencia de datos en una estructura organizacional de desarrollo de productos?

Me pidieron que respondiera esto, y resultó que trabajé como compañero de Deepak Agarwal en LinkedIn durante algunos años, sirviendo como director de ciencia de datos e ingeniería.

Recientemente entregué una presentación sobre “¿Dónde deben poner sus científicos de datos?” y escribió una publicación sobre el tema para O’Reilly. También escribí en coautoría un artículo más largo para First Round Review que analiza los problemas de la organización y otros desafíos relacionados con la efectividad de sus esfuerzos de ciencia de datos.

He visto tres modelos generales para ajustar la ciencia de datos en una estructura organizacional de desarrollo de productos: autónomo, integrado e integrado.

Cada uno tiene sus ventajas y desventajas:

  • Independiente: proporciona autonomía y coloca los datos como de primera clase. Pero puede conducir a la marginación y al aislamiento del equipo de ciencia de datos.
  • Integrado: optimizado para su utilización y asignación flexible. Pero los científicos de datos pueden resentir la falta de autonomía, y la gestión dual es un desafío.
  • Integrado: optimizado para la alineación y la inversión a largo plazo. Pero diluye la identidad de la ciencia de datos y puede crear ineficiencias por falta de reutilización.

No hay una mejor manera que funcione para todas las empresas en todo momento. Es posible que necesite mezclar y combinar, y querrá volver a visitar su enfoque a medida que su organización evoluciona.

No sé cuál es la mejor manera de encajar, pero compartiré las que conozco. Es muy similar a la respuesta de Daniel Tunkelang, solo una perspectiva diferente.

Equipo de ciencia de datos

Este es el equipo típico como una configuración de unidad organizativa. Funciona en gran medida como un equipo de desarrollo, con su propia cartera de pedidos, priorización, etc. Para mí, el gran profesional de esta configuración es que el equipo y su administración tienen una visión completa de todas las solicitudes de datos y pueden priorizar de acuerdo con la estrategia. La gran desventaja de este modelo es que las decisiones de producto pueden no llegar en el momento adecuado para que los equipos de datos actúen. Implica un esfuerzo considerable para articularse con los equipos de productos, pero es mucho más fácil articular con el liderazgo ejecutivo.

Sin equipo de ciencia de datos

Lo que quiero decir con esto es que los profesionales de datos se integran individualmente en equipos de productos. La gran ventaja es que hay alguien completamente asignado al producto. La gran desventaja es que hay poca o ninguna articulación entre científicos de datos, analistas e ingenieros, lo que personalmente considero de suma importancia.

Mezclado

Existe un equipo de ciencia de datos, pero sus miembros pueden ser asignados a productos o incluso ser parte de los equipos de productos. Este modelo es tan bueno como flexible. Lo que quiero decir es que si hay mucha flexibilidad, es un buen modelo. Ser flexible significa que no hay una dirección definitiva en la asignación de profesionales de datos. Puede haber uno completamente asignado, otro asignado por un par de meses, otro no asignado, etc.

En Miniclip tenemos un modelo mixto para analistas de datos. Cada analista de datos tiene una serie de juegos asignados a ellos. Están tan integrados con los equipos de productos como deben ser, pero todo el equipo está muy cerca.

No defiendo que este modelo siempre funcione o que debería funcionar en todos los contextos. Una compañía de un solo producto podría estar mejor con el primer modelo. Una compañía donde los productos son unidades podría ser mejor con el segundo modelo. Si hay muchas personas de muchos equipos que trabajan y hacen la transición entre múltiples productos, el modelo mixto tiene más sentido.

Hemos visto a muchos científicos de datos informando al crecimiento / marketing en lugar de a la organización del producto, lo cual tiene sentido. Al menos en la etapa inicial de un negocio, probablemente deberían centrarse en el trabajo que genera ingresos.

Para las empresas más grandes, pude ver el establecimiento de un equipo de ciencia de datos de servicios compartidos.