¿Cuáles son los desafíos de construir un equipo de datos en una startup?

Crear un equipo de ciencia de datos generalmente es difícil porque es una gran inversión inicial que es difícil de aprovechar adecuadamente. El negocio lucha por comprender cómo el equipo está proporcionando valor, mientras que los científicos de datos también luchan por mostrar su valor al negocio. Muchas veces esto se debe a que los equipos de ciencia de datos se centran en el código y en la creación de modelos con poca o ninguna consideración sobre cómo poner su trabajo en manos de la empresa de manera oportuna y útil.

He descubierto que el truco para construir un equipo que brinde valor al negocio es no enfocarse realmente en el modelado, demasiado. En cambio, estas son las áreas que he visto son los impulsores más críticos para construir un equipo de ciencia de datos exitoso (y los más difíciles de dominar):

1) Estar en el negocio de las ventas

  • No esperes que nadie en la organización entienda exactamente el valor que aportarás y las cosas específicas en las que vas a trabajar para aportar ese valor. Es su trabajo arrojar luz sobre las áreas en las que puede ayudar a la empresa a innovar y aprovechar la ciencia de datos para tomar mejores decisiones comerciales o impulsar el producto. Esto se debe a que usted es el que está metido hasta la rodilla en los datos, por lo que podrá ver las oportunidades en las que los datos pueden ayudar y llevarlos al negocio
  • Debe ser capaz de elaborar argumentos concretos y convincentes sobre por qué aportará valor; esto no puede ser un ejercicio teórico. Esto significa que debe usar datos de muestra, restringir su ejemplo a un subconjunto muy pequeño o caso de uso único, y probar su caso con un pequeño prototipo y luego construir la solución escalable una vez que haya comprado
  • Y lo más importante, usted es la cara de la ciencia de datos en su empresa: tiene que creer, en esencia, que lo que está haciendo ayudará a llevar el negocio al siguiente nivel. Nadie más que tú va a hacer esto: tienes que ser el campeón de la ciencia de datos

2) Aprender a ser intérprete

  • Una vez que la empresa comprende lo que puede hacer, a menudo no sabrá cómo usarlo adecuadamente. Recibirá un montón de solicitudes y puede terminar entregando cosas que en última instancia no son útiles. El “5 por qué” es un concepto extremadamente básico que pensarías que es obvio, pero no puedo contar la cantidad de veces que he visto a los científicos de datos repentinamente contraer el síndrome del “sí-hombre / mujer”, en lugar de preguntar por qué se necesita algo y el problema que realmente resolverá, se van con sus órdenes de marcha para simplemente entregar.
  • El problema más inmediato es que trabajas en algo que no se usa y que desperdicia el tiempo de todos. Pero el problema más importante que se agrava con el tiempo es que el negocio comienza a cuestionarse qué valor realmente está proporcionando su equipo de ciencia de datos porque nunca se llega a proporcionar soluciones que realmente resuelvan el problema real. Entonces, usted y su equipo deben ser REALMENTE buenos para identificar cuál es realmente el problema y la oportunidad.

3) Pensar como un CEO

  • Debe asegurarse de que está trabajando en lo que realmente impulsará el negocio: objetivamente, ¿qué es lo mejor para el negocio? Esto significa aprender a decir “No” y practicar. Una excelente manera de hacerlo es jugar un rol; lleve a su equipo a una habitación y pídales que practiquen preguntar los 5 por qué y luego cuándo decir que no. Mi pregunta favorita es “¿Qué decisión se tomará con el trabajo que voy a hacer?”. No creerá la cantidad de veces que la respuesta ha sido “bueno, sería bueno saber” o “Yo”. No estoy seguro de que tomemos una decisión diferente ”. ¿Qué cambiará realmente en función de estos hallazgos, es decir, su socio comercial realmente cambiará la forma en que están haciendo algo? También está utilizando la respuesta a la pregunta para darle un sentido de prioridad: ¿Vamos a cambiar una forma fundamental de generar ingresos? ¿Vamos a cambiar una simple campaña de correo electrónico?
  • De todas las cosas que está haciendo, debe aprender a priorizar lo que es una prioridad más baja o más alta para el negocio como TODO. Esto significa la capacidad de comprender la perspectiva comercial y ser una parte completamente objetiva en la sala. Otro punto que haré sobre esto es que verá que este concepto tiene diferentes niveles de dificultad dependiendo de dónde se sienta en la organización. Por ejemplo, si usted es un equipo centralizado, podría estar priorizando el trabajo entre Ventas vs Marketing vs Producto; estas compensaciones serán difíciles de realizar. Pero si está integrado, por ejemplo, dentro del marketing, es posible que tenga que aprender la capacidad de ver las cosas a través de una lente más estratégica sobre qué trabajo afectará a la empresa en lugar de dejarse atrapar por las necesidades tácticas del día a día. El motor de marketing.

4) Convertirse en el mejor amigo de los ingenieros de datos

  • Lo interesante aquí es que existe una dependencia de Ingeniería sin la cual no puede hacer su trabajo. Lo ayudan a obtener acceso a los datos, lo configuran con las herramientas y la infraestructura para hacer su trabajo, y generalmente hacen que lo que hace sea útil para el negocio al ponerlo en producción (es decir, integrando su trabajo en herramientas de negocios, construyendo ejecuciones programadas regularmente) e implementar modelos en un producto). Pero generalmente están desconectados en gran medida del negocio y el impacto real que está teniendo su trabajo. Descubrí que una de las cosas más poderosas que puedes hacer es guiarlos a través de tu día a día para obtener empatía, literalmente hacer que se sienten contigo. Deben comprender cómo hace su trabajo, cómo está tratando de satisfacer las demandas del negocio y mostrarles sus flujos de trabajo para que realmente entiendan por qué necesita las herramientas que necesita.
  • También necesitan ver que no solo estás caminando todo el día con la cabeza en las nubes, pensando en los grandes problemas que deben resolverse: estás impactando los objetivos comerciales

Entonces, en resumen, deja de buscar unicornios. Le costarán mucho dinero, es realmente difícil mantenerlos felices, y no estoy seguro de que realmente existan. El conjunto realmente es mayor que la suma de sus partes, así que busque personas que sean lanzadores de ventas naturales, intérpretes de problemas, pensadores de mini-estrategas / CEO o socialites de Ingeniería de Datos. Esto lo ayudará a desarrollar experiencia individual y crear influencia en un pequeño equipo en una startup.

La construcción de una operación de ciencia de datos se trata de personas, procesos y tecnología. En lugar de utilizar los escasos recursos de ingeniería para construirlo usted mismo, especialmente en una startup, hay mucho que una plataforma de ciencia de datos puede hacer para ayudarlo a centrarse en las cosas que realmente aportan valor y ponerlo en marcha rápidamente. En mi experiencia pasada como científico de datos en el ejército durante 9 años y luego de construir la organización de ciencia de datos en Eventbrite, consideraría una plataforma de ciencia de datos (en total divulgación, trabajo para Domino Data Lab).

Todos los desafíos están increíblemente articulados por Kimberly Shenk y Monica Rogati.

Me gustaría centrarme un poco más en los roles y responsabilidades de un Científico de Datos en una nueva empresa para ayudar a superar muchos de los desafíos mencionados anteriormente. Estaba leyendo el libro de DJ Patil sobre “Creación de equipos de DataScience” y creo que los ha descrito bastante bien.

  • Ayudando a diseñar políticas correctas en toda la organización: un DataScientist debe buscar constantemente la forma más rápida de identificar la métrica clave que podría ayudar a la empresa a comprender mejor el problema que creen que los datos podrían responder. Sí, la mayoría de las veces, es principalmente una idea desde el punto de vista empresarial, y validar si la idea funcionaría con los datos a los que uno tiene acceso, es lo más importante. Siempre, piense cuál es la forma más rápida de operacionalizar los análisis de una manera que uno pueda comunicar los hallazgos a los demás. Fallar rápido es lo más importante.
  • Apoyo a iniciativas de producto y marketing: identificar formas de ayudar al producto y al marketing a darse cuenta de la utilidad de los datos al narrar historias vinculadas a su caso de uso podría ser muy útil.
  • Servicios y operaciones de datos (almacenamiento e infraestructura de datos): en una puesta en marcha, las cosas se mueven rápido. Los científicos de datos deben ser proactivos para asegurarse de que estén involucrados cuando se toman decisiones con respecto a la elección del servicio de datos o las decisiones de operación de infraestructura. Esta colaboración temprana entre DataScience y Data Services and Operation podría ayudar a evitar la fuga de datos relacionada con problemas o la complejidad de la Infraestructura que podría convertirse en un obstáculo para ser una organización impulsada por datos. Para la puesta en marcha, podría ser aún más importante mantener la arquitectura flexible de tal manera que puedan despegar lo antes posible.
  • Organización y alineación de informes: por lo general, hay 3 formas en que se podría organizar un equipo de DataScience
  • Estructura centralizada: un grupo neutral que resuelve el problema en toda la organización.
  • Estructura descentralizada: los científicos de datos se distribuyen por toda la organización.
  • Estructura híbrida: donde es una mezcla de lo anterior 2. DJ Patel ha cubierto esto brevemente con algunos ejemplos en la Sección: “Alineamiento organizacional y de informes”. Está bien articulado por David Dietrich en la siguiente presentación también ( https://www.slideshare.net/emcac …).

No hay una bala de plata sobre cómo estructurar el equipo, pero lo más importante es permitir una comunicación constante en todas las áreas funcionales. Creo que esta debería ser la tarea más importante de un DataScientist: comunicación y colaboración entre funciones.

Tener la mentalidad correcta al asumir un desafío como Científico de Datos teniendo en cuenta los desafíos ya identificados por otros podría ayudar a asegurar que su Start-Up tenga un buen comienzo.

Crear un buen equipo de datos es un desafío en cualquier lugar, pero hay algunas preguntas que las nuevas empresas en particular deben tener en cuenta:

  1. Objetivos: ¿Por qué necesita un equipo de datos? ¿Hay objetivos concretos para que trabajen o desea apaciguar a sus inversores? ¿Qué esperas que hagan en un año?
  2. Roles y composición del equipo: ¿para qué rol debo contratar, dados mis objetivos? ¿Ingeniero de datos, científico de datos, analista, comunicador de datos? ¿Cuál es la composición final de mi equipo hacia la cual estoy construyendo? ¿A qué nivel de antigüedad estás apuntando?
  3. Líder de equipo: ¿Tengo un líder de equipo fuerte que pueda identificar, atraer y reclutar científicos de datos excelentes y que pueda trabajar con los fundadores para definir la estrategia de datos de la compañía? Espere que pasen el 50% del tiempo reclutando y entrevistando, al menos inicialmente.
  4. Tiempo: ¿ Cuándo debería contratar a mi primer científico de datos? ¿Hay suficiente trabajo para ellos si aún no tengo un montón de datos? Pero si no tengo un científico de datos, ¿cómo sé qué datos recopilar, cómo y por qué?
  5. Org: ¿Dónde encajará el equipo de datos en su organización? La respuesta dependerá de sus respuestas a las preguntas anteriores.
  6. Cultura de datos: ¿está preparada su empresa para tratar los datos como ciudadanos de primera clase?
  7. Infraestructura: ¿Pueden los científicos de datos hacer su trabajo tan pronto como los contrate, o tienen que configurar primero su infraestructura de datos? Esto no es un problema en sí mismo, a menos que exista un desajuste de expectativas o que esté contratando para el rol incorrecto / en el orden incorrecto.
  8. Reclutamiento y retención: los científicos de datos tienen demanda. ¿Qué ofrecen que otros no pueden? ¿Oportunidades de aprendizaje únicas, datos únicos, misión social, crecimiento profesional? No cebe ni cambie: todo el mundo lo pasará mal si tergiversa el tipo de trabajo que van a hacer en el momento de la oferta. Esto es mucho más fácil si pensabas en 1–7.

Un mal escenario típico: los fundadores saben que necesitan un “juego de datos” (o peor, “juego de IA”); Los inversores y los clientes siguen preguntando sobre el aprendizaje automático (o peor, el aprendizaje profundo). El fundador contrata a un científico de aprendizaje automático, a menudo un recién graduado, y les dice que construirán modelos de aprendizaje automático. Los científicos llegan allí: no hay infraestructura, no hay ETL, los datos son un desastre porque nadie intentó hacer nada con ellos todavía, la instrumentación no existe, excepto las operaciones, todo lleva una eternidad, los ingenieros están trabajando en sus sprints y su paciencia se está agotando. . Todos están frustrados: los científicos porque no pueden hacer el trabajo para el que fueron contratados, los ingenieros porque tienen que tomarse un tiempo de su trabajo para hacer un “trabajo duro” y extraer datos del producto para el científico que se sienta y no hace nada útil. , fundadores porque el científico de datos ni siquiera produjo un tablero decente, y mucho menos esta máquina mágica aprendiendo que todos siguen entusiasmados. El científico renuncia y la startup se “quemó”; El siguiente científico (si lo hay) hereda las guerras culturales y el escepticismo.

Sin embargo, esto no le sucederá a tu startup porque pensaste en las preguntas anteriores con anticipación.