¿Cómo es ser un Data Science Manager?

Sobre la gestión de los científicos de datos : establecí equipos de análisis de datos en alta mar y construí centros de minería de datos subcontratados. También he gestionado un equipo de 3 científicos de datos (expertos en PNL y aprendizaje automático), eran algunas de las personas más inteligentes con las que he trabajado. Lo que se necesita para que un equipo de personas excepcionalmente inteligentes tenga éxito es crear espacio para que hagan lo que hacen bien. Esto significa proporcionar a la organización una estructura y un proceso suficientes para que el equipo de ciencia de datos sea productivo y los resultados tengan cierta previsibilidad. Es importante establecer el hecho de que debe haber una tasa de fracaso porcentual y que habrá una cartera de proyectos que abarcará tanto el tiempo como el valor esperado y luego administrará cuidadosamente a sus patrocinadores y partes interesadas. (Lectura adicional: 16 razones por las que los científicos de datos son difíciles de manejar; esto me pareció triste y molesto)

Los siguientes comentarios tratan realmente de configurar la operación de Data Science como una parte valiosa de la organización más grande:

En Patrocinio : las acciones de su equipo desafiarán el status quo en la organización, por lo tanto, necesitará dedicar tiempo a cultivar patrocinadores que lo apoyarán tanto en la adquisición de datos (“entrometiéndolos de las frías manos muertas de los jefes de departamento”) como en la presentación respalde sus ideas con recomendaciones para cambiar lo que podría ser un proceso establecido desde hace mucho tiempo y para las personas que fueron responsables de implementar ese proceso en primer lugar . (Lectura adicional: Requisitos de liderazgo en la empresa predictiva y aplicamos reflejos de lucha o huida no solo a los depredadores, sino también a los datos).

Contratación: escasez actual de recursos, por lo que su presupuesto deberá ser lo suficientemente grande. Alternativamente, encuentre analistas y estadísticos técnicamente expertos y ayúdelos a desarrollar una nueva mentalidad con respecto a los datos (www thedatamindset com) y capacítelos en algunos de los paquetes de análisis avanzados que aprovechan los lenguajes de manipulación de datos como R. (Lectura adicional: son ¿Estás reclutando científicos de datos? Aquí hay una buena descripción del trabajo y la pregunta que debes hacer antes de contratar a un científico de datos: excelente publicación)

En tecnología : probablemente estamos en la cima de la exageración al valor en términos de proveedores que empujan todo tipo de tecnología al problema. Hay muchas cosas que se pueden hacer con algunas tecnologías básicas y código abierto, antes de que su organización invierta mucho, vea lo que puede hacer a bajo costo: no solo piense en los costos de adquisición y mantenimiento, recuerde el costo de capacitar recursos en tecnologías que se mueven rápidamente (Lectura adicional: puede hacer mucho con herramientas de código abierto cuando trabaje con Big Data, considere antes de gastar y 10 razones por las que no necesita Hadoop para su análisis de datos – Las alternativas deben probarse antes de usarlo)

En Compromiso : Deberá poner algún proceso alrededor de este, para trabajar estrechamente con la empresa para desarrollar proyectos para analizar y ganar su confianza y participación durante el proceso de análisis. Involucrarlos en todo momento hará que entregar su conocimiento y hacer que se pruebe e implemente mucho más fácilmente. Cuando se acerque a las áreas de negocios, encontrará que a menudo están desatendidas para los informes y análisis básicos de la empresa, por lo que puede generar rápidamente confianza y credibilidad al entregar algunas métricas básicas y luego cortar los datos de diferentes maneras. A este respecto, también asumirá el papel de vendedor, vendiendo las capacidades de su organización al comprender los dolores de sus clientes y luego creciendo a partir de esa relación inicial (Lectura adicional: las empresas están invirtiendo como locos en Big Data. Pero muchos de ellos no tienen mucho que mostrar por sus esfuerzos, posiblemente nunca lo harán, y este es uno de los mejores iniciadores en la estrategia de datos que he visto hasta ahora: Big Data, análisis y el camino de las ideas al valor)

Sobre gobernanza : no subestimes esto, puede detenerte. En primer lugar, existe la calidad de los datos, si su organización no ha resuelto la calidad de los datos y la gestión de los datos maestros, descubrirá que su equipo está girando sobre sus ruedas mientras trata de limpiar y armonizar los datos; sí, hay herramientas, pero en realidad nada es 100 % automatizado, por lo que perderá mucho tiempo si esto no se maneja por adelantado. En segundo lugar, está la seguridad cibernética: las grandes empresas están enloqueciendo en este momento debido a las brechas de datos y el análisis de datos basado en la nube presenta no solo un agujero potencial en el firewall, sino también la sensibilidad comercial de las ideas. Involucre a los equipos de TI y Legal al comienzo del proyecto para asegurarse de que tenga sus bendiciones. (Lectura adicional: el 80% del tiempo total dedicado a proyectos de Analytics es para recopilar y limpiar conjuntos de datos y la mayor violación de HIPAA: los piratas informáticos roban datos sobre 4.5 millones de pacientes de sistemas de salud comunitarios)