¿Cómo puede un científico de datos negociar con otras partes para obtener acceso a sus datos?

Un científico de datos sin datos es como una impresora sin tinta: llena de capacidad pero incapaz de funcionar sin la materia prima requerida.

Pero las impresoras necesitan más que tinta para funcionar bien . Así como una impresora tiene la tarea de imprimir contenido útil en lugar de rociar tinta al azar en una página, los científicos de datos también necesitan casos de uso y proyectos bien formados para investigar.

El arte de traducir los problemas empresariales en casos de uso de la ciencia de datos, y obtener los datos necesarios para hacerlo, es una habilidad crucial pero subestimada. Y sospecho que la falta de esta habilidad es la causa de muchas fallas en las inversiones en ciencia de datos. Hacer que los altos ejecutivos contraten a un equipo de científicos de datos para declarar con mucha fanfarria “¡adelante y haga IA y aprendizaje automático!” No es necesario ni suficiente.

Después de pasar por esta búsqueda de casos de uso y adquisición de datos docenas de veces con mi equipo, aquí hay cinco cosas que he encontrado útiles para obtener acceso a los datos:

  • No presumas de tecnología: presume de potencial para resolver problemas. Un ejecutivo de la cadena de suministro no está particularmente interesado en su árbol impulsado por gradiente extremo. Pero sus ojos pueden iluminarse cuando muestra un poco de código de optimización para solucionar su problema de exceso de inventario.
  • Las visualizaciones de datos atractivas son tu amigo. Hay análisis que son estadísticamente sólidos, analíticamente robustos e innovadores en la implementación de bibliotecas de aprendizaje automático de vanguardia. Pero a veces nada de eso es importante para muchos ejecutivos senior, y (perdón por decir) gráficos bonitos e interfaces de usuario agradables lo llevarán a donde el código python más elegante no puede.
  • Alinee cada proyecto con la estrategia comercial. Existen múltiples proyectos posibles en cada departamento comercial. Pero los que finalmente recibirán soporte son generalmente los que tienen un impacto más directo y significativo en las métricas comerciales.
  • Ejecute sesiones de aprendizaje abiertas utilizando datos generados para aproximar conjuntos de datos reales. Hay mucho interés en la ciencia de datos, el aprendizaje automático y la inteligencia artificial en este momento. Representa una oportunidad para educar y desestimar, mientras ‘pesca’ para proyectos. He descubierto que las demostraciones y sesiones de aprendizaje más útiles son las que se basan en conjuntos de datos que son similares a los que usa la audiencia: el resultado deseado es ese momento ‘aha’ donde la audiencia pasa de ‘esto es interesante’ a ‘ oye, ¿podrías hacer eso por mí?

Y más importante:

  • Comunícate con empatía con tu audiencia. Comprenda que muchos conceptos que los científicos de datos usan en su trabajo diario pueden ser ajenos a la mayoría de sus colegas. Deje atrás el discurso académico, resuma cualquier jerga técnica y sea simple y conciso.

Obtener los datos correctos es una parte clave de la ciencia de datos. Aprender a comprender y evitar las limitaciones de los datos disponibles. Planificación de la estrategia de recolección de datos. Encontrar y usar fuentes públicas relevantes. Estas son todas las tareas comunes de ciencia de datos.

Las negociaciones no se encuentran comúnmente en un conjunto de habilidades de ciencia de datos. Y realmente estás haciendo una pregunta de negociación general, ¿cómo puedo convencer a alguien para que me dé algo? La respuesta obvia es que les ofreces algo.

Presumiblemente no tiene dinero para simplemente comprar datos, por lo que presumiblemente venderá sus habilidades Rad como científico de datos. Quizás con alguna tecnología genial que solo tú tienes.

Con la historia correcta, muchas compañías le permitirán acceder a datos de herederos para un POC protegido por nada más que su firme apretón de manos y un NDA genérico. Si termina mostrando un valor real, puede ganar dinero real. Una vez que haya creado un nombre para usted, omita los estudios gratuitos de POC y reciba el pago desde el primer día. Sin embargo, poder extraer realmente el valor de los datos es un requisito clave aquí. Vender promesas hace que la mayoría de las empresas planifiquen mal a largo plazo.

Gracias por hacer tu pregunta:

¿Qué es un científico de datos sin datos? ¿Cómo puede negociar con otras partes para obtener acceso a los datos?

Ahí radica el dilema. Incluso dentro de una empresa, es difícil obtener datos que sean lo suficientemente originales. Los datos son capital intelectual y están estrechamente protegidos. Para obtener datos, el propietario tiene que ver un beneficio. ¿Cuál es su retorno monetario? ¿Cuál es su ventaja que obtendrán por darte acceso? Estas preguntas se relacionan independientemente de quién posee los datos y si son internos o externos.

Parte de la vida es negociación. Es por eso que debe haber una aceptación organizativa e infraestructura para que un científico de datos prospere. Literalmente, puede preguntar algunos lugares y le darán datos (API).

Incluso puede crear sus propios datos utilizando el raspado web, por ejemplo
Uso de Scrapy para construir su propio conjunto de datos – Hacia la ciencia de datos – Medio