Big data es utilizado por los científicos de datos. ¿Quién traduce esta información para que la gerencia mejore o desarrolle estrategias de gestión y operaciones?

Ese suele ser el trabajo del científico de datos y la diferencia entre ellos y un estadístico o analista puro.

A veces hay roles en capas dentro de una unidad para permitir que los programadores programen, seleccionen y consulten datos de manera relevante y que los consultores perspicaces se superpongan para gestionar y tomar sus resultados y aplicarlos al mundo real.

Sin embargo, un científico de datos generalmente comienza con un problema del mundo real e investiga a través de los datos para preparar hallazgos y traducirlos en una historia relevante para la situación en la que están explorando / buscando una solución. Normalmente comienzan con el espacio del problema y exploran desde allí .

Un científico de datos puede no ser un estadístico. Les ayudará si lo son, pero puede que no lo sean. Si lo son, tendrán la ventaja de poder discernir entre lo que es apropiado analizar con qué tipo de análisis o estadísticamente relevante en los resultados a través del conocimiento.

Por otro lado, un estadístico a veces puede buscar una solución pura del problema mediante la aplicación de las matemáticas cuando se requiere algo más pragmático para lograr un resultado comercial dentro de un entorno restringido.

Un ejemplo que recuerdo fue la solución del equipo del centro estadístico de excelencia a un problema de análisis de importancia para una campaña de marketing en línea donde estaban probando muchas celdas de oferta promocional para audiencias aleatorias y utilizando bootstrapping para aumentar el tamaño de las muestras mientras buscaban aumentar los niveles de confianza. A través de una explicación cuidadosa, mostramos cómo esto era defectuoso como un enfoque al pasar por su enfoque y aplicarlo a la realidad.

Nuestro equipo de ciencia de datos decidió utilizar los datos reales dentro de un sólido marco de prueba y medición que pudimos incorporar a un conjunto automatizado de medición de rendimiento de campaña y lanzar a nivel mundial con velocidad y escala.

En este momento hay un fenómeno interesante en torno a los “Científicos de datos” y lo que se espera que haga un individuo. Eche un vistazo a algunas ofertas de trabajo para “Científicos de datos”. Verás bastantes que parecen estar buscando unicornios que puedan:

  • trabajar con clientes para comprender y descomponer el problema comercial subyacente
  • traducirlo en algo que responda mediante técnicas de “big data”
  • recopilar y transformar datos para admitir la técnica de “big data”
  • realizar análisis estadísticos y de aprendizaje automático para desarrollar modelos útiles
  • implementar modelos en aplicaciones de línea de negocio
  • traducir los resultados en algo que los gerentes de C-suite y línea de negocios puedan entender

Esta es una tarea bastante difícil ya que el conjunto de habilidades requeridas abarca varias disciplinas (conocimiento de dominio específico de la industria, habilidades interpersonales, conocimiento de negocios, aprendizaje automático, estadísticas, ETL, base de datos, bibliotecario, programador, diseño de experiencia de usuario, visualización y habilidades de presentación )

Has encontrado algo con la idea de que es probable que una sola persona no realice todas estas funciones. Adoptamos un enfoque de equipo para los proyectos de “ciencia de datos”, con cierta superposición en los conjuntos de habilidades, por supuesto. En nuestro caso, la persona que trabaja con el cliente en la parte frontal para comprender y descomponer el problema generalmente trabaja con el cliente en la parte posterior para traducir el aprendizaje de un ejercicio de modelado en acción de línea de negocio, por supuesto, con apoyo del resto del equipo

Puede delinear los conjuntos de habilidades requeridos que son necesarios y suficientes para un ejercicio de “big data”, pero no siempre puede asignarlos claramente a las personas. Al final, hace un balance de su personal, asigna roles que juegan con sus fortalezas y llena los vacíos con personal contratado o regular.

Gracias por la gran pregunta: el tema se pasa por alto a riesgo propio.

Los científicos de datos también usan datos pequeños. Ahora que saqué esto del camino …

Se espera que los científicos de datos puedan comunicarse claramente con los gerentes de productos, las partes interesadas, c-suite y cualquier otra persona involucrada en los contextos donde crean valor.

Los propios científicos de datos .

En realidad, la comunicación (de los resultados de la investigación) es una de las principales responsabilidades de los científicos de datos en la actualidad.

Bien podría existir el peligro de que si la persona que ejecuta el análisis no comprende el caso comercial y no puede explicar lo que ha hecho y los resultados que obtuvo para el negocio, puede ejecutar análisis espurios y crear modelos sin sentido. . A menudo me he sentido frustrado por la mala traducción de las solicitudes de los clientes a través de intermediarios, y solo me he sentido satisfecho con los análisis en los que he tenido contacto directo con el cliente y he entendido sus necesidades.

El científico de datos hace la presentación a la gerencia.