¿Por qué hay tanto énfasis en la ciencia de datos, pero no en la estrategia de datos?

Tom Deutsch señala un problema interesante, que una estrategia de datos es un tema amplio, a menudo gallina y huevo con los datos en sí y la aceptación institucional. El mejor desglose que he visto es de un informe reciente de McKinsey, que desglosa cuatro áreas en las que un equipo debe trabajar al mismo tiempo para implementar una estrategia de datos. No solo 1) las características sin formato deben existir que sean significativas para el dominio, sino 2) la presentación y el análisis de las características tienen que alinearse con las prácticas comerciales existentes, mientras que 3) la sobrecarga para trabajar con nuevas tecnologías debe ser práctica y 4) el equipo tiene o puede contratar personas que no solo ven, sino que pueden implementar el panorama general, porque este es un espacio nuevo y no hay muchos precedentes.

Además de tener que moverse en varias áreas a la vez, también hay problemas de confianza. Cuanto más compleja se vuelve una estrategia de datos, más difícil le resulta a alguien confiar en ella. El siguiente gradiente es muy simplista, pero muestra que el salto de baja complejidad, donde el foco está casi completamente en los datos, a una mayor complejidad tiene un salto inverso de alta confianza a una confianza significativamente menor.

  • (baja complejidad, alta confianza) Descripciones descriptivas y detalladas de lo que sucedió. Estos son útiles para la rendición de cuentas, auditoría, indicadores imparciales * de qué tan bien está funcionando algo. A menudo, estas estrategias son para presentar una visión más profunda de quién, por qué o cómo está sucediendo algo, generalmente para aislar las cosas que claramente no deberían hacerse o aislar las cosas que se beneficiarían de hacerlo de manera diferente . Las herramientas aquí son buenos datos para trabajar y cualquier herramienta de BI disponible: Excel, Tableau (producto), personalizado, etc. El análisis se puede hacer ad-hoc, de manera única, para cortar y comparar los datos. , a menudo impulsado por algún problema interno actual, decisión (por ejemplo, planificación presupuestaria) o iniciativa.
  • (complejidad media, poca confianza) Mapas de ruta prescriptivos de qué hacer. Estos son útiles para la asignación de recursos y el diseño de iniciativas, ya que las proyecciones pueden probar diferentes escenarios hipotéticos, basados ​​en datos históricos, y aislar el “20%” que tendrá el mayor impacto. A menudo, estas estrategias son para producir artefactos que pueden aumentar la toma de decisiones, permitiendo a los gerentes probar escenarios hipotéticos más complejos. Las recetas deben tener niveles de confianza incorporados, y dependiendo de los datos y la compañía, cada receta puede ser válida solo por unas semanas antes de que los gerentes deben reevaluar la situación, a menudo repitiendo el proceso aumentado de qué. Las estrategias prescriptivas permiten a los gerentes moverse más rápido con más versatilidad.
  • (alta complejidad, sin confianza ) Algorítmico , algunas asignaciones de recursos y planificación se manejan automáticamente. Estos son útiles para implementar cambios complejos a largo plazo donde se necesita retroalimentación iterativa y ajustes. Esencialmente, estas estrategias combinan estrategias prescriptivas con un tomador de decisiones algorítmico, que tiene algún objetivo, por ejemplo, maximizar un indicador descriptivo. La ventaja de la estrategia algorítmica es que tiene la calidad imparcial * de la estrategia descriptiva y es capaz de micro-administrar todos los indicadores para llegar a una solución razonable. A nivel de toda la empresa, la capacidad humana para administrar datos es de órdenes de magnitud (al menos 3 para las grandes empresas) peor que la capacidad algorítmica. Por ejemplo, un gerente puede contratar 100 consultores para recopilar y analizar minucias con una cobertura del 1%, mientras que una estrategia algorítmica puede lograr una cobertura del 100%.

El problema de la confianza a menudo elimina todas las estrategias, excepto la primera, la que es casi un 100% de ciencia de datos, fuera de la mesa. A menos que el equipo ya esté empeñado en impulsar estrategias más arriesgadas y gratificantes, que posiblemente cambien el juego en sus sectores, es probable que la primera estrategia sea aceptada de facto.

También creo que es razonable esperar más de 5 años de trabajo para obtener un conjunto de características decente para su dominio en conjunto para habilitar la estrategia descriptiva.

Para reunirlo, algunas razones por las que los equipos centran más la ciencia de datos que la estrategia de datos son que 1) es una barra alta que requiere mucho enfoque, 2) tiene un rendimiento visible para todas las estrategias y 3) a menudo se convierte en la raíz del plan, porque demostrar un archivo de Excel con números significativos es más convincente que mostrar un plan sin resultados significativos. El último punto se llama teoría de la pepita , que una pepita de resultado cuantitativo puede ayudar a las personas a entretener al “gran si” más que la mayoría de las otras cosas que su equipo puede producir. La analogía es como abrir tu armario y ver a un extraterrestre allí. Probablemente puedas imaginar una docena de escenarios que van desde Encuentros Cercanos hasta ET y Guerra de los Mundos, solo basados ​​en ver en carne y hueso a ese alienígena.

Sería interesante ver un plan de datos basado en una estrategia de datos. Mi intuición es que un plan de estrategia primero sería más difícil de obtener la aceptación institucional que un plan de datos primero.

De McKinsey & Company – Big data: la próxima frontera para la innovación, la competencia y la productividad [1] Más oscuro significa que el área podría ser más fácil de alcanzar que en sectores donde es más claro

[1] http://www.mckinsey.com/mgi/publ…

Esa es una pregunta perspicaz: después de todo, lo que realmente importa son los resultados, ¿verdad? Cualquier ciencia de datos está limitada por la calidad y disponibilidad de los datos, y esos son aspectos clave de una estrategia de datos.

Creo que, hasta cierto punto, esta es una función del mercado en el que se encuentra, es decir, la etapa inicial. Muchos clientes están trabajando solo para comprender las tecnologías nuevas / emergentes, y mucho menos cómo pueden / deberían aprovecharlo para impulsar resultados estratégicos. Tendremos algunos baches de velocidad en el camino hacia eso, y también veremos que los requisitos sobre la calidad / linaje de los datos, etc., comienzan a ser importantes a medida que estas iniciativas pasan de la prueba a la producción y del departamento al núcleo.

Deseoso de ver lo que otros tienen que decir aquí …

Los datos se mueven, de lo que alguna vez fue una discusión técnica a una conversación de negocios. Así es como definimos la esencia de la “estrategia de datos”.

La ruta evolutiva de los datos pasó por almacenes de archivos y procesamiento de datos, bases de datos relacionales e informes, almacenes de datos y BI, y hoy se encuentra en Big Data y Data Science.

Uno de los componentes en cada una de estas etapas se esfuerza por proporcionar calidad y disponibilidad (como dice Tom Deutsch) y el otro por crear ideas significativas que se pueden utilizar para crear valor comercial.

El analista o científico de datos está ahí para hacer las preguntas. La empresa implementará las respuestas. Y, en el medio, tenemos las nuevas herramientas que mueven los datos, los preparan para el análisis y proporcionan los datos a los usuarios finales.

Relativamente pocas compañías están tratando datos estratégicamente donde:

  • Los datos se están utilizando para transformar el negocio, cambiando radicalmente los modelos de negocio, las propuestas de los clientes y el producto fundamental que ofrece la empresa.
  • Los datos se consideran junto con los procesos y sistemas, donde los productos o subproductos de datos se diseñan al mismo tiempo que los procesos que generan valor en la actualidad.
  • Los datos se tratan como un activo corporativo, donde la calidad de los datos, el aprovisionamiento y la moneda ahora son parte de la mentalidad organizacional

En este momento hay gloria en la ciencia de datos, mucha inversión en tecnología y recursos y grandes casos de ROI para la habilitación de la ciencia de datos. Hay muy poco glamour en la estrategia de datos, la limpieza, el gobierno, la seguridad, la privacidad y el aprovisionamiento son males necesarios y los problemas más suaves relacionados con el diseño de procesos y la cultura de datos.

Referencias

Página sobre Hbr!
10 elementos clave de su estrategia de datos
¿Qué es la ciencia de datos?
Construyendo cadenas de suministro para Big Data
Desarrollo de productos de datos, una metodología
Adoptando una mentalidad de datos en una organización minorista
Rock Paper Scissors para empresas digitales
Alquimia de datos | MoData

More Interesting

¿Cómo es hacer un doctorado en aprendizaje automático / minería de datos / big data en una escuela de negocios?

¿Existe una correlación entre big data y la sociedad de red?

¿Cómo deben usarse los grandes datos?

Si quiero desarrollar herramientas analíticas en tiempo real para mi sitio web y agregar recomendaciones basadas en objetivos en tiempo real, ¿cuál entre PredictionIO y EasyRec sería una mejor opción? ¿Hay otras opciones mejores (de código abierto) disponibles aparte de estas dos?

¿Cuáles son las aplicaciones de Data Science donde no hay datos recopilados previamente?

¿Puedo obtener un trabajo de ciencia de datos después de completar el curso de certificación junto con un proyecto en él?

¿Cómo es ser un científico de datos en McKinsey?

¿Se reúnen algunas ciencias de datos en Bangalore 2016?

¿Cuál es el trabajo que hacen los científicos de datos?

¿Cómo se compara el programa inmersivo de ciencia de datos de la Asamblea General con los cursos de ciencia de datos, inteligencia artificial y aprendizaje automático / aprendizaje profundo de los MOOC?

¿Cuál es su opinión sobre el curso de ciencia de datos de la Asamblea General?

¿Puedo convertirme en un científico de datos sin aprender Python, pero solo con conocimientos de programación Java y aprendiendo el lenguaje R?

¿Cuál es la diferencia entre procesamiento de datos y análisis de datos?

¿Cuál es el mejor curso de especialización en ciencias de datos en línea?

¿Cuál es el mejor libro para aprender Python para la ciencia de datos?