Tom Deutsch señala un problema interesante, que una estrategia de datos es un tema amplio, a menudo gallina y huevo con los datos en sí y la aceptación institucional. El mejor desglose que he visto es de un informe reciente de McKinsey, que desglosa cuatro áreas en las que un equipo debe trabajar al mismo tiempo para implementar una estrategia de datos. No solo 1) las características sin formato deben existir que sean significativas para el dominio, sino 2) la presentación y el análisis de las características tienen que alinearse con las prácticas comerciales existentes, mientras que 3) la sobrecarga para trabajar con nuevas tecnologías debe ser práctica y 4) el equipo tiene o puede contratar personas que no solo ven, sino que pueden implementar el panorama general, porque este es un espacio nuevo y no hay muchos precedentes.
Además de tener que moverse en varias áreas a la vez, también hay problemas de confianza. Cuanto más compleja se vuelve una estrategia de datos, más difícil le resulta a alguien confiar en ella. El siguiente gradiente es muy simplista, pero muestra que el salto de baja complejidad, donde el foco está casi completamente en los datos, a una mayor complejidad tiene un salto inverso de alta confianza a una confianza significativamente menor.
- (baja complejidad, alta confianza) Descripciones descriptivas y detalladas de lo que sucedió. Estos son útiles para la rendición de cuentas, auditoría, indicadores imparciales * de qué tan bien está funcionando algo. A menudo, estas estrategias son para presentar una visión más profunda de quién, por qué o cómo está sucediendo algo, generalmente para aislar las cosas que claramente no deberían hacerse o aislar las cosas que se beneficiarían de hacerlo de manera diferente . Las herramientas aquí son buenos datos para trabajar y cualquier herramienta de BI disponible: Excel, Tableau (producto), personalizado, etc. El análisis se puede hacer ad-hoc, de manera única, para cortar y comparar los datos. , a menudo impulsado por algún problema interno actual, decisión (por ejemplo, planificación presupuestaria) o iniciativa.
- (complejidad media, poca confianza) Mapas de ruta prescriptivos de qué hacer. Estos son útiles para la asignación de recursos y el diseño de iniciativas, ya que las proyecciones pueden probar diferentes escenarios hipotéticos, basados en datos históricos, y aislar el “20%” que tendrá el mayor impacto. A menudo, estas estrategias son para producir artefactos que pueden aumentar la toma de decisiones, permitiendo a los gerentes probar escenarios hipotéticos más complejos. Las recetas deben tener niveles de confianza incorporados, y dependiendo de los datos y la compañía, cada receta puede ser válida solo por unas semanas antes de que los gerentes deben reevaluar la situación, a menudo repitiendo el proceso aumentado de qué. Las estrategias prescriptivas permiten a los gerentes moverse más rápido con más versatilidad.
- (alta complejidad, sin confianza ) Algorítmico , algunas asignaciones de recursos y planificación se manejan automáticamente. Estos son útiles para implementar cambios complejos a largo plazo donde se necesita retroalimentación iterativa y ajustes. Esencialmente, estas estrategias combinan estrategias prescriptivas con un tomador de decisiones algorítmico, que tiene algún objetivo, por ejemplo, maximizar un indicador descriptivo. La ventaja de la estrategia algorítmica es que tiene la calidad imparcial * de la estrategia descriptiva y es capaz de micro-administrar todos los indicadores para llegar a una solución razonable. A nivel de toda la empresa, la capacidad humana para administrar datos es de órdenes de magnitud (al menos 3 para las grandes empresas) peor que la capacidad algorítmica. Por ejemplo, un gerente puede contratar 100 consultores para recopilar y analizar minucias con una cobertura del 1%, mientras que una estrategia algorítmica puede lograr una cobertura del 100%.
El problema de la confianza a menudo elimina todas las estrategias, excepto la primera, la que es casi un 100% de ciencia de datos, fuera de la mesa. A menos que el equipo ya esté empeñado en impulsar estrategias más arriesgadas y gratificantes, que posiblemente cambien el juego en sus sectores, es probable que la primera estrategia sea aceptada de facto.
- ¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?
- ¿Cuál es la diferencia entre buscar puestos de aprendizaje automático y ciencia de datos?
- Para el análisis de datos, ¿cuál es mejor, SAS o Hadoop? Soy ingenuo en la programación pero estoy pensando en darle una oportunidad.
- ¿Qué universidades de EE. UU. Son buenas y tienen un curso de maestría en big data o análisis de datos?
- En análisis en línea, ¿cómo se prueban 'miles de puntos de datos'?
También creo que es razonable esperar más de 5 años de trabajo para obtener un conjunto de características decente para su dominio en conjunto para habilitar la estrategia descriptiva.
Para reunirlo, algunas razones por las que los equipos centran más la ciencia de datos que la estrategia de datos son que 1) es una barra alta que requiere mucho enfoque, 2) tiene un rendimiento visible para todas las estrategias y 3) a menudo se convierte en la raíz del plan, porque demostrar un archivo de Excel con números significativos es más convincente que mostrar un plan sin resultados significativos. El último punto se llama teoría de la pepita , que una pepita de resultado cuantitativo puede ayudar a las personas a entretener al “gran si” más que la mayoría de las otras cosas que su equipo puede producir. La analogía es como abrir tu armario y ver a un extraterrestre allí. Probablemente puedas imaginar una docena de escenarios que van desde Encuentros Cercanos hasta ET y Guerra de los Mundos, solo basados en ver en carne y hueso a ese alienígena.
Sería interesante ver un plan de datos basado en una estrategia de datos. Mi intuición es que un plan de estrategia primero sería más difícil de obtener la aceptación institucional que un plan de datos primero.
De McKinsey & Company – Big data: la próxima frontera para la innovación, la competencia y la productividad [1] Más oscuro significa que el área podría ser más fácil de alcanzar que en sectores donde es más claro
[1] http://www.mckinsey.com/mgi/publ…