Una observación clave es que no todas las ideas son factibles dados los datos, las personas y las técnicas que tiene a su disposición. Los productos que se crean a partir de datos a menudo también están restringidos de formas que inicialmente no esperaba. Tendrán que trabajar en estrecha colaboración y mantenerse controlados para enviar productos excelentes.
Los diseñadores de productos deben tener en cuenta que pueden faltar algunos datos clave, lo que tiene podría ser menos informativo de lo que inicialmente se suponía, o podría haber un salto algorítmico que aún no puede lograr. Deben evitarse suposiciones sobre lo que puede construir y pasar semanas o meses trabajando en paralelo en los diseños.
Escucha los datos. En lugar de perder tiempo debatiendo posibles escenarios, trabajen juntos para encontrar las respuestas reales. Ejecute algunas consultas, genere gráficos y vuelva a hacer los cálculos del sobre para guiar sus decisiones. No tenga miedo de ser franco con los desarrolladores si alguna característica no está a la altura, o si cree que algo debería cortarse del producto.
- ¿Aprender SQL es bueno para carreras potenciales en análisis financiero y de datos?
- ¿Cómo pueden las tecnologías de Big Data mejorar la inversión de impacto social?
- ¿Qué ha contribuido en gran medida al lanzamiento de la era de Big Data?
- ¿Cómo uso el aprendizaje automático para datos espaciales?
- ¿Qué habilidades de comunicación requiere la ciencia de datos?
Haga una lluvia de ideas sobre productos juntos y haga algunos bocetos de servilletas. Antes de que cualquier diseño avance demasiado, descubra cuál será la característica principal del producto. Este es el único elemento sin el cual el producto ya no sería reconocible para los usuarios.
En este punto, comience a cavar en los datos, escriba un código e intente ejecutar un prototipo lo más rápido posible. Si la idea tiene piernas, genial. Si no, repite hasta que encuentres algo convincente.
Asegúrate de trabajar en cosas que importan. Los científicos de datos deben evitar perder tiempo en cosas que no satisfarán las necesidades del usuario. Los enfoques inteligentes para los problemas que las personas realmente no tienen no son tan útiles, por lo que todos deberían tener esto en cuenta.
La luz del sol es el mejor desinfectante. El trabajo de algoritmo que se prolonga sin integración en el producto donde se puede ver es arriesgado, por lo que debe centrarse en probar el concepto central del producto y desplegarlo antes de expandir el alcance.
Recuerde que el prototipo no es el producto: si estaba ejecutando datos de muestra, vea lo que sucede cuando usa un conjunto de datos más realista o amplía sus entradas. Asegúrese de verificar tanto los casos extremos como los senarios de uso más probables para patear los neumáticos del producto durante el control de calidad de los datos.
La construcción de un producto a menudo está llena de compensaciones, pero si un cambio en el diseño tendrá un impacto negativo en los algoritmos o los datos del producto que supera otros beneficios, es tarea del científico de datos llamarlo.
Lo perfecto es enemigo de lo hecho. Esto se aplica a algoritmos y diseño. Asegúrese de obtener una primera versión de su algoritmo rápidamente para los usuarios y luego realice mejoras iterativas. Los diseñadores de productos deben evitar un sinfín de cambios en la interfaz de usuario antes de que el producto se presente a los usuarios. Los cambios aparentemente pequeños en la interfaz de usuario a menudo resultan en un trabajo de ingeniería de fondo significativo, así que tenlo en cuenta.
Dicho esto, los productos basados en datos nunca serán realmente “hechos”, así que encuentre una manera de medir y mejorar continuamente la precisión de sus algoritmos e intente progresar todos los días. Tenga algunas métricas de calidad en las que pueda estar de acuerdo y asegúrese de que reflejen lo que los usuarios experimentarán en el producto real.
Daré una charla relacionada con estos temas en O’Reilly Strata el próximo mes: http://strataconf.com/strata2011…
También vea la charla de Matt Biddulph: Prototipos con datos
http://strataconf.com/strata2011…