¿Cómo pueden los científicos de datos y diseñadores de productos trabajar juntos de manera más efectiva? ¿Cómo deberían los desarrolladores ayudar a los diseñadores a comprender las posibilidades y limitaciones del análisis de datos y el aprendizaje automático?

Una observación clave es que no todas las ideas son factibles dados los datos, las personas y las técnicas que tiene a su disposición. Los productos que se crean a partir de datos a menudo también están restringidos de formas que inicialmente no esperaba. Tendrán que trabajar en estrecha colaboración y mantenerse controlados para enviar productos excelentes.

Los diseñadores de productos deben tener en cuenta que pueden faltar algunos datos clave, lo que tiene podría ser menos informativo de lo que inicialmente se suponía, o podría haber un salto algorítmico que aún no puede lograr. Deben evitarse suposiciones sobre lo que puede construir y pasar semanas o meses trabajando en paralelo en los diseños.

Escucha los datos. En lugar de perder tiempo debatiendo posibles escenarios, trabajen juntos para encontrar las respuestas reales. Ejecute algunas consultas, genere gráficos y vuelva a hacer los cálculos del sobre para guiar sus decisiones. No tenga miedo de ser franco con los desarrolladores si alguna característica no está a la altura, o si cree que algo debería cortarse del producto.

Haga una lluvia de ideas sobre productos juntos y haga algunos bocetos de servilletas. Antes de que cualquier diseño avance demasiado, descubra cuál será la característica principal del producto. Este es el único elemento sin el cual el producto ya no sería reconocible para los usuarios.

En este punto, comience a cavar en los datos, escriba un código e intente ejecutar un prototipo lo más rápido posible. Si la idea tiene piernas, genial. Si no, repite hasta que encuentres algo convincente.

Asegúrate de trabajar en cosas que importan. Los científicos de datos deben evitar perder tiempo en cosas que no satisfarán las necesidades del usuario. Los enfoques inteligentes para los problemas que las personas realmente no tienen no son tan útiles, por lo que todos deberían tener esto en cuenta.

La luz del sol es el mejor desinfectante. El trabajo de algoritmo que se prolonga sin integración en el producto donde se puede ver es arriesgado, por lo que debe centrarse en probar el concepto central del producto y desplegarlo antes de expandir el alcance.

Recuerde que el prototipo no es el producto: si estaba ejecutando datos de muestra, vea lo que sucede cuando usa un conjunto de datos más realista o amplía sus entradas. Asegúrese de verificar tanto los casos extremos como los senarios de uso más probables para patear los neumáticos del producto durante el control de calidad de los datos.

La construcción de un producto a menudo está llena de compensaciones, pero si un cambio en el diseño tendrá un impacto negativo en los algoritmos o los datos del producto que supera otros beneficios, es tarea del científico de datos llamarlo.

Lo perfecto es enemigo de lo hecho. Esto se aplica a algoritmos y diseño. Asegúrese de obtener una primera versión de su algoritmo rápidamente para los usuarios y luego realice mejoras iterativas. Los diseñadores de productos deben evitar un sinfín de cambios en la interfaz de usuario antes de que el producto se presente a los usuarios. Los cambios aparentemente pequeños en la interfaz de usuario a menudo resultan en un trabajo de ingeniería de fondo significativo, así que tenlo en cuenta.

Dicho esto, los productos basados ​​en datos nunca serán realmente “hechos”, así que encuentre una manera de medir y mejorar continuamente la precisión de sus algoritmos e intente progresar todos los días. Tenga algunas métricas de calidad en las que pueda estar de acuerdo y asegúrese de que reflejen lo que los usuarios experimentarán en el producto real.

Daré una charla relacionada con estos temas en O’Reilly Strata el próximo mes: http://strataconf.com/strata2011…

También vea la charla de Matt Biddulph: Prototipos con datos
http://strataconf.com/strata2011…

Después de haber trabajado en ambos roles, he hecho un montón de meta-pensamiento en torno a esto, mi postura actual es un tipo de árbol de decisión. La decisión de nivel superior que tomo es:

  1. ¿Es la calidad de ML / ranking / AI el producto principal?
  2. ¿Estoy construyendo un producto informado por datos?

La mayoría de los productos tienden a inclinarse fuertemente de una forma u otra. La Búsqueda de Google o los autos sin conductor son los primeros, mientras que Instagram o Twitter son los últimos. Quora o Netflix están en algún lugar en el medio.

Cuando los datos son el producto , como diseñador, usted se asegura de amplificar lo que es bueno y minimizar lo que no es tan bueno, pero generalmente suele haber un umbral de precisión por encima del cual el producto se siente mágico y por debajo del cual se siente terrible (o en el caso de autos sin conductor, puede matarlo). Esto es independiente de qué tan bien puede diseñar a su alrededor.

Al crear un producto informado por datos , hay dos formas de usar los datos para impulsar una decisión de producto:

  1. Validación : ¿esta característica que agregué (o eliminé) es buena?
  2. Exploratorio : ¿cuál es una buena característica / producto para construir? Esto podría ser tan pequeño como una optimización de conversión o tan grande como comenzar una empresa y pensar en qué producto construir.

Siempre es una buena idea utilizar la experiencia de un Científico de Datos para validar los cambios de productos. ¿Esto aumentó el compromiso, las acciones, la conversión, etc.? La mayoría de las empresas tienen un marco de pruebas A / B para este tipo de cosas.

A veces recibirás un golpe en uno de estos números y aún así lo justificarás porque es mejor en general de una manera que es más difícil de cuantificar. Eso está bien, pero debería ser la excepción, no la norma.

El análisis exploratorio para informar las decisiones del producto es donde las aguas se vuelven turbias . Esto también se divide en dos casos:

  1. Hay una señal de demanda latente.
  2. No hay señal de demanda latente.

Esto es lo que quiero decir con “señal de demanda latente”. Digamos que X es el producto que tienes e Y es el producto que crees que es una buena idea para construir. En el comportamiento de sus usuarios con el producto X actual, ¿están indicando que quieren Y? Por ejemplo, las personas que usan Messenger dicen cosas como “Te pagaré con Venmo”. Esa es una señal interna de demanda latente .

Otra metodología que me gusta para descubrir una señal interna de demanda latente es una prueba de puerta pintada. Es cuando prometes una función que en realidad no existe, y ves cuántos clics le llegan. Esto es muy arriesgado y debe usarse con moderación.

También puede haber señales externas de demanda latente , como estimar lo que los competidores están haciendo de manera diferente o encontrar necesidades análogas del mercado a través de otros productos. Estas inspiraciones pueden ser muy variadas, como la primera persona que pensó “oye, la gamificación funciona para juegos, así que ¿por qué no probarlo con este producto de salud?”

Las señales internas y externas de demanda latente ofrecen un enfoque incremental para el desarrollo de productos, y puede ser muy tedioso validar, enviar y probar cada pequeño cambio.

Siendo humanos, simplemente no podemos darnos el tiempo para tomar cada micro decisión a través de una prueba. La prueba de Google de 40 tonos de azul es un ejemplo muy citado. Así que tenemos que hacer juicios sobre lo que vale la pena el rigor y lo que no. Esto suele ser una combinación de instinto de producto desarrollado a través de la experiencia, libros transmitidos y sentido común.

tl; dr con señales latentes: por lo general, hay una manera de medir la señal latente para la demanda de algo que estás considerando construir o un problema que crees que vale la pena resolver, a menudo es necesario que seas creativo y pienses fuera de la caja para buscarlo . Me referiré a la respuesta de Peter Skomoroch aquí.

Escucha los datos. En lugar de perder tiempo debatiendo posibles escenarios, trabajen juntos para encontrar las respuestas reales. Ejecute algunas consultas, genere gráficos y vuelva a hacer los cálculos del sobre para guiar sus decisiones. No tenga miedo de ser franco con los desarrolladores si alguna característica no está a la altura, o si cree que algo debería cortarse del producto.

Haga una lluvia de ideas sobre productos juntos y haga algunos bocetos de servilletas. Antes de que cualquier diseño avance demasiado, descubra cuál será la característica principal del producto. Este es el único elemento sin el cual el producto ya no sería reconocible para los usuarios.

A veces, la señal de demanda latente es tan ruidosa que en realidad distrae si la usa.

Esto funciona en ambos sentidos: a veces los datos solo te desanimarán de construir algo que podría ser genial , esto generalmente es por la visión del túnel y por mirar los datos de manera demasiado estrecha, y estás haciendo preguntas equivocadas al respecto.

Otras veces, los datos muestran una gran cantidad de promesas, pero su ejecución simplemente no es lo suficientemente buena como para capitalizarla , o alguien más resolvió el problema lo suficientemente bien y la fricción de cambiar a su producto no vale la pena.

Y aquí es donde la mayoría de las decisiones equivocadas tienden a tomarse con datos. Steve Jobs dijo una vez: “Muchas veces, la gente no sabe lo que quiere hasta que se lo enseñas” y este es el tipo de producto que es realmente difícil de descubrir con datos.

Estos productos son muy difíciles de encontrar con los datos, no porque los datos se encuentren, sino porque estamos haciendo las preguntas equivocadas.

More Interesting

¿Un científico de datos necesita conocer algoritmos y estructuras de datos, así como un ingeniero de software?

¿Qué campo debo elegir, redes informáticas o ciencia de datos? Amo los dos.

¿Cuáles son las aplicaciones de big data y Hadoop en educación?

¿Cómo puede un equipo de finanzas crear un flujo de trabajo de pronóstico utilizando herramientas de ciencia de datos de código abierto?

¿Hay alguna pregunta moral al trabajar con Big Data?

En términos simples, ¿qué son exactamente Apache y Hadoop, y qué importancia tienen para los grandes datos y la ciencia de datos?

¿Cuál sería una buena pila tecnológica para aprender para un ingeniero de datos principiante?

¿Cómo se ve el currículum de análisis de datos experimentados con 3 años?

¿Debo hacer un master en ciencia de datos o ir a un campo de entrenamiento?

¿Un perfil como el mío tiene alguna posibilidad de ingresar a un buen instituto a través de GRE para obtener una maestría en ciencia de datos?

¿Cuáles son las nuevas tecnologías de big data?

¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?

¿Todos los científicos necesitarán saber ciencia de datos?

¿AI y Data Science cambiarán la cara de los negocios? Si es así, ¿cómo será su futuro?

¿Cuáles son las clases que debo tomar como estudiante universitario de B.Tech para una carrera en Data Science y qué buscan exactamente las empresas durante las prácticas?