Las pruebas A / B requieren varios ingredientes para ser efectivos. Ver http://bit.ly/ExPScale para varios principios:
- La organización quiere tomar decisiones basadas en datos y ha formalizado el Criterio de evaluación general.
Raramente escuchará a alguien al frente de una organización decir que no quiere estar basado en datos, pero si los ejecutivos clave no lo valoran, las pruebas A / B no sucederán. Ken Segall en Insanely Simple escribió que Apple bajo Steve Jobs “no probó un solo anuncio. No para impresión, televisión, vallas publicitarias, la web, el comercio minorista o cualquier otra cosa “. Lo que debe preguntarse es si su CEO, que quiere confiar en su instinto, tendrá el mismo promedio de bateo que Steve Jobs, o si ( más probablemente) creen que su intuición es excelente, cuando, en realidad, sus ideas son mediocres y solo 1/3 son buenas (ese es el éxito promedio para los experimentos controlados). - Se pueden ejecutar experimentos controlados y sus resultados son confiables.
- ¿Tienes suficientes usuarios? La regla general es que necesita miles de usuarios activos (por ejemplo, http://bit.ly/ExPScale). Debajo de eso, los supuestos estadísticos no se sostienen bien.
Si bien estoy de acuerdo con el párrafo inicial del Usuario de Quora, creo que muchas empresas de empresa a empresa tienen suficientes usuarios para ejecutar pruebas A / B, y lo hacen. Por ejemplo, Google ejecuta pruebas A / B en las interfaces de sus anunciantes (vea Más por su dinero: Evaluación de nuevas funciones para anunciantes en línea http://citeseerx.ist.psu.edu/vie…). - ¿Es su organización ágil y su ciclo de iteración es lo suficientemente bueno como para justificar la ejecución de experimentos? Es difícil ejecutar pruebas A / B en hardware que se lanza una vez al año (por ejemplo, teléfono). Incluso en el software, hay muchas organizaciones que no valoran la agilidad (por ejemplo, el navegador Edge se lanza con Windows cada 6 meses, mientras que Chrome se lanza mensualmente).
- Somos pobres para evaluar el valor de las ideas.
Hay muchas pruebas de las compañías de software de que la mayoría de las ideas fallan cuando se someten a una rigurosa evaluación científica. Airbnb, Amazon, Booking.com, eBay, Facebook, Google, LinkedIn, Microsoft, Netflix, Twitter, Yahoo! todos han informado que las tasas de éxito son bajas: menos del 50% y tan bajas como el 10%. Su dominio puede ser diferente o su modelo de negocio puede ser diferente. Un ejemplo: si está comenzando copiando el producto de otra compañía (digamos que está creando un servicio similar a Uber), entonces no hay necesidad de probar la mayoría de las cosas A / B; de hecho, sus usuarios se beneficiarán de que su software se vea como el perro grande al que están acostumbrados.
Preguntaste sobre otras habilidades. Si va a hacer análisis predictivos y aprendizaje automático, entonces debería estar usando pruebas A / B, o de lo contrario no podría saber si su nuevo modelo (que redujo RMSE o alguna otra métrica en los datos fuera de línea) en realidad mejorando las métricas empresariales clave.
Para resumir, la importancia de tener habilidades de prueba A / B para un científico de datos depende de si trabajará en una empresa donde se cumplan los principios anteriores, y si SU trabajo como científico de datos estará relacionado con las pruebas A / B. Puede trabajar en una empresa donde se mantienen los principios, donde la empresa realiza muchas pruebas A / B y, sin embargo, estará ETL ‘datos todo el día y escribir informes para responder preguntas únicas.
- ¿Qué hace a un buen científico de datos? ¿Cómo superan los principales científicos de datos a otros generalistas (es decir, actuarios de P&C, analistas de negocios) en análisis predictivo?
- ¿Cuál es la diferencia entre los conceptos de minería de datos y Big Data?
- Cómo convertirse en un científico de datos como estudiante
- ¿Es realmente necesario saber la codificación Java para Big Data? ¿Es posible aprender Big Data sin conocimiento de Java?
- ¿Cuáles son las principales herramientas de visualización de datos?