Hicimos una prueba A / B. La prueba ganó, así que hicimos el cambio en el sitio para todos los usuarios, pero después de esperar un tiempo, nos dimos cuenta de que la nueva versión del sitio no estaba funcionando mejor que la anterior. ¿Cuál podría ser la razón?

Hay muchas razones que podrían explicar este comportamiento. Por un lado, si realizó el cambio para todos los usuarios y ahora ve una caída en las métricas, podría ser un factor exógeno que no puede medir. Por ejemplo, menos usuarios en general podrían llegar a su sitio independientemente de su cambio de producto. La otra gran posibilidad es que haya un efecto de novedad. El cambio podría generar un efecto mayor porque los usuarios están interesados ​​en probar la nueva funcionalidad, pero luego disminuyen con el tiempo si el cambio no conduce a una mejor experiencia.

Un artículo más detallado que disfruté: una docena sucia: doce dificultades comunes de interpretación métrica en experimentos controlados en línea. Esta publicación cubre una serie de problemas con las pruebas A / B que Microsoft encontró en su experiencia y es una lectura obligada para los científicos de datos que trabajan con la experimentación.