En análisis en línea, ¿cómo se prueban ‘miles de puntos de datos’?

Gracias por el A2A.

Apoyo el punto de Ricardo de que suena como un argumento de venta. Conté siete veces donde dijo “miles” también.

El artículo me parece una lista, con un titular de clickbait, grandes cantidades de publicidad y enlaces que dirigen a otras páginas principalmente en su propio sitio, por lo que supongo que está haciendo un poco de marketing de contenido (de sí mismo) al mismo tiempo. enseñando a otros. Por lo tanto, existe la posibilidad de que el método técnico de prueba no sea lo más importante en su mente 🙂

Dicho esto, lo que puedo agregar a la discusión es que estas afirmaciones generalmente vienen en dos sabores:

En primer lugar, podría tratarse de ejecutar una página web durante un período de tiempo (por ejemplo, una semana) y ver el ‘compromiso’ en términos de visitas a la página, visitantes únicos, acciones, tasas de rebote, etc. Luego, uno cambia algo (como pasar de escribir en tercera persona a la primera persona), ejecutar la nueva página durante otra semana y comparar los resultados.

Puede encontrar cosas como un mayor compromiso, aparentemente porque escribir en primera persona crea una mejor conexión. Y el cambio en el compromiso puede ser impulsado por el cambio.

Y digo mayo, porque también podría ser impulsado por muchos otros factores. Por ejemplo, la primera semana podría haber sido en una temporada de vacaciones públicas donde una gran cantidad de lectores habituales se dirigían a la playa en lugar de leer su sitio web.

Entonces, la mejor manera de probar estas afirmaciones es hacer una prueba A / B en línea, y hay muchas opciones de software para hacerlo. Para tomar prestada una ilustración rápida de VWO (no estoy afiliado a ellos), lo que debe hacer es diseñar dos versiones de su sitio web y decirle a la web que sirva a una porción de visitantes la primera versión y una porción de visitantes la segunda. (es decir, si visitara su sitio web, tengo un 50% de posibilidades de recibir cualquiera de las versiones).

Este es un entorno controlado que le permite ejecutar experimentos. En este caso, si obtiene una diferencia estadísticamente significativa en la cantidad de interacción entre las dos versiones del sitio, estaría bien justificado al decir que ha ‘probado miles de puntos de datos’.

Espero que eso ayude.

Bajo el principio genérico de datos ordenados, un conjunto de datos se presenta en forma de tabla donde cada columna es una variable y cada fila es una observación.

Entonces, si una persona de datos se refiere a miles de puntos de datos, generalmente significa un conjunto de datos con miles de filas donde cada punto de datos es una observación.

Lo que puede hacer una persona de datos depende de la pregunta que está respondiendo con los datos. El análisis puede ser descriptivo, solo muestra tendencias, distribuciones y resúmenes de las variables. Esto se puede hacer con Excel y otras hojas de cálculo como herramientas.

El análisis también puede ser inferencial, lo que significa que inferimos algo de una población que utiliza datos, a menudo de una muestra de la población. Esto se puede hacer con varias herramientas, hoy en día un analista de datos “moderno” usará algún lenguaje de programación como R, Python o Julia. Estos también se pueden utilizar para la parte descriptiva, naturalmente. Una computadora portátil moderna puede ejecutar análisis en millones de puntos de datos sin sudar.

El objetivo del análisis es determinar, dentro de algunos límites de incertidumbre, las propiedades de esa población. Las personas que hacen esto son bien conocidas por mostrar y defender su análisis.

Sin embargo, si alguien usa la palabra “miles” siete veces en un argumento de venta, incluida una oración donde se usa miles para mostrar cuatro resultados, realmente no le presto mucha atención. Es un argumento de venta que no es un análisis adecuado y, para ser honesto, está bien, está haciendo lo suyo.

Realmente no dice que prueba en miles de puntos de datos. Él dice que tiene miles de resultados concretos y que puede escalar a millones de puntos de datos. Eso no significa que haya ningún análisis o metodología científica.