¿Qué tendencias populares de visualización de datos odian los científicos de datos?

Esta:

Permítanme aclarar esto primero: hay muchos casos en los que las nubes de palabras son bastante útiles: evaluar comentarios textuales, encontrar puntos débiles de los clientes, comprender las obras de un escritor, etc.

Pero, creo que está sobreutilizado. Y en la compensación entre la visualización de datos que es estéticamente agradable y perspicaz , siento que se inclina demasiado hacia la primera a expensas de la segunda.

Sí, se ve bonito. ¿Pero qué significan los colores? ¿Y cuál es la escala para medir la diferencia de tamaño? ¿Se tienen en cuenta sinónimos y palabras con la misma raíz? ¿Y por qué tengo que girar la cabeza? ¿Me veo como un ave de rapiña nocturna, porque no soy un búho maldito?

Cada vez que veo una nube de palabras presentada como una idea, muero un poco por dentro.

– Jacob Harris, arquitecto sénior de software, The New York Times.

Lectura adicional: ¿Por qué las nubes de palabras dañan las ideas?

PD La palabra nube que utilicé fue la que sugirió la búsqueda de imágenes de Quora. No tengo ningún problema con las personas que no son binarias. De hecho, me estoy cansando de hablar con personas en ceros y ceros. 😛

Lo siento.

La salida es así, ¿sí?

Datos incorrectos

Hay un viejo principio en informática: “Basura adentro, basura afuera”. En el contexto de la visualización de datos, esto significa que los datos incorrectos conducirán a malas visualizaciones. Comience con lo básico: ¿están limpios sus datos? Utilice las verificaciones en cada etapa que atraviesan los datos (recopilación, abastecimiento, limpieza y compilación) antes de visualizarlos. Los errores comunes incluyen duplicación de datos, datos perdidos, valores de NA no marcados, etc.

Elección incorrecta de visualización de datos

Una vez que sus datos estén listos, debe tener cuidado con el tipo de visualización que utiliza.

Demasiado color o información

Si bien se ha establecido que el uso de diferentes colores ayuda a las personas a interpretar las visualizaciones de datos más rápido, demasiado color puede confundir al espectador. Es importante elegir un número limitado de colores: 5 es un buen límite superior

Tergiversación de datos

El mayor delito en la visualización de datos está llevando al espectador a una interpretación incorrecta.

Escalas inconsistentes

Por supuesto, puede representar múltiples variables en una sola visualización de datos. Sin embargo, siempre es una buena práctica representarlos en una sola escala para evitar confusiones.

Hay muchos factores adicionales que se pueden decir sobre la visualización de datos donde no es una buena opción. Ninguna tecnología ofrece soluciones en todos los niveles. La mejor manera de acercarse a DataViz es usarlo donde ayuda y evitarlo donde no lo hace. A medida que la tecnología madure, aparecerán más y más capacidades y donde la visualización de datos no es una buena opción, eso no significa que esta sea una condición permanente.

No estoy seguro de si son las tendencias de visualización de datos las que odian los científicos de datos o el uso incorrecto de esas tendencias de visualización de datos, lo que resulta en una comunicación ineficaz de los resultados.

Mi sensación es que es más lo último. Déjame intentar mostrarte por qué:

  • Una crítica de los gráficos de radar
  • El peor gráfico del mundo (gráficos circulares)
  • Comprender los gráficos de barras apiladas: ¿lo peor o lo mejor?
  • Un histograma NO es un gráfico de barras
  • Por qué las nubes de palabras dañan las ideas | Temática (como Sriraman Madhavan mencionó correctamente)
  • Parcelas de espagueti y senderos de huracanes (parcelas de espagueti)

¡Hay muchos más ejemplos por ahí!

Consejo: si desea saber más sobre lo que puede ser frustrante sobre las visualizaciones de datos y la comunicación ineficaz de los resultados, le recomendaría encarecidamente a algunos expertos en visualización de datos y periodistas de datos, que a menudo tuitean sobre este tipo de cosas. 🙂 Consulte este artículo para obtener una lista de los periodistas de datos más famosos: Guía rápida de periodismo de datos

Tableros en tiempo real.

No me malinterpreten, estos son muy útiles para ciertos KPI, especialmente aquellos que implican monitorear una métrica que podría tener un impacto muy urgente en el resultado final de la empresa.

Pero recientemente, ha habido una obsesión por crear paneles en tiempo real para * todo *, a menudo exigido por una suite de administración equivocada que disfruta mirando paneles sofisticados y creando pantallas de TV que realmente no logran mucho más que ser divertido de ver.

Realmente me gusta la mayoría de los paquetes de visualización de tendencias. Tableau es excelente. Sin embargo, usar eso como un único medio para analizar datos puede ser muy engañoso.

Gráficos circulares

Caso en punto: