Es una pregunta muy interesante que no puedo ignorar. Echemos un vistazo a un pequeño conjunto de datos de Introducción al aprendizaje estadístico Credit.csv. Más detalles se pueden encontrar en el enlace allí. Me estoy centrando particularmente en las posibles visualizaciones que se usan en Seaborn: visualización de datos estadísticos. Es posible que este caso no sea exactamente lo que está buscando, pero espero que esto lo ayude a comenzar. Veamos las 4 características de esta columna de este conjunto de datos Género, Estudiante, Casado, Etnia, Equilibrio. Las visualizaciones inmediatas que me vienen a la mente se describen y se muestran a continuación.
Parcelas de caja
Echemos un vistazo a los diagramas de caja, que es una forma de representar la distribución en los datos y es una herramienta maravillosa cuando tenemos datos categóricos. Veamos que nos da esto
- ¿Qué es la secuencia de clics?
- ¿Dónde debo comenzar a aprender ML y minería de datos?
- ¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?
- ¿Cuál es el mejor curso para Python en ciencia de datos?
- ¿Cuáles son los pros y los contras de una carrera en finanzas cuantitativas en comparación con una carrera en ciencia de datos para personas con antecedentes en física / matemáticas?
A partir de este conjunto de datos en particular y estos diagramas de caja, las cosas son claramente visibles. Las personas solteras asiáticas parecen tener más equilibrio en su crédito. Hmmmmmmmmm !!! Veamos qué más podemos hacer en términos de visualizaciones con diagramas de caja.
Ohhhhh parece que no hay mucha diferencia entre el equilibrio (mediana) de los estudiantes en las clases de casados y solteros.
Contar parcelas
Ahora vamos a sentarnos y mirar las parcelas de conteo. Estas parcelas dan el recuento de características en una categoría. En nuestro caso da algunos resultados interesantes. Echemos un vistazo a ellos.
Hay más personas caucásicas en este conjunto de datos.
Y uno mas.
En cuanto a la parte de análisis, pueden ser extremadamente informativos. Las clases categóricas se tratan codificándolas (es decir, asignando números a categorías). En este caso, se podría enmarcar un problema de clasificación para detectar si la persona que tiene crédito es un estudiante o no (es muy simple y estoy seguro de que puede resolverlo). Espero que haya sido útil.
Puedes ver más sobre mi trabajo en Medium.