¿Cómo podemos analizar un conjunto de datos que es completamente (tanto X como Y) de naturaleza categórica?

Es una pregunta muy interesante que no puedo ignorar. Echemos un vistazo a un pequeño conjunto de datos de Introducción al aprendizaje estadístico Credit.csv. Más detalles se pueden encontrar en el enlace allí. Me estoy centrando particularmente en las posibles visualizaciones que se usan en Seaborn: visualización de datos estadísticos. Es posible que este caso no sea exactamente lo que está buscando, pero espero que esto lo ayude a comenzar. Veamos las 4 características de esta columna de este conjunto de datos Género, Estudiante, Casado, Etnia, Equilibrio. Las visualizaciones inmediatas que me vienen a la mente se describen y se muestran a continuación.

Parcelas de caja

Echemos un vistazo a los diagramas de caja, que es una forma de representar la distribución en los datos y es una herramienta maravillosa cuando tenemos datos categóricos. Veamos que nos da esto

A partir de este conjunto de datos en particular y estos diagramas de caja, las cosas son claramente visibles. Las personas solteras asiáticas parecen tener más equilibrio en su crédito. Hmmmmmmmmm !!! Veamos qué más podemos hacer en términos de visualizaciones con diagramas de caja.

Ohhhhh parece que no hay mucha diferencia entre el equilibrio (mediana) de los estudiantes en las clases de casados ​​y solteros.

Contar parcelas

Ahora vamos a sentarnos y mirar las parcelas de conteo. Estas parcelas dan el recuento de características en una categoría. En nuestro caso da algunos resultados interesantes. Echemos un vistazo a ellos.

Hay más personas caucásicas en este conjunto de datos.

Y uno mas.

En cuanto a la parte de análisis, pueden ser extremadamente informativos. Las clases categóricas se tratan codificándolas (es decir, asignando números a categorías). En este caso, se podría enmarcar un problema de clasificación para detectar si la persona que tiene crédito es un estudiante o no (es muy simple y estoy seguro de que puede resolverlo). Espero que haya sido útil.

Puedes ver más sobre mi trabajo en Medium.