Tengo un conjunto de datos con una combinación de datos cualitativos y cuantitativos, ¿cómo puedo inferir una relación o sensibilidad entre las columnas?

Algunas formas diferentes según la naturaleza de sus datos cualitativos.

Si se trata de datos de atributos (es decir: aprobado o no; rojo, azul o amarillo, etc.). Puede usar la prueba de hipótesis para verificar si hay una diferencia estadísticamente significativa en los datos cuantitativos. Por ejemplo, si los datos cuantitativos se distribuyen normalmente, puede usar una prueba ANOVA para determinar si los bloques de un color son más gruesos que los bloques de un color diferente.

Si los datos son semicuantitativos (es decir, dolor, moho, etc.), puede convertirlos en cuantitativos redefiniéndolos en una escala cuantitativa (es decir, dolor en una escala de 1 a 10), trazando los datos en un gráfico xy, y buscando correlaciones (una dependencia funcional entre las variables).

Puede encontrar orientación sobre cómo hacer algunas de estas cosas en www.statstuff.com

Debe observar la correlación por pares en todas las columnas.
En cada par, si ambas son variables categóricas (cualitativas), podría usar la tabulación cruzada (distribución condicional), y si son categóricas y ordinales (clasificadas), entonces podría usar el coeficiente de correlación de rango de Spearman.
Si ambas son variables numéricas (cuantitativas), podría usar el coeficiente de correlación de momento de producto de Pearson (nota: esto indica correlación lineal).
Si uno es categórico y el otro numérico, puede probar estadísticas descriptivas como la media, la desviación estándar, la varianza de la variable numérica dentro de cada categoría de la variable categórica.

More Interesting

ELI5: ¿Qué son las redes neuronales?

Cómo ingresar a un programa de doctorado en la mejor escuela de EE. UU. En inteligencia artificial, visión artificial y aprendizaje automático

¿Cuántas estadísticas y probabilidades debo saber para sumergirme en el aprendizaje automático?

¿Cuáles son los tres problemas principales en el pronóstico de energía eólica y solar que requieren atención urgente utilizando algoritmos de aprendizaje automático?

¿Qué es la regresión en el aprendizaje automático?

En el aprendizaje automático, ¿cómo estima el descenso de gradiente la pendiente de la función de pérdida en un punto dado?

Cómo llamar a clasificadores y conjuntos de datos de WEKA a Netbeans IDE 7.1

¿Soy un desarrollador de dinosaurios si no uso Github, no conozco CI / CD y docker y solo conozco el aprendizaje profundo de la palabra de moda?

¿Cuál es el flujo de trabajo típico para usar el aprendizaje profundo para resolver un problema?

¿Por qué está disminuyendo el número de concursos públicos de Kaggle con premios en efectivo?

¿Puedo comenzar a aprender el aprendizaje automático y el aprendizaje profundo sin repasar primero mis conocimientos de matemáticas?

Cómo obtener líneas de regresión y encontrar coeficientes de correlación a partir de datos

¿Cuáles son los roles de probabilidad y estadística en el aprendizaje automático? ¿Qué tan importantes son? ¿Cuáles son sus aplicaciones en el aprendizaje automático?

¿Cuándo se ajusta bien un modelo de mezcla gaussiana?

¿Cuáles son las cosas más difíciles o problemáticas para los ingenieros de Machine Learning / Deep Learning?