La matriz de confusión se usa en problemas de clasificación.
El problema de clasificación es que tiene 4 características / columnas y una salida. Por lo general, dividiría los datos en datos de entrenamiento y prueba. Los datos de entrenamiento se usarían para encontrar patrones / fórmulas ocultos en los que 4 características (x1, x2, x3, x4) van a medida que se introducen las características de entrada y ecuación b / w y la salida (digamos Y).
Ahora esta ecuación se usa en los datos de prueba, y se pronostica la salida predicha (digamos y`). En los datos de prueba también tenemos salida real; podemos comparar la salida pronosticada (y`) con la salida real (Y) y crear una matriz de confusión.
- ¿Vale la pena unirse a Manipal University for Data Science?
- ¿Cuál es el mejor instituto para aprender Data Science & Analytics?
- ¿Podría evitar usar una tecnología distribuida en el trabajo en un solo nodo y pasar entrevistas de ciencia de datos?
- ¿Cuál es la diferencia entre análisis inferencial y descriptivo de datos?
- ¿En qué cosas tienen que pasar el tiempo los científicos de datos que preferirían no hacerlo?
Ejemplo de matriz de confusión:
Resultado de la imagen de Google para http://www.dataschool.io/content/images/2015/01/confusion_matrix2.png
Digamos que en su problema Y era 2 categorías “positivo” y “negativo”, entonces la matriz de confusión tendría:
falsos positivos: # entradas que ML predijo positivas INCORRECTAMENTE
positivos verdaderos: # entradas que ML predijo positivas CORRECTAMENTE
falso negativo: # entradas que ML predijo negativamente INCORRECTAMENTE
verdadero negativo: # entradas que ML predijo negativamente INCORRECTAMENTE.
Esperanza: eso deja clara la matriz de confusión.