Cómo calcular la precisión y recordar para la clasificación, donde ambas clases son igualmente importantes

No recuerdo (o más precisamente, no creo saberlo) la definición de “dos clases son igualmente importantes”. ¿Qué tal si suponemos que dos clases – positivas (o clase1) y negativas (o clase2) – incluyen el mismo número (n1 = n2 = n) de elementos, y los elementos en cada clase se distribuyen de tal manera que son “totalmente” no separables en absoluto. La precisión representa “cuántos elementos seleccionados son relevantes (para clase positiva o negativa)”; y recordar representa “cuántos elementos relevantes se seleccionan”, por lo que:

precisión = TP / (TP + FP)

recordar = TP / (TP + FN)

donde TP significa verdadero positivo; FP falso positivo; y FN falso negativo. Dado que las dos clases son “totalmente” no separables o “iguales”, entonces al seleccionar cualquier elemento m, TP = TN = m / 2 y FP = FN = m / 2.

precisión1 = precisión2 = m / 2 / (m / 2 + m / 2) = 0.5

Del mismo modo, recordar1 = recordar2 = 0.5

La respuesta se puede entender de la siguiente manera. Dado que dos clases son iguales, siempre es que la mitad de los elementos seleccionados son relevantes (para clase1 e iguales para clase2) y los elementos relevantes también son la mitad de los elementos seleccionados.

Me arriesgaré a adivinar que te estás refiriendo a un problema en un idioma que, al escribirlo, al igual que el que estás tratando de usar, tienes dificultades y uso. La precisión generalmente se refiere a la validez del número de dígitos a la derecha del punto decimal. Si está utilizando enteros, la precisión no tiene sentido. Tienes que ser más inteligente que la máquina que estás programando para aprender. Haga que las clases separadas “Precisión” y “Recuperación”, con funciones virtuales, las incluyan en su nueva clase base donde calcula, escribe y usa esas funciones. También necesita hacer un D2A lógico donde mida el nivel para ver si cumple con las especificaciones del caso.

Según entiendo su pregunta, se pregunta qué hacer en un problema de clasificación de dos clases si el punto de datos que debe clasificar se encuentra en el límite de decisión.

Primero; es un caso degenerado y estadísticamente esto no sucederá

Segundo; Hacer una elección de diseño. Asignarlo a cualquier clase y especificarlo en la documentación.

More Interesting

¿Qué tan rápido es Theano en comparación con otras implementaciones de DBN? ¿Cómo se compara con otras implementaciones de GPU (potencialmente no públicas) para la velocidad de entrenamiento en grandes conjuntos de datos?

¿Por qué la pila de RBM después de aprender no es una máquina de Boltzmann profunda (DBM)?

Cómo mejorar en Machine Learning y PNL

¿Cómo deciden las personas en aprendizaje profundo qué artículos no leer?

¿Cuáles son los mejores libros de aprendizaje automático para principiantes?

¿Qué es el aprendizaje automático en tiempo real?

¿Existe algún informe publicado que haya aplicado con éxito el aprendizaje profundo para un sistema de recomendación basado en contenido de texto?

¿Cuál es la diferencia entre los diferentes tipos de funciones de activación para redes neuronales y por qué es importante elegir una sobre otra?

¿Cuál es el mejor método de selección de características cuando los datos del tren tienen más características que el número de puntos de datos? ¿Asumir que los datos son muy grandes?

Cómo comenzar la investigación en Machine Learning

¿Cuáles son algunos buenos métodos para el procesamiento previo de datos en el aprendizaje automático?

¿Podrían probarse los conceptos de la medicina tradicional china mediante el aprendizaje profundo?

¿Qué tipos de características se extraen de los archivos de voz utilizando predicción lineal y predicción no lineal?

¿Cuál es la diferencia entre un contenedor y un algoritmo de filtro en Data Mining / Machine Learning?

¿Se usa el álgebra abstracta en el aprendizaje automático?