Para hacerme capaz de recordar su significado sin pensar en la jerga de true positive/false positive/false negative
, los conceptualizo de la siguiente manera:
Imagina eso, tu novia te dio una sorpresa de cumpleaños cada año en los últimos 10 años. (Lo siento, no tenía la intención de deprimirte si no tienes uno).
Sin embargo, un día, tu novia te pregunta:
- ¿Cuál es la mejor institución para la ciencia de datos en Mumbai?
- ¿Cómo es suficiente Python para la ciencia de datos? ¿Tenemos que aprender R y Python?
- ¿Qué distribución de Linux es más adecuada para principiantes y entusiastas de la ciencia de datos / big data?
- Entre la codificación y la minería de datos, ¿qué es un buen trabajo?
- ¿Qué es el Big Data POC?
‘Cariño, ¿recuerdas todas las sorpresas de mi cumpleaños?’
Esta simple pregunta pone en peligro tu vida.
Para extender su vida, necesita recordar los 10 eventos sorprendentes de su memoria.
Por lo tanto, recall
es la proporción de una cantidad de eventos que puede recordar correctamente a una cantidad de todos los eventos correctos .
Si puede recuperar los 10 eventos correctamente, entonces, su índice de recuperación es 1.0 ( 100% ). Si puede recordar 7 eventos correctamente, su índice de recuperación es 0.7 ( 70% ).
Ahora, es más fácil asignar el recall
palabras al uso real de esa palabra.
Sin embargo, puede estar equivocado en algunas respuestas.
Por ejemplo, responde 15 veces, 10 eventos son correctos y 5 eventos son incorrectos. Esto significa que puede recordar todos los eventos, pero no es tan precise
.
Por lo tanto, la precision
es la proporción de una serie de eventos que puede recordar correctamente a un número de todos los eventos que recuerda (combinación de recuperaciones correctas e incorrectas) . En otras palabras, es cuán preciso de su recuerdo.
Del ejemplo anterior (10 eventos reales, 15 respuestas: 10 respuestas correctas, 5 respuestas incorrectas), obtiene un 100% de recuperación, pero su precisión es solo del 66.67% ( 10/15 ).
Sí, puedes adivinar lo que voy a decir a continuación. Si un algoritmo de aprendizaje automático es bueno para recall
, no significa que el algoritmo sea bueno para la precision
. Es por eso que también necesitamos F1 score
que es la media (armónica) de recall
y precision
para evaluar un algoritmo.
Espero que esta forma de conceptualización pueda ser una forma alternativa de ayudarlo a comprender y recordar la diferencia entre recall
y precision
.
NOTA:
Varios eventos que puede recordar correctamente = Verdadero positivo (son correctos y usted los recuerda)
Varios eventos correctos = Verdadero positivo (son correctos y los recuerda) + Falso negativo (son correctos pero no los recuerda)
Una cantidad de todos los eventos que recuerda = Verdadero positivo (son correctos y los recuerda) + Falso positivo (no son correctos pero los recuerda)
recordar = Verdadero positivo / (Verdadero positivo + Falso negativo)
precisión = verdadero positivo / (verdadero positivo + falso positivo)
(Acabo de escribir sobre eso en mi blog en Recall vs Precision)