Una tarea de segmentación es simplemente insertar límites en el texto (suponiendo que esté hablando de segmentación de texto).
La precisión es: para los límites que insertó, ¿cuántos de ellos eran correctos?
Recordar es: para todos los límites correctos, ¿cuántos de ellos encontraste?
- ¿Hay algún sitio web donde pueda encontrar ideas para mi tesis de licenciatura en Informática? (Estoy interesado en algoritmos y aprendizaje automático).
- ¿Cuáles son las diferencias entre los árboles de decisión, los métodos de agrupamiento y las redes neuronales?
- ¿Tiene sentido tener un conjunto de validación y realizar una validación cruzada al construir modelos?
- ¿Cuáles son algunos buenos recursos para conceptos sobre la identificación de similitudes entre documentos?
- ¿Dónde puedo encontrar un código de Python para SVM que use datos de funciones múltiples?
La matemática es simple. Tiene verdaderos positivos (TP), falsos positivos (FP), verdaderos negativos (TN) y falsos negativos (FN). Entonces tienes:
Precisión = TP / (TP + FP)
Recuperación = TP / (TP + FN)
También puede definir un par de otros factores útiles: la cantidad de errores que comete (error) y con qué frecuencia se encuentran límites falsos (consecuencias):
Error = (FP + FN) / (TP + TN + FP + FN)
Fallout = FP / (FP + TN)
Finalmente, una forma estándar de equilibrar la precisión y la recuperación (realmente desea maximizar ambas) es calcular la puntuación F, que es la media armónica entre precisión y recuperación.
El otro caso que veo en la práctica es para sistemas de alta precisión en los que se fija la precisión en, digamos, 95%, y luego se intenta maximizar la recuperación bajo esa restricción.