Explica qué son la precisión y el recuerdo. ¿Cómo se relacionan con la curva ROC?

Tiene un modelo que clasifica las cosas como pertenecientes a la clase 1 (las denominaremos positivas) o a la clase 0 (las denominaremos negativas). Por lo tanto, cada punto de datos pertenece a una de cuatro clases:

  • Verdaderos positivos: predice la clase 1, realmente pertenece a la clase 1
  • Verdaderos negativos: predice la clase 0, realmente pertenece a la clase 0
  • Positivos falsos: clase 1 predicha, realmente pertenece a la clase 0
  • Falsos negativos: predicho clase 0, realmente pertenece a la clase 1

El recuerdo es la fracción de puntos que realmente pertenecen a la clase 1 que el modelo predijo como clase 1, es decir (verdaderos positivos) / (verdaderos positivos + falsos negativos). La precisión es la relación entre los verdaderos positivos y el número total de positivos pronosticados, es decir (verdaderos positivos) / (verdaderos positivos + falsos positivos) o qué porcentaje de la clase positiva predice correctamente.

La definición de recuerdo sugiere que razonablemente podría llamarse la “tasa positiva verdadera” (más fácil de recordar). Luego, de manera análoga, debe haber una tasa de falsos positivos (definida por (falsos positivos) / (falsos positivos + verdaderos negativos)). La curva ROC traza la tasa positiva verdadera (en el eje Y) contra la tasa positiva falsa (en el eje X). (Realmente, la curva ROC está trazando las funciones de distribución acumulativa de cada una de ellas, que es cómo se obtiene una curva en lugar de solo un punto. Ver la respuesta de Samarth Brahmbhatt a El valor de precisión, TP / TP + FP es un solo número. Recordar = TP / TP + FN también es un número único. ¿Qué es entonces una curva de recuperación de precisión?)

Calcular la precisión y la recuperación es en realidad bastante fácil. Imagine que hay 100 casos positivos entre 10,000 casos. Desea predecir cuáles son positivos y elige 200 para tener una mejor oportunidad de detectar muchos de los 100 casos positivos. Usted registra los ID de sus predicciones y, cuando obtiene los resultados reales, resume cuántas veces estuvo en lo correcto o incorrecto. Hay cuatro formas de estar bien o mal:

  1. TN / Verdadero negativo: el caso fue negativo y se pronosticó negativo
  2. TP / Verdadero Positivo: el caso fue positivo y predicho positivo
  3. FN / Falso negativo: el caso fue positivo pero predicho negativo
  4. FP / Falso positivo: el caso fue negativo pero predicho positivo

Tiene sentido hasta ahora? Ahora cuenta cuántos de los 10,000 casos caen en cada cubo, por ejemplo:

https://socialprachar.com/course

Precisión = Verdaderos positivos / (Verdaderos positivos + falsos positivos)

Recordar = Positivos verdaderos / Número total = Positivo verdadero / (Positivo verdadero + Falso negativo)

Las curvas características del operador receptor (ROC) se utilizan comúnmente para presentar resultados para problemas de decisión binarios en el aprendizaje automático.

cuando se trata de conjuntos de datos muy asimétricos, las curvas de Precisión-Recuperación (PR) brindan una imagen más informativa del rendimiento de un algoritmo.

Los términos confusos Precisión y recuperación https://www.linkedin.com/pulse/c

Espero que esto ayude a resolver el problema.

More Interesting

¿Los grandes ingenieros de aprendizaje automático siempre leen nuevos trabajos de investigación sobre ML?

¿Cuál es la mejor clase de Machine Learning en Penn?

¿Debo aprender modelado e iluminación después de dominar el modelado en Blender?

¿Deberíamos comenzar con Tensorflow, Keras o Sonnet para desarrollar un sistema de predicción de datos de series temporales? ¿Debemos usar solo lenguajes basados ​​en Python?

Estoy acostumbrado a codificar con C ++ y C #. ¿Cuál recomendaría implementar proyectos de ML a pequeña escala (NN y CNN clásicos) sin reinventar la rueda?

¿Cuáles son algunos proyectos geniales de aprendizaje automático que ha creado?

En los campos de redes neuronales o aprendizaje profundo, ¿qué es un "gráfico computacional"?

¿Cómo se usa SVM y cómo se implementa mejor?

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

Soy un hombre de 25 años que estudió CS, aprendizaje automático y minería de datos para mi maestría. Mi verdadera pasión radica en la música y los viajes. He estado sin trabajo durante 7 a 8 meses, solicito un doctorado en ML y música, y mi papá quiere que consiga un trabajo. ¿Qué debo hacer?

¿Es más probable que una máquina que no ha otorgado un premio mayor otorgue uno que una máquina que acaba de otorgar un premio mayor?

¿Por qué el aprendizaje profundo no tiene un mínimo local?

¿Cómo puede motivar a un estudiante de CS para que aprenda Machine Learning?

¿Es posible combinar dos algoritmos no supervisados ​​en serie para maximizar la precisión?

¿Cuáles son las formas en que puede aplicar la máquina o el aprendizaje profundo al pirateo?