En cuanto a cómo interpretar el área bajo la curva, esta es la mejor manera que sé para explicarlo: Aprendizaje automático: ¿Qué es una explicación intuitiva de AUC?
La respuesta a su pregunta depende del significado de “adivinanzas aleatorias”. Como dice Ferenc, ROC solo tiene sentido en el contexto de un clasificador que asigna una probabilidad a cada ejemplo, y luego hace una clasificación binaria al compararlo con un umbral.
Si quiere decir que el clasificador elige 0 o 1, con igual probabilidad, ya que la probabilidad de que cada ejemplo sea positivo, obtendrá aproximadamente su respuesta. La “curva” incluye (0,0) y (1,1) y algún punto cercano (0.5,0.5) y nada más. El valor exacto del punto en el medio depende de cuántos de los ejemplos fueron asignados aleatoriamente para ser positivos o negativos, pero debe tender a (0.5,0.5) a medida que crece el número de ejemplos, claro.
- ¿Es la reducción de dimensionalidad igual que la selección de características? ¿Cómo hacer la selección de características usando PCA en R?
- ¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?
- ¿Qué herramientas, algoritmos o estructuras de datos usaría para construir un algoritmo de "Temas de tendencias" para una transmisión de alta velocidad?
- ¿Es obligatoria la experiencia de aprendizaje automático para conseguir un trabajo con Google? ¿Es realmente un tema importante en las universidades?
- ¿Qué opinas de la exageración actual sobre Deep Learning?
Si quiere decir que el clasificador selecciona aleatoriamente una probabilidad en [0,1], entonces la curva ROC se parece a una línea que vaga cerca de x = y. A medida que cambia el umbral, es más probable que obtenga falsos positivos como verdaderos positivos. Dada la explicación vinculada anteriormente, eso es equivalente a decir que es tan probable que pises hacia la izquierda o hacia abajo a medida que avanzas de (1,1) a (0,0). La curva exacta dependerá de las probabilidades aleatorias elegidas, por supuesto, pero tenderá a x = y a medida que crezca el número de ejemplos.