¿Qué significa cuando una curva ROC no es suave?

Por lo general, significa que su modelo solo puede proporcionar predicciones discretas, en lugar de una puntuación continua. Esto a menudo se puede remediar agregando más muestras a su conjunto de datos, teniendo características más continuas en el modelo, más características en general o utilizando una especificación de modelo que proporcione una salida de predicción continua.

La razón por la que ocurre en un árbol de decisión es que a menudo haces divisiones binarias; Esto es eficiente computacionalmente, pero solo da 2 ^ n agrupaciones. A menos que su n número de divisiones sea muy grande, solo tendrá 16/32/64/128 grupos, mientras que si usara un algoritmo como la regresión logística y las variables continuas, su predicción caería en el rango continuo entre 0 y 1. No estoy familiarizado con el tipo de datos que enumeró, pero sospecho que tiene muchos datos categóricos.

No es necesariamente un problema tener un ROC que sea discreto en lugar de suave, realmente depende de sus objetivos para el modelo (descriptivo vs prescriptivo), así como de qué tan bien se ajusta su modelo en los conjuntos de datos fuera de la muestra. Muchos de los problemas que he resuelto en mi carrera solo necesitaban una línea de Sí / No (como enviar un correo electrónico a esta persona / no enviar un correo electrónico), por lo que no era necesario tener una predicción continua y fluida a lo largo del rango de entradas.

Esto es solo una cuestión de ley de grandes números. La mayoría de las curvas ROC se han promediado en múltiples ejecuciones de simulación. Es particularmente obvio cuando cada curva ROC individual se basa en predicciones discretas muy pequeñas.

More Interesting

Quiero aprender por mi cuenta Big data / Hadoop. ¿Cuál debería ser el enfoque más eficiente?

¿Cuál es la correlación entre PNL, IA, aprendizaje automático, big data y ciencia de datos? ¿Existe una jerarquía o algo en común entre estos? ¿Cómo se relacionan estos problemas con el mundo real?

Estoy investigando Harvard CS 109. ¿Cuánto tiempo de compromiso semanal necesitaré? ¿Hay alguna forma de reducir eso mediante una preparación previa?

¿Qué se puede inferir de esta gráfica de función de autocorrelación con pendiente descendente totalmente positiva?

Mis tesis de licenciatura y maestría son en procesamiento de imágenes y aprendizaje automático. ¿Está mal intentar otros temas en mi doctorado?

¿Cuál es la forma más eficiente de almacenar datos localmente en un Android (Programación de Android)?

¿Cómo se importan los datos en la programación R y qué metodologías se utilizan?

¿Cómo es útil Python en análisis de datos? ¿Qué características le dan una ventaja sobre otras herramientas de ciencia de datos?

¿Cuáles son algunas ideas muy buenas de minería de datos o algoritmos de búsqueda basados ​​en gráficos para un proyecto menor?

¿Es la ciencia de datos y big data la próxima gran novedad en tecnología?

¿Cuál es la diferencia entre analista de datos y científico?

Al entrenar un modelo de ML, ¿debo descartar los datos que tienen características faltantes o debo usar un valor medio para esos valores faltantes?

¿En qué tecnología el crecimiento es mayor si necesitamos elegir uno de JAVA y BIG DATA?

Si se le dieran los recursos y el tiempo necesarios, ¿qué problema elegiría abordar personalmente con el aprendizaje automático?

¿Cuáles son los mejores ejemplos del uso de big data en la sostenibilidad corporativa?