¿Qué algoritmos de aprendizaje funcionan basados ​​en datos desequilibrados (eventos raros)?

Hay dos campañas de clasificadores. La primera campaña pertenece a los modelos generativos que aprenden la distribución de probabilidad conjunta Pr (X, Y) donde X es la variable independiente (es decir, el vector de características) e Y es el predictor.

La segunda campaña pertenece a los modelos discriminativos que modelan la distribución de probabilidad condicional Pr (Y | X). El artículo de Andrew es una referencia popular sobre el tema de los clasificadores discriminativos frente a los generadores.

http://ai.stanford.edu/~ang/pape…

Se ha demostrado (matemáticamente y empíricamente) que los modelos discriminativos generalmente superan a los modelos generativos en las tareas de clasificación.

También hay una larga encuesta sobre el tema de la clasificación en presencia de rareza donde informa que los modelos discriminativos superan a las contrapartes generativas, especialmente en términos de recuerdo debido a su marco matemático subyacente. Vea a continuación el documento de Weiss sobre rareza:

http://storm.cis.fordham.edu/gwe…

More Interesting

¿Qué algoritmo se usa para obtener la cadena correcta de una muestra de cadenas?

¿Cuál es el algoritmo de tiempo polinómico de peor caso de más rápido crecimiento utilizado en la práctica?

¿Cuáles son los posibles algoritmos utilizados en los juegos de carrera sin fin?

Cómo mostrar un problema es NP completo

¿Cómo se puede explicar el algoritmo para la conversión de un número binario a un hexadecimal (código fuente incluido)?

¿Cuáles son algunos de los mejores libros sobre Estructura de datos y Algoritmo en Java para principiantes?

¿Hay algún problema para el cual se pruebe que no existe un algoritmo óptimo?

¿Qué algoritmo se utiliza en los puntos de calificación para las clasificaciones de cricket ICC?

¿Qué es un algoritmo que calculará si se puede pagar la cantidad [math] n [/ math] si tenemos un suministro ilimitado de monedas para cada valor entre [math] a [/ math] y [math] b [/ math] ?

Cómo aprender estructuras de datos y algoritmos lo suficientemente buenos como para conseguir un trabajo en 10 meses

¿Cuál es un buen algoritmo de hash para identificar de forma exclusiva una URL en una base de datos?

¿Desglosar el problema en piezas más pequeñas siempre ofrece una mejor solución?

¿Cuál es el algoritmo detrás de las OTP (contraseñas de un solo uso)?

Cómo evaluar el efecto del programa de seguridad vial en el comportamiento después de 7 años de implementación si no hay datos de referencia

Cómo guardar una entrada del usuario en una matriz definida en Java