¿Qué algoritmos de aprendizaje funcionan basados en datos desequilibrados (eventos raros)?

Hay dos campañas de clasificadores. La primera campaña pertenece a los modelos generativos que aprenden la distribución de probabilidad conjunta Pr (X, Y) donde X es la variable independiente (es decir, el vector de características) e Y es el predictor.

La segunda campaña pertenece a los modelos discriminativos que modelan la distribución de probabilidad condicional Pr (Y | X). El artículo de Andrew es una referencia popular sobre el tema de los clasificadores discriminativos frente a los generadores.

http://ai.stanford.edu/~ang/pape…

Se ha demostrado (matemáticamente y empíricamente) que los modelos discriminativos generalmente superan a los modelos generativos en las tareas de clasificación.

También hay una larga encuesta sobre el tema de la clasificación en presencia de rareza donde informa que los modelos discriminativos superan a las contrapartes generativas, especialmente en términos de recuerdo debido a su marco matemático subyacente. Vea a continuación el documento de Weiss sobre rareza:

http://storm.cis.fordham.edu/gwe…

Related Content

Dada una matriz con 100 elementos (números del 0 al 99), si saco un elemento aleatorio, ¿cómo encontrarías el que saqué? ¿Cómo resolvería esto si 1: la matriz está ordenada o 2: la matriz no está ordenada?

¿Cómo podemos implementar el algoritmo de Prim rápidamente en los concursos de programación?

¿Cómo se puede ser bueno para resolver problemas de algoritmos / programación? Soy un principiante, y me sugirieron que leyera el libro CLRS para aprender sobre algoritmos.

¿Alguien podrá escribir un algoritmo que pueda hacer dinero en el mercado durante un período de 20 años?

¿Cuáles son las ventajas y desventajas de comparar la búsqueda de árboles de Monte Carlo y la programación dinámica aproximada?

¿Cuánto de los algoritmos de Windows 8 y 10 se toman de versiones anteriores de Windows?

¿Existen algoritmos que estructuran datos previamente no estructurados utilizando ‘etiquetas’ definidas por el usuario?

More Interesting

¿Qué algoritmo se usa para obtener la cadena correcta de una muestra de cadenas?

¿Cuál es el algoritmo de tiempo polinómico de peor caso de más rápido crecimiento utilizado en la práctica?

¿Cuáles son los posibles algoritmos utilizados en los juegos de carrera sin fin?

Cómo mostrar un problema es NP completo

¿Cómo se puede explicar el algoritmo para la conversión de un número binario a un hexadecimal (código fuente incluido)?

¿Cuáles son algunos de los mejores libros sobre Estructura de datos y Algoritmo en Java para principiantes?

¿Hay algún problema para el cual se pruebe que no existe un algoritmo óptimo?

¿Qué algoritmo se utiliza en los puntos de calificación para las clasificaciones de cricket ICC?

¿Qué es un algoritmo que calculará si se puede pagar la cantidad [math] n [/ math] si tenemos un suministro ilimitado de monedas para cada valor entre [math] a [/ math] y [math] b [/ math] ?

Cómo aprender estructuras de datos y algoritmos lo suficientemente buenos como para conseguir un trabajo en 10 meses

¿Cuál es un buen algoritmo de hash para identificar de forma exclusiva una URL en una base de datos?

¿Desglosar el problema en piezas más pequeñas siempre ofrece una mejor solución?

¿Cuál es el algoritmo detrás de las OTP (contraseñas de un solo uso)?

Cómo evaluar el efecto del programa de seguridad vial en el comportamiento después de 7 años de implementación si no hay datos de referencia

Cómo guardar una entrada del usuario en una matriz definida en Java

Web Analytics