El aprendizaje activo es un paradigma desarrollado por Ray Mooney y sus colegas (ver: http://www.cs.utexas.edu/~ml/pub…) donde el algoritmo de aprendizaje recibe un gran conjunto de ejemplos sin etiquetar y un pequeño conjunto de ejemplos etiquetados El algoritmo luego selecciona cuál de los ejemplos no etiquetados quiere etiquetar.
Por ejemplo, considere la tarea de etiquetar partes de una oración (este es un sustantivo, este es un verbo, etc.).
El aprendizaje supervisado tradicional funciona dando muchos ejemplos etiquetados a mano. Pero lleva mucho tiempo etiquetar mucho texto. Puede que tenga que etiquetar 10,000 ejemplos para construir un modelo decente.
- ¿Cuál es la diferencia entre regresión lineal y logística?
- Cómo crear mi propia biblioteca de tokenizadores en PNL
- ¿Cómo escapa / resiste una red neuronal profunda a la maldición de la dimensionalidad?
- Cómo aprender el aprendizaje automático desde el nivel cero
- Construcción del modelo de correlación / regresión: ¿Cuándo debo usar variables dependientes / independientes reales, y cuándo debo usar sus tasas de crecimiento?
En lugar de etiquetar muchos ejemplos, puede etiquetar manualmente 100 ejemplos. El aprendizaje activo analiza todas las oraciones y le pide que etiquete 100 ejemplos más que se seleccionan porque son los más discriminatorios. Luego hace esto por algunas rondas más, y en lugar de necesitar 10,000 ejemplos, necesita 1,000.