¿Qué es el aprendizaje activo?

El aprendizaje activo es un paradigma desarrollado por Ray Mooney y sus colegas (ver: http://www.cs.utexas.edu/~ml/pub…) donde el algoritmo de aprendizaje recibe un gran conjunto de ejemplos sin etiquetar y un pequeño conjunto de ejemplos etiquetados El algoritmo luego selecciona cuál de los ejemplos no etiquetados quiere etiquetar.

Por ejemplo, considere la tarea de etiquetar partes de una oración (este es un sustantivo, este es un verbo, etc.).

El aprendizaje supervisado tradicional funciona dando muchos ejemplos etiquetados a mano. Pero lleva mucho tiempo etiquetar mucho texto. Puede que tenga que etiquetar 10,000 ejemplos para construir un modelo decente.

En lugar de etiquetar muchos ejemplos, puede etiquetar manualmente 100 ejemplos. El aprendizaje activo analiza todas las oraciones y le pide que etiquete 100 ejemplos más que se seleccionan porque son los más discriminatorios. Luego hace esto por algunas rondas más, y en lugar de necesitar 10,000 ejemplos, necesita 1,000.

Es solo un nuevo nombre para una idea bien establecida e intuitiva, que ha resurgido ahora después de mucho tiempo.

Suponga por el momento que todos los datos se generan a través de experimentos (o llame al proceso de generación de datos como experimentos). Entonces, tiene mucho sentido hacer la pregunta: ¿cómo debo diseñar mis experimentos para obtener datos de máxima información para sacar buenas conclusiones? Esto es esencialmente lo que hace el aprendizaje activo: utiliza los datos disponibles hasta ahora para construir modelos, y diseña o consulta de manera óptima nuevos puntos de datos que mejor actualicen su modelo en lugar de simplemente validar el mismo.

Esto se usa todo el tiempo en estadísticas para predecir elecciones, por ejemplo. Digamos que estamos viendo una ciudad y la hemos dividido en zonas N, S, W y E. Inicialmente, tomamos muestras al azar de la población en todas las zonas y suponemos que las regiones N y S tienen una mayoría abrumadora, mientras que está mucho más cerca en W y E. Tiene mucho sentido invertir los recursos restantes para tomar muestras de W y E para que obtienes mejores predicciones.

Aprendizaje automático activo: se implementa cuando hay una gran cantidad de puntos de datos no etiquetados y obtener la etiqueta de cualquier punto de datos es muy costoso.
Esto también se llama muestreo activo o muestreo selectivo.

A – algoritmo de aprendizaje activo
U – conjunto de gran cantidad de puntos de datos sin marcar
O – oráculo A puede consultar para encontrar la etiqueta del punto de datos d. Esto es costoso (por ejemplo: O podría ser un experto humano). Caro porque O puede etiquetar casi un pequeño subconjunto de U.

El objetivo de A es seleccionar activamente esos puntos de U para que se aprenda una buena hipótesis todo el tiempo utilizando la menor cantidad posible de ejemplos etiquetados (cuidadosamente seleccionados).
Una posible estrategia para A es: elegir puntos etiquetados que estén cerca del límite de decisión (real). Esto funciona bien solo si A es “consciente” de regiones importantes del espacio de muestra / datos.

More Interesting

Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

¿Cuál es el impacto de la limitación de la velocidad de la luz en el aprendizaje automático?

¿Cuál es el algoritmo de aprendizaje automático más rápido para implementar para la detección de fraudes?

¿Por qué las arquitecturas de aprendizaje profundo como CNN, Faster R-CNN o SSD están abiertas a todos? ¿Por qué estas personas no pueden patentar estas arquitecturas?

¿Qué es el remuestreo en el aprendizaje automático?

¿Cuáles son algunos ejemplos de código de modelos de aprendizaje automático humanos en el circuito? Me ha resultado difícil encontrar tutoriales / documentos que discutan este tema.

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

Cómo usar OpenCV en combinación con Scikit-learn

¿Cómo debo aprender el aprendizaje automático? ¿Puede proporcionar una hoja de ruta específica desde un principiante hasta un experto?

¿Cuál es la relación entre K-means y PCA?

¿Cómo es trabajar en el equipo de Machine learning / Data Mining?

¿Qué son los asombrosos papeles gráficos de conocimiento?

¿Qué libros o recursos de probabilidad y estadística debo consultar antes de sumergirme en Machine Learning, PNL, minería de datos, etc.? Soy un completo principiante.

¿Es mejor utilizar algoritmos basados ​​en reglas o de aprendizaje automático para la clasificación en un dominio de respuesta a preguntas cerrado?

Cómo construir una aplicación web con capacidades de aprendizaje automático