¿Qué es el aprendizaje activo?

El aprendizaje activo es un paradigma desarrollado por Ray Mooney y sus colegas (ver: http://www.cs.utexas.edu/~ml/pub…) donde el algoritmo de aprendizaje recibe un gran conjunto de ejemplos sin etiquetar y un pequeño conjunto de ejemplos etiquetados El algoritmo luego selecciona cuál de los ejemplos no etiquetados quiere etiquetar.

Por ejemplo, considere la tarea de etiquetar partes de una oración (este es un sustantivo, este es un verbo, etc.).

El aprendizaje supervisado tradicional funciona dando muchos ejemplos etiquetados a mano. Pero lleva mucho tiempo etiquetar mucho texto. Puede que tenga que etiquetar 10,000 ejemplos para construir un modelo decente.

En lugar de etiquetar muchos ejemplos, puede etiquetar manualmente 100 ejemplos. El aprendizaje activo analiza todas las oraciones y le pide que etiquete 100 ejemplos más que se seleccionan porque son los más discriminatorios. Luego hace esto por algunas rondas más, y en lugar de necesitar 10,000 ejemplos, necesita 1,000.

Cómo comenzar con el modelado predictivo

¿Qué significan las redes bayesianas en Machine Learning?

Según muchas personas, la inteligencia artificial y el aprendizaje automático son las principales razones de los despidos de trabajo de TI. ¿Qué trabajos han sido reemplazados por estas disciplinas?

¿Cuál es el significado físico de usar SVD / NMF en una matriz de correlación espacial?

¿Por qué los servicios en línea le piden que invite a sus amigos antes de probar el producto?

¿Cuál es el futuro de los sitios web de chat extraños?

Es solo un nuevo nombre para una idea bien establecida e intuitiva, que ha resurgido ahora después de mucho tiempo.

Suponga por el momento que todos los datos se generan a través de experimentos (o llame al proceso de generación de datos como experimentos). Entonces, tiene mucho sentido hacer la pregunta: ¿cómo debo diseñar mis experimentos para obtener datos de máxima información para sacar buenas conclusiones? Esto es esencialmente lo que hace el aprendizaje activo: utiliza los datos disponibles hasta ahora para construir modelos, y diseña o consulta de manera óptima nuevos puntos de datos que mejor actualicen su modelo en lugar de simplemente validar el mismo.

Esto se usa todo el tiempo en estadísticas para predecir elecciones, por ejemplo. Digamos que estamos viendo una ciudad y la hemos dividido en zonas N, S, W y E. Inicialmente, tomamos muestras al azar de la población en todas las zonas y suponemos que las regiones N y S tienen una mayoría abrumadora, mientras que está mucho más cerca en W y E. Tiene mucho sentido invertir los recursos restantes para tomar muestras de W y E para que obtienes mejores predicciones.

Justin Rising

Aprendizaje automático activo: se implementa cuando hay una gran cantidad de puntos de datos no etiquetados y obtener la etiqueta de cualquier punto de datos es muy costoso.
Esto también se llama muestreo activo o muestreo selectivo.

A – algoritmo de aprendizaje activo
U – conjunto de gran cantidad de puntos de datos sin marcar
O – oráculo A puede consultar para encontrar la etiqueta del punto de datos d. Esto es costoso (por ejemplo: O podría ser un experto humano). Caro porque O puede etiquetar casi un pequeño subconjunto de U.

El objetivo de A es seleccionar activamente esos puntos de U para que se aprenda una buena hipótesis todo el tiempo utilizando la menor cantidad posible de ejemplos etiquetados (cuidadosamente seleccionados).
Una posible estrategia para A es: elegir puntos etiquetados que estén cerca del límite de decisión (real). Esto funciona bien solo si A es “consciente” de regiones importantes del espacio de muestra / datos.

Justin Rising

More Interesting

Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

¿Cuál es el impacto de la limitación de la velocidad de la luz en el aprendizaje automático?

¿Cuál es el algoritmo de aprendizaje automático más rápido para implementar para la detección de fraudes?

¿Por qué las arquitecturas de aprendizaje profundo como CNN, Faster R-CNN o SSD están abiertas a todos? ¿Por qué estas personas no pueden patentar estas arquitecturas?

¿Qué es el remuestreo en el aprendizaje automático?

¿Cuáles son algunos ejemplos de código de modelos de aprendizaje automático humanos en el circuito? Me ha resultado difícil encontrar tutoriales / documentos que discutan este tema.

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

Cómo usar OpenCV en combinación con Scikit-learn

¿Cómo debo aprender el aprendizaje automático? ¿Puede proporcionar una hoja de ruta específica desde un principiante hasta un experto?

¿Cuál es la relación entre K-means y PCA?