¿Cuáles son las ventajas del aprendizaje semi-supervisado sobre el aprendizaje supervisado y no supervisado?

Obviamente, está trabajando con un conjunto de datos etiquetado cuando está construyendo modelos (generalmente predictivos) utilizando aprendizaje supervisado. El objetivo del aprendizaje no supervisado es a menudo de naturaleza exploratoria (agrupación, compresión) trabajando con datos no etiquetados.

En el aprendizaje semi-supervisado, básicamente está tratando de resolver un enfoque de aprendizaje supervisado utilizando datos etiquetados, aumentados por (típicamente una pequeña cantidad de) datos no etiquetados. Por lo tanto, el objetivo es superar uno de los problemas del aprendizaje supervisado: no tener suficientes datos etiquetados. Al agregar datos baratos y abundantes sin etiquetar, espera construir un modelo mejor que usar solo el aprendizaje supervisado.

Aunque el aprendizaje semi-supervisado suena como un enfoque poderoso, tenga cuidado. El aprendizaje semi-supervisado no siempre es “el martillo del clavo” que está buscando, a veces funciona muy bien, a veces no. Por ejemplo, revise el siguiente documento:

Singh, Aarti, Robert Nowak y Xiaojin Zhu. “Datos sin etiquetar: ahora ayuda, ahora no”. Avances en los sistemas de procesamiento de información neuronal. 2009. (http://www.cs.cmu.edu/~aarti/pub…)

Además, tenga en cuenta que debe hacer ciertas suposiciones (suposiciones múltiples, agrupadas o de suavidad; consulte aquí para obtener más detalles: Aprendizaje semi-supervisado).

More Interesting

¿Es realmente necesaria la programación competitiva para campos como la ciencia de datos o el aprendizaje automático y para solicitar gigantes tecnológicos?

¿Qué debo usar para el aprendizaje automático si necesito una solución rápida: Python, R o SAS?

¿Se utiliza Machine Learning fuera de las startups y otras "nuevas" empresas?

¿Cuáles son los algoritmos de aprendizaje profundo que pueden corregir los errores de reconocimiento óptico de caracteres (OCR)?

¿Qué significa 'estimación ML o MAP no captura la incertidumbre de los parámetros'?

¿Cómo puede Google diseñar un procesador más adecuado para el entrenamiento de redes neuronales profundas que la GPU?

¿Cómo funciona la codificación de características de alta cardinalidad con regresión de cresta?

¿Cómo debo entrenar mi modelo de tren con un modelo de regresión?

¿Cuál es la diferencia entre gaussiano y bayesiano?

¿Cuáles son las similitudes y diferencias entre los campos aleatorios condicionales (CRF) y las redes de Markov de margen máximo (M3N)?

¿A quién o qué investigación de laboratorio en aprendizaje automático le parece más interesante?

¿Qué algoritmos de aprendizaje automático para la clasificación admiten el aprendizaje en línea?

¿Cuál es la diferencia entre hash y minhashing sensibles a la localidad?

¿La programación de Python es suficiente para el aprendizaje automático o deberíamos aprender R también?

¿En qué se diferencia el aprendizaje profundo del perceptrón multicapa?