¿Cuáles son las áreas más interesantes de la investigación / aplicaciones actuales en el aprendizaje semi-supervisado?

Un área interesante es la de las máquinas de vectores de soporte transductivo (TSVM). La intuición detrás de ese algoritmo es que se podría obtener un mejor límite de decisión maximizando el margen para los datos no etiquetados, así como los datos etiquetados, con el supuesto de que un grupo de puntos de datos densos es probable que sean de la misma clase. Formalmente, la función objetivo SVM (lineal, binaria, sin variables de holgura para mayor claridad) se extiende a

[matemática] O (w) = \ sum_ {l \ in L} sgn (w ^ T x_l) y_l + C \ sum_ {u \ in U} (1- | w ^ T x_u |) _ + [/ math]

donde [math] (x) _ + = \ mbox {max} (x, 0) [/ math] y falta el término de regularización [math] || w || ^ 2 [/ math] debido a los límites de longitud en las ecuaciones . Esto penaliza los puntos de datos no etiquetados que caen dentro del margen, con un peso apropiado [matemática] C [/ matemática]. Tenga en cuenta que el término 1, correspondiente al término objetivo normal de SVM, es convexo, mientras que el término 2, la parte TSVM, es cóncavo. Esta propiedad hace que la función sea difícil de optimizar directamente.

Hay dos enfoques principales para minimizar [matemáticas] O (w) [/ matemáticas]. [1] describe la aplicación de la programación convexa-cóncava al problema, donde optimizan la función objetivo directamente. Es un algoritmo bastante complicado, por lo que se ofrece una alternativa en [2]: use la aproximación

[matemáticas] (1- | x |) _ + \ aprox \ exp (-3x ^ 2) [/ matemáticas]

Que es diferenciable. Los autores parecen haber tenido cierto éxito con él.

[1] Ronan Collobert, Fabian Sinz, Jason Weston, Lon Bottou y Thorsten Joachims. Svms transductores a gran escala. JMLR , página 2006.
[2] Olivier Chapelle y Alexander Zien. Clasificación semi-supervisada por separación de baja densidad. En proc. de int. Taller sobre IA y estadística , 2005.

AprendizajeAprendizaje profundoautomáticoEstadística (disciplina académica)Inteligencia Artificial

Related Content

¿Cuánto tiempo pasa hasta que los trabajos de prueba de software se automatizan con la ayuda de Machine Learning y AI?

¿Qué métodos efectivos automatizados / arquitectónicos existen para detectar trolls en línea?

¿Cuáles son los campos más interesantes en los que se está utilizando ML hoy en día?

¿Puede proporcionar una situación o ejemplo muy simple para el que se utiliza Machine Learning?

¿Por qué Noam Chomsky es tan pesimista sobre el progreso en Inteligencia Artificial?

¿Quién está más cerca de desarrollar una verdadera IA?

¿Hay reglas de juego de código abierto o proyecto de motor de IA?

Una de las investigaciones más interesantes en SSL son los métodos basados en gráficos. Ha demostrado mucho éxito en muchas aplicaciones que van desde el procesamiento del lenguaje natural hasta la clasificación de proteínas.
1) SSL en gráficos de Zhu (WSU) [Propagación de etiqueta]
2) SSL con regularización múltiple (Univ of Chicago)

1 y 2 son los primeros trabajos aparecidos en NIPS n ICML.

Vladimir Novakovski

mi respuesta fue rechazada, así que intentaré nuevamente con algo totalmente diferente

Además de la respuesta de Tudor Achim, el problema de TSVM se puede resolver mediante recocido determinista

Aprendizaje automático con etiquetas faltantes: SVM transductoras

el enfoque está disponible en un paquete de código abierto llamado svmlin

Vladimir Novakovski

More Interesting

¿Por qué la gente prefiere Python como lenguaje de IA?

Dada la variedad y el éxito de sus productos, ¿cómo podría la evolución por selección natural sugerir un modelo de inteligencia, y cómo podría aplicarse ese modelo al desarrollo de la IA (o tal vez ya se esté aplicando)?

¿Cuáles son las cinco principales industrias (por ejemplo, minorista, finanzas, etc.) que están en mayor riesgo por la automatización, la inteligencia artificial y la robótica que reemplazan los trabajos humanos?

¿Qué tan bueno es TensorFlow como una biblioteca de aprendizaje profundo y qué otras bibliotecas se deben tener en cuenta?

¿Puedo convertir la foto de alguien en un logotipo (en Photoshop o AI) y usarla como el logotipo de mi empresa?

¿Qué es el muestreo de control de casos? ¿Cuándo se usa en el aprendizaje automático?

¿Qué lenguajes de programación se usan para programar AI hoy?

¿Qué es sobre el aprendizaje neural?

Cómo crear una IA como Siri o JARVIS

¿Hay alguna base de datos que dé resultados basados en la entrada de voz?

Cómo construir un sitio web usando Python, para hacer procesamiento de imágenes y aprendizaje automático

¿Se pueden clasificar Google Car y Google Glass como computadoras de quinta generación?

¿Qué ventajas hay en obtener un MD / PhD en CS en lugar de un MD / PhD en aprendizaje automático si quieres estudiar IA?

Debido a los avances en IA, ¿hay alguna posibilidad de creación de extraterrestres (en forma de robots)?

¿La neurociencia computacional está relacionada con la inteligencia artificial de alguna manera?

Web Analytics