¿Cuál es el próximo tema candente en el aprendizaje automático?

He visto algunos trabajos interesantes realizados con Support Vector Machines. Creo que con el aumento de la potencia informática obtendremos muchas aplicaciones interesantes para ellos.

Se optimizan para clasificar conjuntos de datos (como un clasificador lineal binario), pero pueden lograr algo muy bueno para hacer esencialmente el mismo truco no lineal que hacen las redes neuronales. Lo realmente poderoso que tienen las ANN es la capacidad de aproximar funciones no lineales. Los SVM hacen trampa para lograr esto.

Para separar datos no lineales, pueden usar algo llamado truco del núcleo para empujar esencialmente los datos artificialmente a un espacio dimensional superior para que se separe mediante un hiperplano.

Aquí hay un ejemplo de algunos datos bidimensionales:

Originalmente no era separable linealmente, pero cuando le agrega un núcleo, puede empujarlo a un espacio dimensional más alto (3D) y luego el SVM puede ser entrenado para usar un plano 2D para separar los datos.

El uso del truco del kernel con SVM hace que esto suceda de manera muy rápida y eficiente (utiliza un producto interno para lograr esto, por lo que en realidad no tiene que generar todas esas coordenadas adicionales).

Este es un ejemplo bastante básico; puede tomar muchas más dimensiones iniciales e insertarlas en espacios de características dimensionales mucho más altos de lo que podríamos graficar, y el truco del núcleo le permite hacerlo de manera relativamente económica.

Desearía tener una copia del gráfico a mano, pero vi un caso de uso real de uno de estos en una conferencia reciente donde utilizaron una SVM para separar los perfiles médicos de las personas para determinar si algún medicamento para la artritis reumatoide sería efectivo para ellos. El medicamento tuvo aproximadamente un 80% de efectividad. En algunos casos no hizo nada para los pacientes, y en otros tuvo efectos adversos. En el pasado, lo mejor que podían decir era probarlo y ver qué pasa.

Esto era algo que no era factible decir hace 10 años, pero ahora tenemos la potencia informática (en mainframes) para llevarlo a cabo. Miró a través de un espacio de características masivas (si recuerdo correctamente 10s de miles de entradas) por las que pasó, finalmente seleccionó un número mucho menor de las relevantes y generó un hiperplano para separar a los pacientes con una precisión extremadamente alta.

Aparte de las ANN, las SVM parecen ser un lugar interesante para estar en ML.

Las redes neuronales recurrentes de memoria a corto y largo plazo me parecen muy prometedoras.

Hay un interesante artículo publicado recientemente por Kai Sheng Tai, Richard Socher y Christopher D. Manning (2015) que utiliza LSTM para representaciones semánticas mejoradas … http://arxiv.org/pdf/1503.00075v

También puede encontrar esto interesante …

En mi humilde opinión: hacer que los algoritmos de ML sean más autónomos. El ajuste de los hiperparámetros es tedioso, un sistema debería poder sintonizarse.

Yo iría por el procesamiento del lenguaje natural. Creo que este artículo es un buen punto de partida:
Saltar curvas de PNL: una revisión de la investigación del procesamiento del lenguaje natural [Artículo de revisión].

Hay una buena crítica en Wikipedia:
Procesamiento natural del lenguaje

Quantum Machine Learning es un campo muy interesante: Programa de conferencias: Quantum Robotics Reading Group con algunas posibles promesas de aceleración y nuevas características algorítmicas.

También está surgiendo la disciplina de la IA neuro-cuántica.

More Interesting

¿Sería consciente una inteligencia artificial que pasara una prueba de Turing?

¿Cómo manejan los investigadores de redes neuronales los largos tiempos de entrenamiento? ¿Qué haces mientras esperas?

¿Qué herramienta de IA para Windows 10 puedo usar?

¿Jack Ma tiene razón al decir que la IA causará más dolor social que beneficios en los próximos 30 años?

¿Podría una computadora ser programada para producir más pinturas al estilo de Thomas Kinkade?

¿Cuáles son las mejores bibliotecas de aprendizaje automático?

¿Cuáles son los requisitos básicos que debo cumplir para ingresar a Stanford para MS en informática en especialización de inteligencia artificial?

¿Cómo se expresa el aprendizaje supervisado de una red neuronal de retroalimentación como inferencia en un gráfico de factores?

Si los humanos pudieran aprender a copiar nuestra conciencia e incrustarla en una máquina, como un Transformador, ¿estarías dispuesto?

En un escenario hipotético de adquisición de IA, ¿cómo sería el mundo después de muchos años?

¿Qué lenguajes de programación se usan para programar AI hoy?

¿Cuál es el nombre de este modelo matemático: [matemáticas] \ begin {eqnarray} \ mbox {output} & = & \ left \ {\ begin {array} {ll} 0 & \ mbox {if} \ sum_j w_j x_j \ leq \ mbox {umbral} \\ 1 & \ mbox {if} \ sum_j w_j x_j> \ mbox {umbral} \ end {array} \ right. \ end {eqnarray} [/ math]?

¿Cuál es una explicación intuitiva de cómo funciona la atención en el aprendizaje profundo?

¿Cuáles son los avances actuales en inteligencia artificial?

¿Qué es una explicación intuitiva para las redes neuronales?