En mi opinión, uno de los mayores problemas abiertos en el aprendizaje automático es cómo aprender eficientemente los parámetros de los modelos de variables latentes / ocultas. Algunos ejemplos de problemas de aprendizaje variables latentes son los siguientes:
- Se le proporciona un conjunto de documentos, agrúpelos en temas. Los temas son las variables latentes.
- Se le dan un conjunto de oraciones en inglés, aprenda de las oraciones cómo analizarlas en árboles de análisis o estructuras de análisis de dependencia. Se observan las palabras pero las estructuras de análisis son variables ocultas.
- Se le dan los cuadros delimitadores de objetos en las imágenes y se supone que debe aprender cómo detectar los objetos, pero también aprender a descomponer los objetos en partes. Se observan las imágenes y los cuadros delimitadores, pero el número y la posición de las partes del objeto son variables ocultas.
Esa es una lista corta. Hay todo tipo de problemas de este tipo en los que le gustaría modelar algo en términos de alguna estructura adicional que no es directamente observable en los datos. Nuevamente, tome el inglés como ejemplo. Usted sabe que el árbol de análisis le brinda información importante sobre una oración, pero las oraciones normalmente no vienen con árboles de análisis. Tienes que inferirlo de alguna manera solo observando oraciones regulares en inglés que no estén anotadas con sus árboles de análisis.
La forma en que lidiamos con este tipo de problemas hoy es a menudo haciendo que algún humano suministre explícitamente las variables ocultas como entrada regular. Por ejemplo, existen excelentes algoritmos para aprender a analizar el inglés, pero se basan en métodos supervisados de aprendizaje automático que abarcan grandes corpus de oraciones en inglés que los lingüistas han analizado manualmente. El problema con este tipo de enfoque es que es una tarea demasiado grande crear un conjunto de datos de inglés analizado que sea lo suficientemente rico y grande como para permitir que las máquinas analicen el inglés y el ser humano. Entonces, incluso hoy, los mejores métodos de análisis no son tan buenos. Además, de alguna manera, los niños humanos aprenden a comprender la estructura del inglés sin que alguien les muestre millones de ejemplos de oraciones y sus correspondientes estructuras de análisis. Lo mismo ocurre con todos los demás problemas de aprendizaje de variables ocultas. De alguna manera, los humanos podemos lidiar con estos problemas de variables ocultas, pero actualmente el aprendizaje automático no. Así que esta es un área excelente para futuras investigaciones.
- ¿Puedo controlar las señales neuronales desde un lugar?
- ¿Es posible usar bibliotecas de aprendizaje automático OpenCV para aplicaciones que no son de visión por computadora?
- ¿Existen aplicaciones prácticas útiles y serias de redes neuronales que se ejecutan localmente en aplicaciones de teléfonos inteligentes móviles?
- ¿Cómo puedo comenzar el trabajo de investigación sobre aprendizaje automático y cómo puedo elegir un tema o problema en el aprendizaje automático?
- ¿Qué son las redes amplias?
Finalmente, hay algunos métodos clásicos para tratar esto, como el algoritmo Expectation-maximization. También ha habido una gran investigación reciente que utiliza métodos espectrales para abordar este problema, un gran ejemplo del cual es http://newport.eecs.uci.edu/anan….