¿Cuáles son las áreas de investigación abiertas en refuerzo y aprendizaje profundo?

(Suponiendo que escribir sobre uno de los campos en la pregunta es suficiente).

Para el aprendizaje profundo todavía hay muchos problemas de investigación no resueltos, en particular relacionados con aplicaciones como la medicina. También hay áreas más cercanas a su núcleo, p. Ej.

  • desarrollar y refinar la teoría del aprendizaje profundo para explicar por qué y cómo funcionan (por ejemplo, proporcionar una explicación teórica y completa de preguntas como ¿Por qué el aprendizaje de la red neuronal se ralentiza a medida que el error disminuye? ¿Es necesario que sea así?)
  • Otras áreas que, en mi opinión, se encuentran en la fase inicial de investigación es el aprendizaje profundo para el procesamiento del lenguaje natural , en particular los modelos basados ​​en caracteres (a diferencia del pasado reciente con modelos basados ​​en palabras). Dado que los modelos basados ​​en caracteres como p. Ej. [1502.01710] Text Understanding from Scratch (véanse también los documentos que citan ese artículo en Google Scholar) utilizan con frecuencia redes neuronales convolucionales, varias de las técnicas utilizadas actualmente en el reconocimiento de imágenes no se han probado para el texto (p. Ej. aplicando y adaptando técnicas de [1603.09382] Deep Networks with Stochastic Depth nunca ha sido probado en redes profundas basadas en caracteres.

Aprendizaje profundo en medicina

Un gran campo de aplicación es la medicina ( en particular, relacionada con el aprendizaje profundo basado en imágenes ). Un enfoque potencial para encontrar un buen área de investigación es, por ejemplo, buscar en las Listas de enfermedades (Wikipedia) y quizás ordenarlas por prevalencia, incidencia o costo (por ejemplo, los costos relacionados con Alzheimer y otros tipos de demencia son de $ 236 mil millones por año, ref: más reciente Datos y cifras de Alzheimer) e investigue qué tipos de datos se recopilan típicamente por enfermedad (por ejemplo, durante los diagnósticos). Los ejemplos de datos médicos (imagen) incluyen varios tipos de rayos X, ultrasonido, MRI / fMRI, EEG, Termografía (ver Imágenes médicas para más detalles). Si crea una matriz de enfermedades a lo largo de un eje y tipos de datos a lo largo del otro eje, puede trazar un mapa de las posibles áreas de investigación y tal vez comenzar con un estudio previo donde trazar un mapa donde ya se está llevando a cabo una investigación de aprendizaje profundo.

A pesar de que hay una gran cantidad de investigación en Deep Learning y la medicina está lejos de todas las áreas cubiertas y que yo sepa, ninguna área está “resuelta” (nota al margen: el aprendizaje profundo acaba de comenzar a aparecer en equipos médicos comerciales, por ejemplo, Samsung Medison revela Deep dispositivo de imágenes de ultrasonido de mama basado en el aprendizaje – Pulse by Maeil Business News Korea )

Descargo de responsabilidad : esta publicación apenas rasca la superficie en áreas de investigación potenciales en Deep Learning, todavía es en general un campo de investigación abierto.

Encontrar mejores agentes para el aprendizaje de refuerzo multitarea es un área de investigación abierta (y probablemente siempre lo será). Los agentes de aprendizaje por refuerzo tampoco han podido lograr actuaciones similares a las de los humanos en plataformas del mundo real como la robótica. Esto se puede clasificar como un área de investigación abierta.

OpenAI ha hecho un trabajo maravilloso al delinear y enumerar las principales preguntas de investigación en el aprendizaje por refuerzo. Estos se enumeran bajo la apariencia de proporcionar problemas a los profesionales para perfeccionar sus habilidades, pero no se deje engañar. Algunos de ellos son, al momento de escribir esta respuesta, problemas muy difíciles de abordar.

More Interesting

¿Cuál es el significado / interpretación de la varianza de validación cruzada?

Cómo calcular la ganancia de información para cada atributo si estoy diseñando un árbol clasificador de decisiones con nodos binarios en cada derrame

¿Qué es el mecanismo de atención en redes neuronales?

¿Cuál es una forma útil de clasificar los usos de las tecnologías de inteligencia artificial?

¿Cuál es la función de las máquinas restringidas de Boltzmann para el filtrado colaborativo?

¿Por qué siempre ponemos log () en la estimación de máxima verosimilitud antes de estimar el parámetro?

¿Es posible detectar una estructura de acordes en una canción usando el aprendizaje profundo? Si es así, ¿cómo?

¿Cuáles son las mejores mejores bibliotecas para la clasificación? ¿Cómo se comparan entre sí?

¿Cuál es la diferencia entre gradiente de política determinista y gradiente de política estocástica?

¿Cuáles son sus 5 mejores técnicas empíricas para detectar BS?

¿Qué es una capa de disminución de resolución en la red neuronal convolucional (CNN)?

¿Puede word2vec considerarse aprendizaje profundo?

¿Por qué debería uno aprender el aprendizaje automático desde cero en lugar de aprender a usar las bibliotecas disponibles?

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

¿Cuál es el mejor método para la reducción de dimensionalidad y la selección / extracción de características en datos de espectrometría de masas?