¿Por qué el aprendizaje en estructuras de datos complejas (gráficos, árboles, etc.) está tan poco representado en el aprendizaje automático?

No está subrepresentado. Hay muchos documentos sobre esto, demasiados para enumerar en una respuesta de Quora. Podría decirse que es una de las mayores áreas de investigación actuales. Pero aquí hay algunos excelentes con los que puede comenzar:

  • Predicción de objetos estructurados con máquinas de vectores de soporte por Thorsten Joachims, Thomas Hofmann, Yisong Yue y Chun-nam Yu
  • Formación en plano de corte de SVM estructurales, aprendizaje automático por T. Joachims, T. Finley, Chun-Nam Yu
  • Máquinas ocultas de vectores de soporte de Markov por Y. Altun, I. Tsochantaridis, T. Hofmann
  • Un método primal-dual para campos aleatorios de Markov de múltiples capas de orden superior por Alexander Fix, Chen Wang, Ramin Zabih

Y aquí hay algunos grandes libros sobre el tema:

  • Predicción estructurada y aprendizaje en visión artificial por Sebastian Nowozin y Christoph H. Lampert
  • Predicción de datos estructurados por Gökhan BakIr, Thomas Hofmann, Bernhard Schölkopf, Alexander J. Smola, Ben Taskar y SVN Vishwanathan

Y finalmente, aquí hay dos bibliotecas de aprendizaje automático (ambas publicadas en el Journal of Machine Learning Research) con un énfasis significativo en el aprendizaje de objetos con estructura compleja:

  • dlib – Aprendizaje automático
  • PyStruct – Aprendizaje estructurado en Python

La tendencia es manipular los datos en una matriz de características antes de entrenar clasificadores, etc. porque es mucho más eficiente computacionalmente representar los datos de entrada en una matriz. Esto permite escribir soluciones vectorizadas que aprovechan el código altamente optimizado en las plataformas más relevantes.

Si se trata de problemas a pequeña escala (por ejemplo, miles de registros de entrada), este no sería un gran problema (aunque la codificación puede ser considerablemente menos concisa). Sin embargo, si se trata de más registros o muchas características, esto podría llevar mucho tiempo entrenar modelos con cualquier solución no vectorizada (incluidas las matrices de características si la solución solo hace un bucle sobre los registros de entrada).

Puede encontrar ejemplos de código vectorizado y no vectorizado aquí: http://www.matlab-cookbook.com/recipes/0005_Programming/0010_Writing_better_code/035_vectorising.html

¿Hay algún ejemplo de tales cosas? No he oído hablar de ellos. Si yo fuera un jugador de apuestas, apostaría al hecho de que las estructuras de datos abstractas están destinadas a ordenar y almacenar información, no a aprender de ella. Cumplen un propósito no relacionado con el aprendizaje.

More Interesting

Cómo aplicar en la práctica PCA a la agrupación de trayectorias

¿Cuáles son los métodos de implementación con calidad de producción para los modelos de aprendizaje automático?

¿Cuáles son las ventajas y desventajas de tener mi propio servidor en la nube?

¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?

¿Qué es el 'aprendizaje automático de crowdsourcing'?

¿Qué papel juega la intuición en las matemáticas y puede la IA reemplazar completamente a un matemático?

¿Cómo podemos estimar múltiples parámetros de un clasificador?

¿Podemos construir una máquina de visualización de sueños usando el procesamiento de señales?

Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?

¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?

¿Es factible hacer una regresión logística en conjuntos de datos con miles de características sin usar una computadora de clúster? ¿Qué tal decenas de miles?

¿DevOps mejora las operaciones de ciencia de datos y aprendizaje automático?

¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

¿Cuál es la mejor tarjeta gráfica para tareas de aprendizaje automático / Big Data?

¿Por qué la pila de RBM después de aprender no es una máquina de Boltzmann profunda (DBM)?